ما هو علم البيانات Data Science (التخصص الأكثر إثارة)

ما هو علم البيانات

لعلك تقرأ هذا المقال بسبب عنوانه الشيق؛ “علم البيانات التخصص الأكثر إثارة في العالم”، ولكن عزيزي القارئ لم أكتب أنا هذا العنوان الصادم، بل كتبته المجلة العريقة هارفارد بزنس ريفيو.

ما هو علم البيانات؟ لماذا هو التخصص الأكثر إثارة في القرن الواحد والعشرون؟ هذا ما سوف نتناوله في مقال اليوم… اربط الأحزمة واستعد لرحلة ستغير تفكيرك وحياتك بأكملها.

ما هو علم البيانات؟

علم البيانات هو العلم الذي يتعامل مع كافة أشكال البيانات بداية من جمعها وتنسيقها وحتى تحليلها واستعراضها واستخراج المؤشرات الهامة منها، فهو العلم الذي يجمع بين مجالات علوم الحاسوب المختلفة، وعلم الإحصاء، بجانب عدد آخر من العلوم الحديثة الهامة.

لم تفهم شيئًا أليس كذلك؟ دعنا نقول إن علم البيانات مزيج من القدرة على سرد القصص والتنجيم، حيث يقوم عالم البيانات بسرد القصة التي يعرفها من الأرقام التي أمامه، ومن ثم يستخدم كرته البلورية لكي يتنبأ بنهاية قصته والسيناريوهات الأخرى التي كانت ستحدث كذلك.

وعلم البيانات هو الأساس الذي تقوم عليه العديد من التخصصات الشهيرة اليوم، مثل تعلم الآلة Machine learning، و التعلم العميق Deep Learning، بالإضافة إلى البيانات الضخمة Big Data، ولذا يعد من أكثر التخصصات المطلوبة في سوق العمل في القرن الحادي والعشرين.

وبالرغم من أن علم البيانات شيء يحتاجه ويمارسه البشر منذ قديم الزمان، إلا أن المصطلح “Data Science” لم يكتسب كل هذا الزخم إلا في العقود الأخيرة خاصة بعد اقتحام الإنترنت كل مجالات حياتنا، وما نتج عنه من كم ضخم من البيانات يقُدر بأضعاف أضعاف ما أنتجته البشرية طيلة وجودها.

لماذا علم البيانات بهذه الأهمية؟

نشرت مجلة هارفارد بزنس ريفيو في أكتوبر 2012 مقالة بعنوان “عالم البيانات: الوظيفة الأكثر إثارة في القرن الواحد والعشرين” لتسجل بداية الثورة الصناعية الرابعة التي تُعرف عالميًا باسم “ثورة البيانات”.

والتي يقودها المبرمجين وعلماء البيانات ومطوري الذكاء الاصطناعي الذين يقومون بتغيير عالمنا بسرعة جنونية من خلال جعلنا نولد كم هائل من البيانات ليحللوها ويدرسوها جيدًا.

لعلك لا تتخيل كم البيانات التي ننتجها لن أقول لك في اليوم، بل في الدقيقة الواحدة:

  • يتم ارسال 41,666,667 رسالة من خلال تطبيق واتساب.
  • يتم نشر 147,000 صورة على فيسبوك.
  • يتم مشاهدة 404,444 ساعة من الأفلام والمسلسلات على منصة نتفليكس.
  • يتم شحن 6,659 طرد من خلال أمازون.

وغيرها من البيانات التي لا يستطيع العقل البشري حتى أن يتصورها أو يتخيل حجمها.

وتُستخدم هذه البيانات لفهم سلوكنا ودراستنا وتوقع أفعالنا بعد ذلك من قبل شركات التكنولوجيا الكبرى، هذا غير أنها تساعد الشركات أيضًا على اتخاذ القرارات والتنبؤ بالمستقبل وتقليل المخاطر، وفي بعض الأحيان يتم استخدامها كمصدر للأموال من خلال بيعها.

اقرأ أيضًا: ما هي البرمجة؟ شرح مختصر وعملي وسهل الفهم للجميع

ما الذي يدور حوله علم البيانات؟

يختص علم البيانات بعدد من العمليات الضرورية، والتي من الممكن اختصارها بأنها طرح سؤال ومن ثم الإجابة عليه، ولكن بشكل أكثر تعقيدًا حيث قد يكون هدف السؤال هو التنبؤ بظاهرة معينة، أو تصنيف بعض المعطيات، أو تحديد نمط ما في البيانات، أو توليد توصيات قبل القيام بخطوة مهمة، أو حتى لأغراض الحفاظ والتحكم بالجودة.

والأمثلة على هذه كثيرة للغاية مثل: توقع عدد مشترين سيارات هيونداي في شهر أبريل 2021، أو معرفة ما يطلبه المشترين من أمازون من الثلاجات، أو قياس سرعة بعض الخوارزميات الخاصة بتوقع الطقس، وغيرها من التطبيقات الكثيرة التي تشمل كل شيء تقريبًا في حياتنا.

يتم ذلك من خلال عدة مراحل تُعرف برحلة عالم البيانات.

وسأشرح هذه المراحل مع تطبيقها على مثال مبسط للتوضيح:

1. فهم المشكلة وسؤال الأسئلة الصحيحة

في البداية يقوم عالم البيانات بدراسة وفهم المشكلة ليقوم بطرح عدد من الأسئلة المحورية حول هذه المشكلة، والتي تؤثر تأثيرات كبرى عليها وتتحكم في الظاهرة محل الدراسة.

لنفرض أن عالم بيانات مرموق كان يقرأ أحد مقالاتنا، وأثناء مطالعته للمقالات كان لديه فضول كبير لمعرفة جودة مقالات الرابحون، فحدد الأسئلة المحورية التي ستساعده على معرفة جودة المقالات:

  • ما هو متوسط الوقت الذي يقضيه القراء في الموقع.
  • ما هي نسبة زائري الموقع الذين يعودون مرة أخرى لمحرك البحث جوجل لايجاد مصدر آخر للمعلومة.
  • ما هي نسبة الزوار الذين ينتقلون لصفحة أخرى في الموقع (دليل على أن المحتوى أعجبهم ويريدون المزيد منه).
  • ما هو متوسط عدد التعليقات على المحتوى.
  • ما هو متوسط المعدلات السابقة في المواقع الأخرى.

2. جمع البيانات المرتبطة بهذا السؤال

في الخطوة التالية يقوم عالم البيانات بجمع كافة البيانات الممكنة للإجابة على هذا السؤال من المصادر المختلفة، مثل قواعد البيانات، سيرفرات الإنترنت، استبيانات أو استطلاعات رأي يجريها وغيرها من المصادر.

من الممكن أن يقوم بعد ذلك عالم البيانات هذا بعمل استبيان ونشره على الإنترنت يسأل فيه الزوار إن كانوا يعرفون موقع الرابحون، وإذا كانوا يعرفوه أن يقيموا العوامل التالية بالأرقام من 1 إلى 5 حسب رأيهم:

  • جودة مقالات الموقع.
  • تفوق مقالات موقع الرابحون على المواقع الآخرى التي تكتب في نفس المواضيع.
  • سلامة المقالات من الأخطاء الإملائية والنحوية.
  • تأثير مقالات الرابحون فيك.
  • ومن ثم يسألهم عن عمرهم وبلدهم وجنسهم.

3. تجهيز البيانات وتحليلها

لتأتي بعد ذلك أصعب مرحلة في الأمر وهي مرحلة تجهيز وإعداد البيانات، حيث يقوم عالم البيانات بتنظيف البيانات وإزالة أو تصحيح أي بيانات قد تؤثر بالسلب على صحة نتائجه، ومن ثم يجمع البيانات المتبقية وينظمها في شكل عملي يمكن استخدامه في إجابة سؤاله.

كما يقوم عالم البيانات بفهم ما بيده وتحديد المفاتيح الرئيسية للبيانات، والمتغيرات الأهم التي ستكون مفتاح الإجابة على سؤاله، ليختار أفضل نموذج لتحليل البيانات.

ويقوم عالم البيانات بعد ذلك بجمع نتائج الاستبيان الذي قام بملئه 50 ألف شخص، ويقوم باستبعاد الأشخاص الذين لا يعرفون موقع الرابحون، ومن ثم يستبعد أيضًا الإجابات المكررة أو الناقصة، ليتبقى لديه 48 ألف إجابة مثلًا، ويدرك إن أهم متغير عليه التركيز عليه هو رأي الناس في جودة المقالات، ومدى تأثيرها عليهم ليختار بعد ذلك أنسب نموذج لتحليل البيانات.

4. تحليل البيانات واستخدام النتائج للإجابة على سؤاله

وها قد شارف عالم البيانات على الانتهاء من بحثه المضني، وسوف يجد أخيرًا الإجابة على أسئلته، ولكن تبقى عليه أن يحلل البيانات، ويقرأ النتائج لكي يسرد منها قصته، ويجاوب على السؤال الذي طرحه في البداية بنجاح.

بعد تحليل البيانات وجد العالم أن نسبة 99% من هؤلاء القراء قد أعطى لجودة المحتوى 5، وأن 89% منهم قد قيم درجة تأثير المقالات عليهم ب 5 أيضًا، فاستنتج عالم البيانات أن مقالات الرابحون عالية الجودة.

علم البيانات: عصا الإنسان السحرية

فكر فقط في كمية الأسئلة التي سيجيبها لنا علم البيانات، وتخيل ما الذي بإمكاننا فعله بكل تلك الأجوبة؟ حسنًا، لا تتعب نفسك كثيرًا في التفكير، فقط انظر حولك وتأمل كيف تصير الحياة أكثر بساطة ورفاهية بدءًا من اقتراحات نتفليكس الرائعة، وحتى تطور النظام الطبي في العالم، والحد من أخطار انتشار جائحة الكوفيد-19.

فعلم البيانات لا يختص فقط بالأمور الترفيهية والصناعية، بل هو عامل فعال من عوامل التقدم الطبي حول العالم، وهذا من خلال تطبيق سحره على البيانات الحيوية أو الطبية فيما يعرف بالمعلوماتية الحيوية أو الطبية.

فلولا معرفة البشرية بعلم البيانات لم نكن لنصبح قادرين على احتواء فيروس كورونا، ولا قادرين على الحد من أعداد مرضى السرطان في العالم.

ولكن عزيزي القارئ لا تعتقد أن علم البيانات مُستخدم في هذه المجالات فقط، بل هو مستخدم في كافة المجالات تقريبًا، فأي مجال أو صناعة مهما كانت تحتاج أو تستخدم البيانات بداية بالعلوم الإنسانية، وحتى صناعة الصواريخ مرورًا بكل شيء بإمكانك أو بإمكاني أن أتصوره أو أجهل حتى وجوده.

اقرأ أيضاً: أهم تطبيقات علم البيانات (استخدامات مذهلة لا حصر لها)

عالم البيانات الرجل الأوفر حظًا في العالم

بحسب الكثير من الإحصائيات فإن متخصصين علم البيانات هم أكثر الناس المطلوبين في العالم، ليس للعدالة بالطبع، ولكن لسوق العمل، فقد ظل تخصص علم البيانات هو التخصص الأكثر طلبًا على مر الأعوام السابقة حيث إن الطلب أكثر بكثير من العرض.

ولذا فإن رواتب علماء البيانات مرتفعة للغاية، حيث يبلغ متوسط راتب متخصصين علم البيانات في الولايات المتحدة يبلغ 113 ألف دولار سنويًا بحسب موقع Glassdoor الغني عن التعريف.

وإذا تحدثنا بالأرقام فإنه في العام 2020 كان هناك عجز في الولايات الأمريكية المتحدة فقط بحوالي 250,000 متخصص في علم البيانات، بينما يزداد سوق العمل بمعدلات جنونية وصلت إلى 39% في العام 2019، وارتفاع الراتب 14% في 2020 بسبب الحاجة إلى المزيد من متخصصين علم البيانات.

وإذا لم يكفيك هذا فإن المؤشرات تقول بأنه سيكون هناك عجز بالملايين في العقود القليلة القادمة.

قد تستعجب من هذه الأرقام والزيادات الجنونية في الراتب والطلب، بينما يعاني العالم من مشاكل اقتصادية كبيرة، ولك كل الحق في ذلك، ولكن علم البيانات وسائر التخصصات التكنولوجية الحديثة نسبيًا هي التي تقوم بتسيير العالم الآن والتحكم فيه وتغييره، ولذا مهما حدث فسنظل نحتاج إلى مهاراتهم وقدراتهم الخارقة مع التكنولوجيا.

أما في عالمنا العربي فهناك طلب أيضًا على المتخصصين في علوم البيانات، ولكنه ليس شديدًا مثل الولايات المتحدة ودول العالم المتقدم.

ولكن يتوقع الخبراء أنه في الأعوام القادمة سوف يزيد عدد الوظائف المعروضة، ولكن يمكنك في أي وقت أن تعمل من خلال منصات العمل الحر على مشاريع تتعلق بعلم البيانات وتعلم الآلة.

حيث يبلغ متوسط سعر الساعة لمتخصصين علم البيانات على منصة Upwork في العام 2019 حوالي 36 إلى 200 دولار في الساعة الواحدة حسب درجة المهارة والخبرة.

أفضل مصادر دراسة علم البيانات

قبل أن أذكر مصادر دراسة علم البيانات على أن أوضح أنه وعلى الرغم من أن غالبية الوظائف في هذا المجال تتطلب أن يكون لديك على الأقل درجة بكالوريوس في علوم الحاسب أو ما يماثلها، إلا أنه يمكن لأي شخص أن يدرس علم البيانات ويستخدمها في مجاله.

فإذا كنت طبيبًا أو صيدلانيًا يمكنك أن تدرس علم البيانات لتعمل في مجال المعلوماتية الحيوية أو الطبية، والتي تختص بالبيانات البيولوجية أو الطبية.

وإذا كنت تعمل في مجالات المال والأعمال فدراستك لعلم البيانات ستتيح لك أن تعمل في مجالات مثل تحليل المخاطر، تحليلات المستخدم، تحديد التلاعب المالي، وهكذا مهما كان تخصصك حتى وإن كان في العلوم الإنسانية.

أما عن دراسة علم البيانات، فعلى عالم البيانات أن يحترف عددًا من المواضيع على رأسها البرمجة والإحصاء وتعلم الآلة والخوارزميات المختلفة وقواعد البيانات، ولكن لحسن الحظ فإن الإنترنت يكتظ بالعديد من المصادر الرائعة لتعلم هذا المجال المهم كما أن منها من يبدأ من الصفر تمامًا.

اقرأ أيضاً: كيف تصل إلى كورسات مجانية في أي تخصص تريد

والآن إليك قائمة بمجموعة منتقاه من أفضل مصادر تعلم مجال علم البيانات:

1. IBM Data Science Professional Certificate من منصة كورسيرا

وهو تخصص مقدم من شركة IBM، ويمتد لحوالي 12 شهر، ويمكنك إتمامه بمعدل مذاكرة 4 ساعات في الأسبوع، وهو من التخصصات المشهورة على منصة كورسيرا، حيث تقييمه 4.6 من 5 بناءًا على 45 ألف تقييم، كما يتميز بأنها يحتوي على مشروع تخرج في نهايته.

2. درجة الماجستير المصغرة في علوم البيانات من جامعة كاليفورنيا سان دييغو من منصة edx

وهي مجموعة من الكورسات المميزة على يد أساتذة أقوياء في مادتهم العلمية، وتستغرق الدراسة حوالي 10 شهور بمعدل مذاكرة من 9 إلى 11 ساعة في الأسبوع، ولكن عيب هذه الدرجة أن تكلفتها غالية إذ تبلغ حوالي 1400 دولار.

3. تخصص علوم البيانات من جامعة جون هوبكنز على منصة كورسيرا

وهو أيضًا واحد من أشهر التخصصات وينصح به الكثيرين، وهو يتكون من تسع كورسات بالإضافة إلى مشروع تخرج، ويحتاج حوالي 11 شهر لإتمامه بمعدل مذاكرة أسبوعي 7 ساعات.

4. درجة الماجستير المصغرة في الإحصاء وعلوم البيانات من MIT على منصة edx

وهي مجموعة قوية جدًا من الكورسات كعادة كل كورسات MIT، ويقدمه مجموعة متنوعة من الخبراء، ويستلزم لإكماله حوالي 14 شهر بمعدل مذاكرة أسبوعي من 10 إلى 14 ساعة، ولكنه أيضًا كعادة الدرجات المصغرة من edx عالي التكلفة إذا تبلغ تكلفته حوالي1500 دولار.

5. كورس Machine Learning A-Z™: Hands-On Python & R In Data Science على منصة Udemy

وهو من أشهر الكورسات على المنصة في مجال علوم البيانات إذ بلغ عدد الملتحقين به حوالي 750 ألف مشترك وتقييمه 4.5 بناءًا على ما يقارب ال 140 ألف تقييم، وعدد محاضرته 322 في حوالي 44 ساعة.

الكورس رائع للغاية وأنصح المبتدئين بالالتحاق به في البداية، كما أنه رخيص نسبيًا إذ أنه عادة ما يكون هناك خصم كبير عليه ليصل ثمنه إلى 12 دولار فقط.

6. موقع Datacamp

وهو موقع مميز للغاية، ويفضل كثير من الناس دراسة علم البيانات من عليه، كما أن الدراسة من عليه تكلف حوالي 12.5 شهريًا فقط مقابل كورسات في جميع فروع علم البيانات.

7. موقع 365Datascience

وهو موقع من أشهر مواقع تعلم البرمجة على الإطلاق، ويحظى بشعبية هائلة للغاية بين جموع دارسي علم البيانات، ويحتوي على خطة مجانية محدودة أو خطة شهرية ب 36 دولار أو خطة سنوية ب 348 دولار.

8. كورس Machine Learning Nanodegree على منصة Udemy

وهو كورس آخر مميز من منصة Udemy من إعداد محاضر مشهور للغاية، وهو د. تامر عيد وهو مناسب للغاية لمن لغته الإنجليزية ليست قوية كفاية للتعلم من المصادر الإنجليزية، كما أنه سعره مناسب للغاية إذا أن كثيرًا ما يكون ثمنه الإجمالي بعد الخصم 12 دولار، وتتعدى محاضراته ال 31 ساعة بواقع 191 محاضرة.

اقرأ أيضًا:

كلمات أخيرة عن علم البيانات

أود أن أنهي المقالة بأرقام فعلية لتؤكد لك مدى أهمية علم البيانات، فكل البيانات التي أنتجها البشر خلال وجودهم منذ بدء الخليقة وحتى العام 2005 كانت تُقدر ب 130 أكسابايت (الأكسابيت الواحد يساوي 1,073,741,824 جيجابايت).

ولكن بسبب ثورة الإنترنت فقد زاد مقدر البيانات في خلال 10 أعوام فقط إلى 7900 أكسابايت أي حوالي 61 ضعف، وهو رقم كبير للغاية لا يمكن حتى تخيله.

وأزيدك من الشعر بيتًا أن مقدار البيانات وصل في العام 2019 إلى حوالي 30,000 أكسابايت، ويستمر هذا الرقم بالتضاعف في كل لحظة، ولذا يحتاج العالم إلى المزيد والمزيد من علماء البيانات لكي يتعاملوا مع كل هذه الكميات المهولة من البيانات ويطوعوها لخدمة الإنسان.

كما أود قبل أن أنهي حديثًا إن أنصحك إذا وجدت نفسك شغوفًا بهذا المجال أن تبدأ فورًا في تعلمه، حتى لو استغرقت سنة أو سنتين، ففي كل الأحوال إذا بدأت ستصل ولو متأخرًا، أما إذا لم تبدأ فلن تصل أبدًا، ومن يدري لعلك تكون عبقري البيانات العربي القادم.

موضوعات أخرى ستعجبك

عن الكاتب

8 أفكار عن “ما هو علم البيانات Data Science (التخصص الأكثر إثارة)”

  1. انا لا افقه شيئاً عن تخصصات الكمبيوتر ولكن استمتع في الشغل الذي يكون عليه هل بي امكاني دخول هذا التخصص وبماذا ابدا ؟

    1. يمكنك دائماً تعلم أي شيء.
      ابدأ بهذا المقال وابحث في جوجل عن المزيد من الموضوعات ويمكنك الاستفادة أيضاً من اليوتيوب.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Scroll to Top