ما هو علم البيانات Data Science وأفضل مصادر تعلمه

ما هو علم البيانات

علم البيانات Data Science هو التخصص الأكثر إثارة في العالم وواحد من أهم التخصصات التقنية في العالم، وهذا ليس رأيي أنا بل ما تقوله هارفارد بزنس ريفيو.

وأنت بالتأكيد هنا تقرأ هذا المقال لأن لديك فضول بخصوص هذا المقال، إذًا ما هو هذا الداتا ساينس؟ لماذا هو التخصص الأكثر إثارة في القرن الواحد والعشرون؟

سوف نجيبك في هذا المقال عن كل هذه الأسئلة وأكثر. ابدأ الآن في قراءة هذا المقال وأعدك بأن تفكيرك وربما مستقبلك سيتغير.

ما هو علم البيانات؟

علم البيانات Data Science

علم البيانات هو العلم الذي يتعامل مع كافة أشكال البيانات بداية من جمعها وتنسيقها وحتى تحليلها واستعراضها واستخراج المؤشرات الهامة منها.

فهو العلم الذي يجمع بين مجالات علوم الحاسوب المختلفة والرياضيات وعلم الإحصاء، بجانب عدد آخر من العلوم المختلفة.

تريد توضيح وتبسيط أكثر؟

دعنا نقول إن الداتا ساينس مزيج من القدرة على سرد القصص والتنجيم، حيث يقوم المتخصص في هذا التخصص بسرد القصة التي يعرفها من الأرقام التي أمامه، ومن ثم يستخدم كرته البلورية لكي يتنبأ بنهاية قصته والسيناريوهات الأخرى التي كانت ستحدث كذلك.

وهذا العلم هو مكون أساسي تقوم عليه العديد من التخصصات التقنية الشهيرة اليوم، مثل تعلم الآلة Machine learning، والتعلم العميق Deep Learning.

ولا ننسى بالتأكيد البيانات الضخمة Big Data، ولذا يعد من أكثر التخصصات المطلوبة في سوق العمل في القرن الحادي والعشرين.

وبالرغم من أن الداتا ساينس شيء يحتاجه ويمارسه البشر منذ قديم الزمان، إلا أن المصطلح “Data Science” لم يكتسب كل هذا الزخم إلا في العقود الأخيرة.

خاصة بعد اقتحام الإنترنت كل مجالات حياتنا، وما نتج عنه من كم ضخم من البيانات يقُدر بأضعاف أضعاف ما أنتجته البشرية طيلة وجودها.

لماذا علم البيانات بهذه الأهمية؟

نشرت مجلة هارفارد بزنس ريفيو في أكتوبر 2012 مقالة بعنوان “عالم البيانات: الوظيفة الأكثر إثارة في القرن الواحد والعشرين” لتسجل بداية الثورة الصناعية الرابعة التي تُعرف عالميًا باسم “ثورة البيانات”.

والتي يقودها المبرمجين وعلماء البيانات ومطوري الذكاء الاصطناعي الذين يقومون بتغيير عالمنا بسرعة جنونية من خلال جعلنا نولد كم هائل من البيانات ليحللوها ويدرسوها جيدًا.

لعلك لا تتخيل كم البيانات التي ننتجها لن أقول لك في اليوم، بل في الدقيقة الواحدة:

  • يتم نشر 277,777 استوري على منصة انستجرام.
  • يتم مشاهدة 4,500,000 فيديو على اليوتيوب.
  • يتم مشاهدة 694,444 ساعة من الأفلام والمسلسلات على منصة نتفليكس.
  • يتم ارسال 188,000,000 بريد إلكتروني.

وغيرها من البيانات التي لا يستطيع العقل البشري حتى أن يتصورها أو يتخيل حجمها.

وتُستخدم هذه البيانات لفهم سلوكنا ودراستنا وتوقع أفعالنا بعد ذلك من قبل شركات التكنولوجيا الكبرى.

هذا غير أنها تساعد الشركات أيضًا على اتخاذ القرارات والتنبؤ بالمستقبل وتقليل المخاطر، وفي بعض الأحيان يتم استخدامها كمصدر للأموال من خلال بيعها.

علم البيانات: عصا الإنسان السحرية

فكر فقط في كمية الأسئلة التي سيجيبها لنا علم البيانات، وتخيل ما الذي بإمكاننا فعله بكل تلك الأجوبة؟ حسنًا، لا تتعب نفسك كثيرًا في التفكير.

فقط انظر حولك وتأمل كيف تصير الحياة أكثر بساطة ورفاهية بدءًا من اقتراحات نتفليكس الرائعة، وحتى تطور النظام الطبي في العالم، والحد من أخطار انتشار جائحة الكوفيد-19.

فالداتا ساينس لا يختص فقط بالأمور الترفيهية والصناعية، بل هو عامل فعال من عوامل التقدم الطبي حول العالم، وهذا من خلال تطبيق سحره على البيانات الحيوية أو الطبية فيما يعرف بالمعلوماتية الحيوية أو الطبية.

فلولا معرفة البشرية بعلم البيانات لم نكن لنصبح قادرين على احتواء الكثير من المخاطر البيئية، ولا قادرين على الحد من أعداد مرضى السرطان في العالم.

ولكن عزيزي القارئ لا تعتقد أن علم البيانات مُستخدم في هذه المجالات فقط، بل أن علم البيانات له الكثير من التطبيقات في مجالات كثيرة جداً.

فأي مجال أو صناعة مهما كانت تحتاج أو تستخدم البيانات بداية بالعلوم الإنسانية، وحتى صناعة الصواريخ مرورًا بكل شيء بإمكانك أو بإمكاني أن أتصوره أو أجهل حتى وجوده.

ما الذي يدور حوله علم البيانات؟

علم البيانات Data Science

يختص Data Science بعدد من العمليات الضرورية، والتي من الممكن اختصارها بأنها طرح سؤال ومن ثم الإجابة عليه.

ولكن بشكل أكثر تعقيدًا حيث قد يكون هدف السؤال هو التنبؤ بظاهرة معينة، أو تصنيف بعض المعطيات، أو تحديد نمط ما في البيانات، أو توليد توصيات قبل القيام بخطوة مهمة، أو حتى لأغراض الحفاظ والتحكم بالجودة.

والأمثلة على هذه كثيرة للغاية مثل: توقع عدد مشترين سيارات هيونداي في شهر أبريل 2021، أو معرفة ما يطلبه المشترين من أمازون من الثلاجات، وغيرها من التطبيقات الكثيرة التي تشمل كل شيء تقريبًا في حياتنا.

يتم ذلك من خلال عدة مراحل تُعرف برحلة عالم البيانات، وسأشرح هذه المراحل مع تطبيقها على مثال مبسط للتوضيح:

1. فهم المشكلة وسؤال الأسئلة الصحيحة

في البداية يقوم عالم البيانات بدراسة وفهم المشكلة ليقوم بطرح عدد من الأسئلة المحورية حول هذه المشكلة، والتي تؤثر تأثيرات كبرى عليها وتتحكم في الظاهرة محل الدراسة.

لنفرض أن عالم بيانات مرموق كان يقرأ أحد مقالاتنا، وأثناء مطالعته للمقالات كان لديه فضول كبير لمعرفة جودة مقالات الرابحون، فحدد الأسئلة المحورية التي ستساعده على معرفة جودة المقالات:

  • ما متوسط الوقت الذي يقضيه القراء في الموقع؟
  • ما نسبة زائري الموقع الذين يعودون مرة أخرى لمحرك البحث جوجل لايجاد مصدر آخر للمعلومة؟
  • ما نسبة الزوار الذين ينتقلون لصفحة أخرى في الموقع (دليل على أن المحتوى أعجبهم ويريدون المزيد منه)؟
  • ما متوسط عدد التعليقات على المحتوى؟
  • ما متوسط المعدلات السابقة في المواقع الأخرى؟

2. جمع البيانات المرتبطة بهذا السؤال

في الخطوة التالية يقوم عالم البيانات بجمع كافة البيانات الممكنة للإجابة على هذا السؤال من المصادر المختلفة، مثل قواعد البيانات، سيرفرات الإنترنت، استبيانات أو استطلاعات رأي يجريها وغيرها من المصادر.

من الممكن أن يقوم بعد ذلك عالم البيانات هذا بعمل استبيان ونشره على الإنترنت يسأل فيه الزوار إن كانوا يعرفون موقع الرابحون، وإذا كانوا يعرفوه أن يقيموا العوامل التالية بالأرقام من 1 إلى 5 حسب رأيهم:

  • جودة مقالات الموقع.
  • تفوق مقالات موقع الرابحون على المواقع الآخرى التي تكتب في نفس المواضيع.
  • سلامة المقالات من الأخطاء الإملائية والنحوية.
  • تأثير مقالات الرابحون فيك.
  • ومن ثم يسألهم عن عمرهم وبلدهم وجنسهم.

3. تجهيز البيانات وتحليلها

لتأتي بعد ذلك أصعب مرحلة في الأمر وهي مرحلة تجهيز وإعداد البيانات، حيث يقوم عالم البيانات بتنظيف البيانات وإزالة أو تصحيح أي بيانات قد تؤثر بالسلب على صحة نتائجه، ومن ثم يجمع البيانات المتبقية وينظمها في شكل عملي يمكن استخدامه في إجابة سؤاله.

كما يقوم عالم البيانات بفهم ما بيده وتحديد المفاتيح الرئيسية للبيانات، والمتغيرات الأهم التي ستكون مفتاح الإجابة على سؤاله، ليختار أفضل نموذج لتحليل البيانات.

ويقوم عالم البيانات بعد ذلك بجمع نتائج الاستبيان الذي قام بملئه 50 ألف شخص، ويقوم باستبعاد الأشخاص الذين لا يعرفون موقع الرابحون، ومن ثم يستبعد أيضًا الإجابات المكررة أو الناقصة.

ليتبقى لديه 48 ألف إجابة مثلًا، ويدرك إن أهم متغير عليه التركيز عليه هو رأي الناس في جودة المقالات، ومدى تأثيرها عليهم ليختار بعد ذلك أنسب نموذج لتحليل البيانات.

4. تحليل البيانات واستخدام النتائج للإجابة على سؤاله

وها قد شارف عالم البيانات على الانتهاء من بحثه المضني، وسوف يجد أخيرًا الإجابة على أسئلته، ولكن تبقى عليه أن يحلل البيانات، ويقرأ النتائج لكي يسرد منها قصته، ويجاوب على السؤال الذي طرحه في البداية بنجاح.

بعد تحليل البيانات وجد العالم أن نسبة 99% من هؤلاء القراء قد أعطى لجودة المحتوى 5، وأن 89% منهم قد قيم درجة تأثير المقالات عليهم ب 5 أيضًا، فاستنتج عالم البيانات أن مقالات الرابحون عالية الجودة.

عالم البيانات الرجل الأوفر حظًا في العالم

بحسب الكثير من الإحصائيات فإن متخصصين علم البيانات هم أكثر الناس المطلوبين في العالم، ليس للعدالة بالطبع، ولكن لسوق العمل، فقد ظل تخصص علم البيانات هو التخصص الأكثر طلبًا على مر الأعوام السابقة حيث إن الطلب أكثر بكثير من العرض.

ولذا فإن رواتب علماء البيانات مرتفعة للغاية، حيث يبلغ متوسط راتب متخصصين الداتا ساينس في الولايات المتحدة يبلغ 113 ألف دولار سنويًا بحسب موقع Glassdoor الغني عن التعريف.

وإذا تحدثنا بالأرقام فإنه في العام 2020 كان هناك عجز في الولايات الأمريكية المتحدة فقط بحوالي 250,000 متخصص في علم البيانات.

بينما يزداد سوق العمل بمعدلات جنونية وصلت إلى 39% في العام 2019، وارتفاع الراتب 14% في 2020 بسبب الحاجة إلى المزيد من متخصصين علم البيانات.

وإذا لم يكفيك هذا فإن المؤشرات تقول بأنه سيكون هناك عجز بالملايين في العقود القليلة القادمة.

قد تستعجب من هذه الأرقام والزيادات الجنونية في الراتب والطلب، بينما يعاني العالم من مشاكل اقتصادية كبيرة.

ولك كل الحق في ذلك، ولكن الـ Data Science وسائر التخصصات التكنولوجية الحديثة نسبيًا هي التي تقوم بتسيير العالم الآن والتحكم فيه وتغييره.

أما في عالمنا العربي فهناك طلب أيضًا على المتخصصين في علوم البيانات، ولكنه ليس شديدًا مثل الولايات المتحدة ودول العالم المتقدم.

ولكن يتوقع الخبراء أنه في الأعوام القادمة سوف يزيد عدد الوظائف المعروضة، ولكن يمكنك في أي وقت أن تعمل من خلال منصات العمل الحر على مشاريع تتعلق بعلم البيانات وتعلم الآلة.

حيث يبلغ متوسط سعر الساعة لمتخصصين علم البيانات على منصة Upwork في العام 2019 حوالي 36 إلى 200 دولار في الساعة الواحدة حسب درجة المهارة والخبرة.

أفضل مصادر دراسة علم البيانات

علم البيانات Data Science

الداتا ساينس من المجالات المفتوحة حيث يمكن لأي أحد -تقريبًا- يملك المهارات المطلوبة وقام بعمل مشاريع قوية أن يعمل فيه.

حيث ليس بالضرورة هناك حاجة إلى درجة بكالوريوس في علوم الحاسب أو ما يماثلها برغم من أن الدرجة ستسهل عليك الحصول على الوظيفة.

وليس بالضرورة أن تعمل بشكل كامل في علوم البيانات، حيث يمكن دمج هذه المعرفة والخبرات بالمجال الخاص بك أيًا كان.

فإذا كنت طبيبًا أو صيدلانيًا يمكنك أن تدرس Data Science لتعمل في مجال المعلوماتية الحيوية أو الطبية، والتي تختص بالبيانات البيولوجية أو الطبية.

وإذا كنت تعمل في مجالات المال والأعمال فدراستك لعلم البيانات ستتيح لك أن تعمل في مجالات مثل تحليل المخاطر، تحليلات المستخدم، تحديد التلاعب المالي.

أما عن دراسة الداتا ساينس، فعلى عالم البيانات أن يحترف عددًا من المواضيع على رأسها البرمجة والإحصاء وتعلم الآلة والخوارزميات المختلفة وقواعد البيانات.

ولكن لا تقلق من صعوبة هذه العلوم، فلحسن الحظ فإن الإنترنت يكتظ بالعديد من المصادر الرائعة لتعلم هذا المجال المهم كما أن منها من يبدأ من الصفر تمامًا.

والآن إليك قائمة بمجموعة منتقاه من أفضل مصادر تعلم مجال علم البيانات:

1. IBM Data Science Professional Certificate من منصة كورسيرا

وهو تخصص مقدم من شركة IBM، ويمتد لحوالي 12 شهر، ويمكنك إتمامه بمعدل مذاكرة 4 ساعات في الأسبوع، وهو من أشهر التخصصات على المنصة، كما يتميز باحتواءه على مشروع تخرج في نهايته.

2. تخصص علوم البيانات من جامعة جون هوبكنز على منصة كورسيرا

وهو أيضًا واحد من أشهر التخصصات وينصح به الكثيرين، وهو يتكون من تسع كورسات بالإضافة إلى مشروع تخرج، ويحتاج حوالي 11 شهر لإتمامه بمعدل مذاكرة أسبوعي 7 ساعات.

3. درجة الماجستير المصغرة في الإحصاء وعلوم البيانات من MIT على منصة edx

مجموعة قوية جدًا من الكورسات كعادة كل كورسات MIT، ويقدمه مجموعة متنوعة من الخبراء، ويستلزم لإكماله حوالي 14 شهر بمعدل مذاكرة أسبوعي من 10 إلى 14 ساعة.

4. كورس Machine Learning A-Z™: Hands-On Python & R In Data Science على منصة Udemy

وهو من أشهر الكورسات على المنصة في مجال Data Science إذ بلغ عدد الملتحقين به حوالي 750 ألف مشترك وتقييمه 4.5 بناءًا على ما يقارب ال 140 ألف تقييم، وعدد محاضرته 322 في حوالي 44 ساعة.

الكورس رائع للغاية وأنصح المبتدئين بالالتحاق به في البداية، كما أنه رخيص نسبيًا إذ أنه عادة ما يكون هناك خصم كبير عليه ليصل ثمنه إلى 12 دولار فقط.

5. موقع Datacamp

وهو موقع مميز للغاية، ويفضل كثير من الناس دراسة الداتا ساينس من عليه، كما أن الدراسة من عليه تكلف بضع دولارات شهريًا فقط مقابل كورسات في جميع فروع علم البيانات.

الجميل في هذا الموقع أنه يوفر لك خطط دراسة كاملة من الصفر وحتى الإتقان لتخصصات علوم البيانات.

6. موقع 365Datascience

موقع من أشهر مواقع تعلم البرمجة على الإطلاق، ويحظى بشعبية هائلة للغاية بين جموع دارسي علم البيانات، ويشبه بدرجة كبيرة DataCamp.

7. كورس Machine Learning Nanodegree على منصة Udemy

وهو كورس آخر مميز من منصة Udemy من إعداد محاضر مشهور للغاية، وهو د. تامر عيد وهو مناسب للغاية لمن لغته الإنجليزية ليست قوية كفاية للتعلم من المصادر الإنجليزية، ويتميز بسعره الاقتصادي.

الخلاصة

أود أن أنهي المقالة بأرقام فعلية لتؤكد لك مدى أهمية Data Science، فكل البيانات التي أنتجها البشر خلال وجودهم منذ بدء الخليقة وحتى العام 2005 كانت تُقدر ب 130 أكسابايت (الأكسابيت الواحد يساوي 1,073,741,824 جيجابايت).

ولكن بسبب ثورة الإنترنت فقد زاد مقدر البيانات في خلال 10 أعوام فقط إلى 7900 أكسابايت أي حوالي 61 ضعف، وهو رقم كبير للغاية لا يمكن حتى تخيله.

وأزيدك من الشعر بيتًا أن مقدار البيانات وصل في العام 2019 إلى حوالي 30,000 أكسابايت، ويستمر هذا الرقم بالتضاعف في كل لحظة، ولذا يحتاج العالم إلى المزيد والمزيد من علماء البيانات لكي يتعاملوا مع كل هذه الكميات المهولة من البيانات ويطوعوها لخدمة الإنسان.

كما أود قبل أن أنهي حديثًا إن أنصحك إذا وجدت نفسك شغوفًا بهذا المجال أن تبدأ فورًا في تعلمه، حتى لو استغرقت سنة أو سنتين، ففي كل الأحوال إذا بدأت ستصل ولو متأخرًا، أما إذا لم تبدأ فلن تصل أبدًا، ومن يدري لعلك تكون عبقري البيانات العربي القادم.

في النهاية نتمنى أن تكون قد استفدت واستمتعت وإذا كان لديك أي سؤال قم بطرحه علينا في التعليقات بالأسفل وسوف نجيبك عليه.

8 أفكار عن “ما هو علم البيانات Data Science وأفضل مصادر تعلمه”

  1. انا لا افقه شيئاً عن تخصصات الكمبيوتر ولكن استمتع في الشغل الذي يكون عليه هل بي امكاني دخول هذا التخصص وبماذا ابدا ؟

    1. يمكنك دائماً تعلم أي شيء.
      ابدأ بهذا المقال وابحث في جوجل عن المزيد من الموضوعات ويمكنك الاستفادة أيضاً من اليوتيوب.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Scroll to Top