يتطور مجال علم البيانات تقريبًا كل يوم إلى أن أصبح من أهم المجالات في القرن الحالي. ولكن ما أن يبدأ عالم البيانات حياته العملية إلا أنه يجد العديد من الصعوبات. تخيل أنك طالب قد درست علم البيانات وبدأت أن تفتح يديك لسوق العمل. فأولًا تبحث عن أي التقنيات التي يجب ان تتقنها وأى لغات البرمجة التي يجب أن تكون ملمًا بها وأسئلة أخرى متعددة تجول بخاطرك بلا شك. فلنتعمق في تقرير موقع كاجل: نصائح لعلماء البيانات.
مجتمع كاجل لعلم البيانات هو من أشهر المواقع التي تجمع علماء البيانات عالميًا بغرض التعليم وحل المشكلات والمنافسة فيما بينهم. ويعرض الموقع تقريرٍا سنويًا ويحتوي على أراء علماء البيانات بداية من لديه خبرة أقل من عام إلى من لديه خبرة تفوق العقدين من الزمن في هذا المجال.
ونستيطع أن نخرج ببعض الدروس والنصائح المستفادة من هذا التقرير وتوجيهها إلى المبتدئين في مجال علم البيانات. ويفيد أيضًا من لديهم خبرة كبيرة.
محتويات المقال :
مازال هناك فرق كبير بين عدد العاملين من الرجال والسيدات في علم البيانات، حيث ٨٢٪ من العاملين في هذا المجال رجال و ١٦٪ فقط سيدات وأقل من ٢٪ لم يفضلوا ذكر النوع. حتى منذ ٥ سنوات سابقة وحتى الآن لم يكن هناك تغيير في هذه النسبة منذ ٢٠١٧م وحتى عام ٢٠٢١م. لذا فاعتقد ان المجال متاحًا أمام السيدات لأخذ خطوات واسعة قوية في سبيل هذا المجال.
يعتبر مجال علم البيانات في مرحلة مبكرة، حيث تقريبًا نصف العاملين في هذا المجال بين عمر ٢٢ إلى ٣٤ سنة. حيث يبدأ العمل في علم البيانات تقريبًا بعمر ١٦ سنة، ويظل في الزيادة، ويكون في قمة الزيادة من ٢٥ إلى ٢٩ سنة، وتظل النسبة قريبة حتى عمر ٣٤ سنة ولكن تبدأ تقل تدريجيًا بعد عمر ال٣٩.
من أكثر الدول التي تمتلك علماء بيانات هما أمريكا والهند. فمنذ ٥ سنوات وما زال نفس الوضع قائمًا. ومنذ ٢٠١٧م تقل النسبة في أمريكا وتزداد في الهند حيث يمثل مجتمع علماء البيانات على موقع كاجل ٢٤٪ هنود، و١٢٪ من أمريكا وتأتي بعدهم البرازيل، وذلك بسبب توافر فرص التعليم عبر الإنترنت. ويتجه الأمريكيون إلى إكمال التعليم الجامعي في تعلم الآلة والذكاء الاصطناعي.
أكثر من ٦٢٪ من علماء البيانات قد حصلوا على دراسات عليا بين ماجستير ودكتورة. وأقل من ٥٪ لم يحصلوا على درجات علمية بعد دراسة الثانوية العامة. ويحصل أغلب علماء البيانات على ماجستير وبعدها بكالوريوس ويليهما الدكتوراة. وبعدهم بنسبة قليلة لا تُذكر علماء بيانات لم يدرسوا بعد الدراسة الثانوية.
وبمرور الوقت أصبح توظيف علماء البيانات غير مقتصر على الحصول على درجة علمية متقدمة حيث يزيد توظيف خريجي البكالوريوس وغير الحاصلين على الماجستير والدكتوراه مؤخرًا.
لا يتوقف علماء البيانات عن التعلم أبدًا، وأكثر المنصات التي يستخدمها علماء البيانات المتواجدين في مجتمع كاجل هي المنصة الشهيرة كورسيرا ثم يوديمي ثم كاجل، ومن بعدهم إيدكس ولينكدإن ليرنينج. وكاجل هو أكثر المواقع زيارة وازدياد في الاستخدام في التعلم في السنة الماضية، وقل بنسبة قليلة كورسيرا ويوديمي.
نسبة قليلة لا تتعدى ١٪ لم تكن لديها خبرة سابقة في البرمجة. وأغلب الخبرات من ٣ إلى ١٠ سنوات، ولكن ازدادت النسبة في السنة الماضية حيث وصلت إلى ١٤٪ بعدما كانت ٩٪ فقط.
بدأ أغلب علماء البيانات في تعلم الآلة توًا، حيث دخل أكثر من ٥٥٪ من علماء البيانات في مجتمع كاجل تعلم الآلة منذ أقل من ٣ سنوات، وأقل من ٦٪ منذ أكثر من عقد.
وعلماء البيانات داخل أمريكا عمومًا أكثر معرفة بتعلم الآلة عن علماء البيانات خارجها نظرًا لتوافر التعليم الجامعي في هذه التخصصات بطريقة جيدة.
يحصل أغلب علماء البيانات في أمريكا على راتب يتعدى ١٠٠ ألف دولار سنويًا، ولكن ٣٪ فقط من علماء البيانات في الهند يحصلون على هذا الراتب. وأكبر متوسطات للرواتب عالميًا في أمريكا تليها ألمانيا ثم اليابان، ويزداد المتوسط في أمريكا حاليًا في سنة ٢٠٢١م إلى ١٥٠ ألف دولار سنويًا بعدما كان ١٠٠ ألف دولار، وفي ألمانيا وفي اليابان بمتوسط ٦٠ ألف دولار.
الشركات الكبيرة والصغيرة الناشئة هما الأشهر في توظيف علماء البيانات. وعدد أعضاء فريق علم البيانات في الأغلب ٥ أشخاص أو أقل، وفقط خمس الشركات الكبرى لديها عدد أكثر من ٢٠ موظف عالم بيانات.
يسيطر «جوبيتير نوتبوك – jupyter notebook» على ٧٥٪ من عمل علماء البيانات، ويأتي بعده «فيجوال ستوديو كود – visual studio code» في المركز الثاني مباشرة بنسبة ٣٨٪. ومازال جوبيتير على نفس الأهمية تقريبا منذ ٤ سنوات وقد حدث تغيير طفيف للأقل بنسبة لا تُذكر ١٪ فقط.
«Linear regression – الارتباط الخطي»
«Logistic regression – الانحدار اللوجيستي»
«Decision tree – شجرة القرار »
وغيرهم من أنواع الخوارزميات التي يستخدمها علماء البيانات في عملهم.
مازالت تسيطر لغة البرمجة بايثون ومكتباتها على العمل حيث تحتل مكتبة ( scikit-learn ) المركز الأول بجدارة وتسيطر على أكثر من ٨٠٪ من أعمال تعلم الآلة، وتُستخدم أيضًا كلًا من Tensorflow و keras في التعلم العميق.
وما زال يتطور علم البيانات وتتغير الأدوات يومًا بعد يوم في سبيل الوصول إلى أفضل ما يمكن لمساعدة كل الدارسين والباحثين في علم البيانات.
[1] kaggle
[2] IBM
في عالم الكم، لم تعد قواعد الفيزياء الكلاسيكية قابلة للتطبيق. واحدة من أكثر الحالات الرائعة…
أظهرت دراسة جديدة أن المرضى يجدون الذكاء الاصطناعي أكثر تعاطفاً وتفهماً من الأطباء النفسيين وخبراء…
باتت التجارب الرقمية أكثر عمقًا وانغماسًا مع دمج الحواس البشرية في البيئات الافتراضية. ويأتي نظام…
في اكتشاف رائد، كشف باحثون من جامعة أتينيو دي مانيلا عن أدلة على وجود شكل…
درس العلماء الأسماك الغضروفية الحديثة، مثل أسماك القرش وأسماك الزلاجات. وقارنوها بنظيراتها عديمة الفك، مثل…
تحول دماغ شاب إلى زجاج منذ ما يقرب من 2000 عام، وهي ظاهرة يعتقد العلماء…