يتطور مجال علم البيانات تقريبًا كل يوم إلى أن أصبح من أهم المجالات في القرن الحالي. ولكن ما أن يبدأ عالم البيانات حياته العملية إلا أنه يجد العديد من الصعوبات. تخيل أنك طالب قد درست علم البيانات وبدأت أن تفتح يديك لسوق العمل. فأولًا تبحث عن أي التقنيات التي يجب ان تتقنها وأى لغات البرمجة التي يجب أن تكون ملمًا بها وأسئلة أخرى متعددة تجول بخاطرك بلا شك. فلنتعمق في تقرير موقع كاجل: نصائح لعلماء البيانات.
مجتمع كاجل لعلم البيانات هو من أشهر المواقع التي تجمع علماء البيانات عالميًا بغرض التعليم وحل المشكلات والمنافسة فيما بينهم. ويعرض الموقع تقريرٍا سنويًا ويحتوي على أراء علماء البيانات بداية من لديه خبرة أقل من عام إلى من لديه خبرة تفوق العقدين من الزمن في هذا المجال.
ونستيطع أن نخرج ببعض الدروس والنصائح المستفادة من هذا التقرير وتوجيهها إلى المبتدئين في مجال علم البيانات. ويفيد أيضًا من لديهم خبرة كبيرة.
محتويات المقال :
مازال هناك فرق كبير بين عدد العاملين من الرجال والسيدات في علم البيانات، حيث ٨٢٪ من العاملين في هذا المجال رجال و ١٦٪ فقط سيدات وأقل من ٢٪ لم يفضلوا ذكر النوع. حتى منذ ٥ سنوات سابقة وحتى الآن لم يكن هناك تغيير في هذه النسبة منذ ٢٠١٧م وحتى عام ٢٠٢١م. لذا فاعتقد ان المجال متاحًا أمام السيدات لأخذ خطوات واسعة قوية في سبيل هذا المجال.
يعتبر مجال علم البيانات في مرحلة مبكرة، حيث تقريبًا نصف العاملين في هذا المجال بين عمر ٢٢ إلى ٣٤ سنة. حيث يبدأ العمل في علم البيانات تقريبًا بعمر ١٦ سنة، ويظل في الزيادة، ويكون في قمة الزيادة من ٢٥ إلى ٢٩ سنة، وتظل النسبة قريبة حتى عمر ٣٤ سنة ولكن تبدأ تقل تدريجيًا بعد عمر ال٣٩.
من أكثر الدول التي تمتلك علماء بيانات هما أمريكا والهند. فمنذ ٥ سنوات وما زال نفس الوضع قائمًا. ومنذ ٢٠١٧م تقل النسبة في أمريكا وتزداد في الهند حيث يمثل مجتمع علماء البيانات على موقع كاجل ٢٤٪ هنود، و١٢٪ من أمريكا وتأتي بعدهم البرازيل، وذلك بسبب توافر فرص التعليم عبر الإنترنت. ويتجه الأمريكيون إلى إكمال التعليم الجامعي في تعلم الآلة والذكاء الاصطناعي.
أكثر من ٦٢٪ من علماء البيانات قد حصلوا على دراسات عليا بين ماجستير ودكتورة. وأقل من ٥٪ لم يحصلوا على درجات علمية بعد دراسة الثانوية العامة. ويحصل أغلب علماء البيانات على ماجستير وبعدها بكالوريوس ويليهما الدكتوراة. وبعدهم بنسبة قليلة لا تُذكر علماء بيانات لم يدرسوا بعد الدراسة الثانوية.
وبمرور الوقت أصبح توظيف علماء البيانات غير مقتصر على الحصول على درجة علمية متقدمة حيث يزيد توظيف خريجي البكالوريوس وغير الحاصلين على الماجستير والدكتوراه مؤخرًا.
لا يتوقف علماء البيانات عن التعلم أبدًا، وأكثر المنصات التي يستخدمها علماء البيانات المتواجدين في مجتمع كاجل هي المنصة الشهيرة كورسيرا ثم يوديمي ثم كاجل، ومن بعدهم إيدكس ولينكدإن ليرنينج. وكاجل هو أكثر المواقع زيارة وازدياد في الاستخدام في التعلم في السنة الماضية، وقل بنسبة قليلة كورسيرا ويوديمي.
نسبة قليلة لا تتعدى ١٪ لم تكن لديها خبرة سابقة في البرمجة. وأغلب الخبرات من ٣ إلى ١٠ سنوات، ولكن ازدادت النسبة في السنة الماضية حيث وصلت إلى ١٤٪ بعدما كانت ٩٪ فقط.
بدأ أغلب علماء البيانات في تعلم الآلة توًا، حيث دخل أكثر من ٥٥٪ من علماء البيانات في مجتمع كاجل تعلم الآلة منذ أقل من ٣ سنوات، وأقل من ٦٪ منذ أكثر من عقد.
وعلماء البيانات داخل أمريكا عمومًا أكثر معرفة بتعلم الآلة عن علماء البيانات خارجها نظرًا لتوافر التعليم الجامعي في هذه التخصصات بطريقة جيدة.
يحصل أغلب علماء البيانات في أمريكا على راتب يتعدى ١٠٠ ألف دولار سنويًا، ولكن ٣٪ فقط من علماء البيانات في الهند يحصلون على هذا الراتب. وأكبر متوسطات للرواتب عالميًا في أمريكا تليها ألمانيا ثم اليابان، ويزداد المتوسط في أمريكا حاليًا في سنة ٢٠٢١م إلى ١٥٠ ألف دولار سنويًا بعدما كان ١٠٠ ألف دولار، وفي ألمانيا وفي اليابان بمتوسط ٦٠ ألف دولار.
الشركات الكبيرة والصغيرة الناشئة هما الأشهر في توظيف علماء البيانات. وعدد أعضاء فريق علم البيانات في الأغلب ٥ أشخاص أو أقل، وفقط خمس الشركات الكبرى لديها عدد أكثر من ٢٠ موظف عالم بيانات.
يسيطر «جوبيتير نوتبوك – jupyter notebook» على ٧٥٪ من عمل علماء البيانات، ويأتي بعده «فيجوال ستوديو كود – visual studio code» في المركز الثاني مباشرة بنسبة ٣٨٪. ومازال جوبيتير على نفس الأهمية تقريبا منذ ٤ سنوات وقد حدث تغيير طفيف للأقل بنسبة لا تُذكر ١٪ فقط.
«Linear regression – الارتباط الخطي»
«Logistic regression – الانحدار اللوجيستي»
«Decision tree – شجرة القرار »
وغيرهم من أنواع الخوارزميات التي يستخدمها علماء البيانات في عملهم.
مازالت تسيطر لغة البرمجة بايثون ومكتباتها على العمل حيث تحتل مكتبة ( scikit-learn ) المركز الأول بجدارة وتسيطر على أكثر من ٨٠٪ من أعمال تعلم الآلة، وتُستخدم أيضًا كلًا من Tensorflow و keras في التعلم العميق.
وما زال يتطور علم البيانات وتتغير الأدوات يومًا بعد يوم في سبيل الوصول إلى أفضل ما يمكن لمساعدة كل الدارسين والباحثين في علم البيانات.
[1] kaggle
[2] IBM
عندما يتعلق الأمر بحماية بشرتنا من التأثيرات القاسية لأشعة الشمس، فإن استخدام واقي الشمس أمر…
اكتشف فريق من علماء الآثار 13 مومياء قديمة. وتتميز هذه المومياوات بألسنة وأظافر ذهبية،وتم العثور…
ركز العلماء على الخرسانة الرومانية القديمة كمصدر غير متوقع للإلهام في سعيهم لإنشاء منازل صالحة…
من المعروف أن الجاذبية الصغرى تغير العضلات والعظام وجهاز المناعة والإدراك، ولكن لا يُعرف سوى…
الويب 3.0، الذي يشار إليه غالبًا باسم "الويب اللامركزي"، هو الإصدار التالي للإنترنت. وهو يقوم…
لطالما فتنت المستعرات العظمى علماء الفلك بانفجاراتها القوية التي تضيء الكون. ولكن ما الذي يسبب…