يتطور مجال علم البيانات تقريبًا كل يوم إلى أن أصبح من أهم المجالات في القرن الحالي. ولكن ما أن يبدأ عالم البيانات حياته العملية إلا أنه يجد العديد من الصعوبات. تخيل أنك طالب قد درست علم البيانات وبدأت أن تفتح يديك لسوق العمل. فأولًا تبحث عن أي التقنيات التي يجب ان تتقنها وأى لغات البرمجة التي يجب أن تكون ملمًا بها وأسئلة أخرى متعددة تجول بخاطرك بلا شك. فلنتعمق في تقرير موقع كاجل: نصائح لعلماء البيانات.
مجتمع كاجل لعلم البيانات هو من أشهر المواقع التي تجمع علماء البيانات عالميًا بغرض التعليم وحل المشكلات والمنافسة فيما بينهم. ويعرض الموقع تقريرٍا سنويًا ويحتوي على أراء علماء البيانات بداية من لديه خبرة أقل من عام إلى من لديه خبرة تفوق العقدين من الزمن في هذا المجال.
ونستيطع أن نخرج ببعض الدروس والنصائح المستفادة من هذا التقرير وتوجيهها إلى المبتدئين في مجال علم البيانات. ويفيد أيضًا من لديهم خبرة كبيرة.
محتويات المقال :
ستقدم الإناث المزيد مستقبلًا في هذا المجال
مازال هناك فرق كبير بين عدد العاملين من الرجال والسيدات في علم البيانات، حيث ٨٢٪ من العاملين في هذا المجال رجال و ١٦٪ فقط سيدات وأقل من ٢٪ لم يفضلوا ذكر النوع. حتى منذ ٥ سنوات سابقة وحتى الآن لم يكن هناك تغيير في هذه النسبة منذ ٢٠١٧م وحتى عام ٢٠٢١م. لذا فاعتقد ان المجال متاحًا أمام السيدات لأخذ خطوات واسعة قوية في سبيل هذا المجال.
هل يوجد أزمة منتصف العمر لدى علماء البيانات؟
يعتبر مجال علم البيانات في مرحلة مبكرة، حيث تقريبًا نصف العاملين في هذا المجال بين عمر ٢٢ إلى ٣٤ سنة. حيث يبدأ العمل في علم البيانات تقريبًا بعمر ١٦ سنة، ويظل في الزيادة، ويكون في قمة الزيادة من ٢٥ إلى ٢٩ سنة، وتظل النسبة قريبة حتى عمر ٣٤ سنة ولكن تبدأ تقل تدريجيًا بعد عمر ال٣٩.
لماذا تزداد نسبة علماء البيانات في الهند؟
من أكثر الدول التي تمتلك علماء بيانات هما أمريكا والهند. فمنذ ٥ سنوات وما زال نفس الوضع قائمًا. ومنذ ٢٠١٧م تقل النسبة في أمريكا وتزداد في الهند حيث يمثل مجتمع علماء البيانات على موقع كاجل ٢٤٪ هنود، و١٢٪ من أمريكا وتأتي بعدهم البرازيل، وذلك بسبب توافر فرص التعليم عبر الإنترنت. ويتجه الأمريكيون إلى إكمال التعليم الجامعي في تعلم الآلة والذكاء الاصطناعي.
هل الحصول على بكالوريوس أو ماجستير كافي للعمل؟
أكثر من ٦٢٪ من علماء البيانات قد حصلوا على دراسات عليا بين ماجستير ودكتورة. وأقل من ٥٪ لم يحصلوا على درجات علمية بعد دراسة الثانوية العامة. ويحصل أغلب علماء البيانات على ماجستير وبعدها بكالوريوس ويليهما الدكتوراة. وبعدهم بنسبة قليلة لا تُذكر علماء بيانات لم يدرسوا بعد الدراسة الثانوية.
وبمرور الوقت أصبح توظيف علماء البيانات غير مقتصر على الحصول على درجة علمية متقدمة حيث يزيد توظيف خريجي البكالوريوس وغير الحاصلين على الماجستير والدكتوراه مؤخرًا.
أفضل المواقع للتطوير من نفسك من المنزل كعالم بيانات
لا يتوقف علماء البيانات عن التعلم أبدًا، وأكثر المنصات التي يستخدمها علماء البيانات المتواجدين في مجتمع كاجل هي المنصة الشهيرة كورسيرا ثم يوديمي ثم كاجل، ومن بعدهم إيدكس ولينكدإن ليرنينج. وكاجل هو أكثر المواقع زيارة وازدياد في الاستخدام في التعلم في السنة الماضية، وقل بنسبة قليلة كورسيرا ويوديمي.
هل تحتاج إلى خبرة في البرمجة قبل التعمق في علم البيانات؟
نسبة قليلة لا تتعدى ١٪ لم تكن لديها خبرة سابقة في البرمجة. وأغلب الخبرات من ٣ إلى ١٠ سنوات، ولكن ازدادت النسبة في السنة الماضية حيث وصلت إلى ١٤٪ بعدما كانت ٩٪ فقط.
الخبرة في تعلم الآلة
بدأ أغلب علماء البيانات في تعلم الآلة توًا، حيث دخل أكثر من ٥٥٪ من علماء البيانات في مجتمع كاجل تعلم الآلة منذ أقل من ٣ سنوات، وأقل من ٦٪ منذ أكثر من عقد.
وعلماء البيانات داخل أمريكا عمومًا أكثر معرفة بتعلم الآلة عن علماء البيانات خارجها نظرًا لتوافر التعليم الجامعي في هذه التخصصات بطريقة جيدة.
أفضل دولة يعمل بها علماء البيانات من حيث الرواتب
يحصل أغلب علماء البيانات في أمريكا على راتب يتعدى ١٠٠ ألف دولار سنويًا، ولكن ٣٪ فقط من علماء البيانات في الهند يحصلون على هذا الراتب. وأكبر متوسطات للرواتب عالميًا في أمريكا تليها ألمانيا ثم اليابان، ويزداد المتوسط في أمريكا حاليًا في سنة ٢٠٢١م إلى ١٥٠ ألف دولار سنويًا بعدما كان ١٠٠ ألف دولار، وفي ألمانيا وفي اليابان بمتوسط ٦٠ ألف دولار.
في أي شركة تبحث عن عمل كعالم بيانات؟
الشركات الكبيرة والصغيرة الناشئة هما الأشهر في توظيف علماء البيانات. وعدد أعضاء فريق علم البيانات في الأغلب ٥ أشخاص أو أقل، وفقط خمس الشركات الكبرى لديها عدد أكثر من ٢٠ موظف عالم بيانات.
التقنيات المستخدمة
يسيطر «جوبيتير نوتبوك – jupyter notebook» على ٧٥٪ من عمل علماء البيانات، ويأتي بعده «فيجوال ستوديو كود – visual studio code» في المركز الثاني مباشرة بنسبة ٣٨٪. ومازال جوبيتير على نفس الأهمية تقريبا منذ ٤ سنوات وقد حدث تغيير طفيف للأقل بنسبة لا تُذكر ١٪ فقط.
أشهر الخوارزميات التي تتعلمها كعالم بيانات
«Linear regression – الارتباط الخطي»
«Logistic regression – الانحدار اللوجيستي»
«Decision tree – شجرة القرار »
وغيرهم من أنواع الخوارزميات التي يستخدمها علماء البيانات في عملهم.
أشهر إطارات العمل الخاصة بتعلم الآلة
مازالت تسيطر لغة البرمجة بايثون ومكتباتها على العمل حيث تحتل مكتبة ( scikit-learn ) المركز الأول بجدارة وتسيطر على أكثر من ٨٠٪ من أعمال تعلم الآلة، وتُستخدم أيضًا كلًا من Tensorflow و keras في التعلم العميق.
وما زال يتطور علم البيانات وتتغير الأدوات يومًا بعد يوم في سبيل الوصول إلى أفضل ما يمكن لمساعدة كل الدارسين والباحثين في علم البيانات.
مصادر
[1] kaggle
[2] IBM
سعدنا بزيارتك، جميع مقالات الموقع هي ملك موقع الأكاديمية بوست ولا يحق لأي شخص أو جهة استخدامها دون الإشارة إليها كمصدر. تعمل إدارة الموقع على إدارة عملية كتابة المحتوى العلمي دون تدخل مباشر في أسلوب الكاتب، مما يحمل الكاتب المسؤولية عن مدى دقة وسلامة ما يكتب.
التعليقات :