مقدمة في علم الحوسبة البيولوجية

هذه المقالة هي الجزء 15 من 17 في سلسلة مقدمة في علم البيانات وتطبيقاته

علم الحوسبة البيولوجية هو تخصص تتداخل فيه البيولوجيا وعلوم الحاسب والرياضيات التطبيقية للعمل على مسائل في البيولوجيا. ويتألف من عدة فروع منها المعلوماتية الحيوية وعلم الجينوم الحاسوبي وعلم الأحياء والنمذجة الجزيئية والتنبؤ بالأمراض. 

تاريخ وركائز علم الحوسبة البيولوجية

تعود بدايات هذا العلم إلى تاريخ نشأة علم الكمبيوتر؛ حيث عالم الرياضيات البريطاني «آلان تورينج-Alan Turing» أبو الكمبيوتر. باستخدام الكمبيوتر البدائي في إدخال أنظمة من تطور الكائنات الحية في بداية سنة ١٩٥٠م قبل وفاته، وفي نفس الوقت قام بنفس التجارب مجموعة من الباحثين في المعمل القومي لأبحاث الأسلحة بمختبر لوس آلاموس بالولايات المتحدة الأمريكية. 

Alan Turing

سنة ١٩٦٠م، تطور الكمبيوتر للتعامل مع تحليل البيانات بشكل أفضل وأكثر تعمقًا والوصول إلى تركيب البروتينات. ومن هنا تم اعتبار الأحياء الحاسوبي علمًا منفصلًا، وأصبح الكمبيوتر قادرًا على تمثيل شكل ثلاثي الأبعاد لتركيب البروتينات. وبالعودة إلى ١٩٥٠م، استخدم خبراء التصنيف الكمبيوتر في عملهم وأصبح المجال أكثر تطورًا في عام ١٩٦٠م عندما تطورت هذه التقنيات للتصنيف اعتمادًا على الحمض النووي. 

سنة ١٩٨٠م، تطور علم الحوسبة البيولوجية بسبب التطور الكبير في عالم الكمبيوتر وخاصة الذكاء الاصطناعي الذي ساهم في معرفة أصل الكائنات الحية والعلاقات بينهم. وسنة ١٩٩٠م، تعرف العلماء على وظائف البروتينات، وتحليل تفاعلات البروتينات مع جزيئات أخرى إلى أن أصبح لم يعد هناك مجال بيولوجي بدون استخدام طرق علم الكمبيوتر. [1]

ما الفرق بين علم الحوسبة البيولوجية ومجالات أخرى؟

  • المعلوماتية الحيوية: يستخدم الخبراء المجالين معًا بنفس التعريف ولا يرون أهمية للتفرقة بينهما، ولكن تتضمن المعلومات الحيوية تحليل وإدارة البيانات باستخدام أدوات تساعد على تأكيد التجارب وفحصها داخل المعامل. أما الحوسبة البيولوجية فهي فرع من فروع الأحياء مثل الفيزياء الحاسوبية التي تعتبر فرع من فروع الفيزياء، والحوسبة البيولوجية فرع من فروع الأحياء طُور بواسطة الكمبيوتر. [2]
  • ومن السهل تمييزه عن البيولوجيا الحسابية: بالرغم من التداخلات إلا أن النظام القديم للبيولوجيا الحسابية يهتم بتطبيق التحليلات الرقمية على موضوعات مثل ديناميكا السكان وتطور التطبيق على الجينات. وبالأساس أن البيولوجيا الحسابية تعتمد على التحليل الرقمي، لكن الحوسبة البيولوجية تعتمد على الرياضيات المتقطعة التي تعتبر ركيزة أساسية في تطبيق الكمبيوتر في علم البيولوجيا. 
  • أما البيولوجيا النظرية تتميز عنها الحوسبة البيولوجية في التطبيق على أرض الواقع والخروج بنتيجة عملية. وتتداخل أحيانًا البيولوجيا النظرية مع البيولوجيا الحسابية ومن الممكن أن يكونوا مجالًا واحدًا. 

ما هي أنواع المشاكل التي يعمل عليها علم الحوسبة البيولوجية؟

  • تحليل جزيئات البيانات من الحمض النووي « DNA, RNA ». 
  • تحليل تركيب البروتينات ثلاثية الأبعاد والجينات. 
  • التعرف على الأمراض التي تسببها الجينات.
  • التعرف على هيكلة تطور الكائنات تاريخيًا. 
  • العمل أيضًا على البيانات غير الجينية مثل البيانات الإكلينيكية والبيانات البيئية. 

أهمية علم الحوسبة البيولوجية

  • التنبؤ بوظيفة البروتينات اعتمادًا على التركيب. 
  • التعرف على بروتينات إضافية غير معروف تسلسلها مُسبقًا. 
  • التعرف على المناطق النشطة في البروتينات باستخدام الوصف والتركيب ثلاثي الأبعاد. 
  • تصميم الأدوية اعتمادًا على الرؤية الواضحة في التعرف على البروتين. 
  • ابتكار طرق علاجية من خلال التعرف على الجينات وسلوكياتها فيما يعرف ب «Personalized Medicine – الطب الشخصي».  [3]

كيف تغيرت أوضاع علم الحوسبة البيولوجية؟

  • في البحث العلمي: انتشرت الأبحاث عن تسلسل الأحماض النووية والبروتينات في ال ٥ سنوات السابقة ٥ أضعاف؛ فزاد الاحتياج بشكل كبير إلى محللي بيانات بخبرة في الكمبيوتر. وازداد الاتجاه من مجرد تحليل البيانات وابتكار خوارزميات إلى التعمق في البيولوجيا والأمراض مثل أمراض السرطان.
  • التغير البيئي وانتشار عدد كبير من الأمراض مما أدى إلى انتشار المراكز البحثية المتخصصة على سبيل المثال مجال الخلايا الجذعية، حيث كان يعمل به سابقًا علماء من أقسام الجلدية والمخ والأعصاب، ولكن أصبح الآن لعلماء الحوسبة البيولوجية دورًا كبيرًا في هذه المراكز.
  • أصبح تخليق البيانات جزءًا مهمًا، حيث ركز العلماء السابقون على البيانات المتاحة، ولكن بعد ظهور القدرة على تخليق البيانات وانتشار أكبر قدر من البيانات أصبحت الفرص أفضل. 
  • فحص البيانات: لم يعد الوضع متعلقًا بفرضية معينة وإثباتها كما يقوم العديد من العلماء، ولكن تطور الوضع بالفحص المتعمق في البيانات واكتشاف طفرة جديدة أو قصة جديدة غير متوقعة. [4]

ما هي أهم الخوارزميات في الحوسبة البيولوجية؟

  •  «Global Matching»: استغلال معرفتنا ببروتينات كائن معين لفهم أكثر عدد من البروتينات في الكائنات الأخرى عن طريق محاولة مطابقتها. 
  • «Hidden Markov model»: استخدام بديل للاحتمالية بمعنى أن نطلق جين وبعدها ننتقل للحالة التي تليها، وهذه الحالة يوجد احتمال أن تساوي الأصلية. 
  • «population genetics»: محاولة مماثلة ما يحدث في موقع ما بمواقع أخرى. 
  • «Population tree»: لتوضيح المسافات بين الأنواع المختلفة في حالة دراسة تطور الكائنات الحية. 
  • «gene regulation networks»: النظر في التفاعلات بين البروتينات المختلفة في كائن حي قد يحدد نوع الخلية. 

الأعمال المتوفرة في الحوسبة البيولوجية

  1. ضمن العمل الحكومي لتحليل البيانات الضخمة المتاحة للأبحاث المستخدمة في الطب والدواء والجينات وانتشار الأمراض. 
  2. عالم أبحاث مع تقدم منظومة الشركات الصيدلانية والشركات العالمية في تفاعلات الأدوية وتطوير برامج تحليلية قوية. 
  3. التدريس في الجامعات في الدراسات العليا والأبحاث على الجينات وتحليلها وفحص البيانات. [6]

الأماكن المتاحة للعمل دائمًا

  1. المعدات والأجهزة الطبية. 
  2. الأبحاث.
  3. الكيماويات الزراعية. 
  4. المستحضرات الصيدلانية.
  5. معاهد الصحة. [6]

المهارات

  • البرمجة مثل بايثون وجالاكسي 
  • أدوات المعلوماتية الحيوية مثل (Bio-edit) والخوارزميات. 
  • قواعد البيانات مثل (sql) بالإضافة إلى تنظيف البيانات ورسم البيانات. 
  • فهم البيولوجيا والصبر والمرونة.

المصادر

[1] Britannica
[2] Cornell cals
[3] NCBI
[4] Genome Biology
[5] towards data science
[6] BioTecNika Times

كيف تقوم بتحليل البيانات في ٧ خطوات ؟

هذه المقالة هي الجزء 2 من 17 في سلسلة مقدمة في علم البيانات وتطبيقاته

كيف تقوم بتحليل البيانات في ٧ خطوات ؟

تنتشر البيانات في كل مكان حولنا، إذا كانت لديك وظيفة ما حتى لو كانت غير مرتبطة بالبيانات فغالبًا ما يكون في عملك بعض البيانات – قليلة أو كثيرة – على حسب العمل. إذا كنت تعمل محاسب أو في مجال المبيعات أو حتى في مجال الصحة دائمًا توجد بيانات.  فكيف تقوم بتحليل البيانات في ٧ خطوات ؟

فما هي الخطوات التي تتبعها لتحليل البيانات؟

١. تحديد الهدف من البيانات

يجب تحديد الهدف الذي تريده من العمل على هذه البيانات. وتحديد الأسئلة التي تريد أن تجاوب عليها. كما يجب معرفة تكلفة العمل والفوائد التي تعود على المؤسسة من العمل عليها. ويجب تحديد المستوى المتوقع من الدقة والاستفادة، وماذا سيؤثر على التكاليف فيما بعد؟ وكلما زادت دقة البيانات كلما زادت التكاليف إلى أن نصل إلى مرحلة هي قمة الدقة، ومهما زادت الدقة فيما بعد لن تتغير النتائج.

٢. تحديد البيانات

تمتلك الشركات بيانات خاصة بها، لكن من الممكن أن تكون هذه البيانات غير منتظمة وتحتاج إلى تعديلات أو تهيئة أو قد لا تفيد في حل المشكلة. وتقوم الشركة بتحديد نوع البيانات وحجمها وتكرارها والتعرف على أفضل أنواع البيانات للعمل عليها وهي خطوة مهمة، وبها ينجح مشروعك، وبها قد يفشل.

٣. ما قبل العمل على البيانات

بعد تحديد البيانات، ندخل في مرحلة ما قبل العمل على البيانات. من الممكن أن تحتوي البيانات على خانات فارغة أو أخطاء إملائية تعيق عمليات الفلترة وربما تكون بعض الخانات غير مفيدة، أي أنها أكثر من المطلوب. في النهاية، يجب تطوير طريقة لنعرف بها البيانات المفقودة، وهل فقدها مُسبب أم بدون سبب معروف؟ فذلك قد يؤدي إلى خلل في نتائج التحليل، لذا، يجب عليك اكتشاف المشكلات قبلها لتحدد ما إذا كنت ستستبعد المفقود من البيانات أو ستقوم بتعديله أو ستضع المتوسطات مثلًا.

٤. تحويل البيانات

هي خطوة اختيارية لا تحدث دائمًا، وهي عبارة عن تحديد أفضل شكل أو صيغة لتخزين البيانات. نهدف من تحويل البيانات إلى تقليل عدد الخصائص، واستخدام بعض أنواع الخوارزميات التي تقلل من حجم البيانات عديمة الفائدة مثل (Principal Component Analysis). 

من الممكن تحويل البيانات من (Continuous) إلى (Categorical)، أي تحويل أوزان الأشخاص من 85.5 كجم، و87.9 كجم، إلى أن يصبحوا في فئات، أي (أكبر من 80 كجم وأصغر من 90 كجم) أو العكس فمن المهم الوصول إلى شكل يفيدك في تحليل هذه البيانات. 

٥. تخزين البيانات

يجب تخزين البيانات بعد خطوة تحويل البيانات، وهي خطوة مهمة. حيث يتم حفظ وتخزين البيانات بشكل آمن وخاص على الخادم أو داخل مكان تخزين بيانات خاص لحفظها آمنة. فأمان البيانات والخصوصية من الأولويات دائمًا. 

٦. تحليل البيانات

 بعد أن نفرغ من تحديد البيانات والعمل عليها وتنظيفها وتخزينها يجب أن نعمل على هدفنا وهو تحليل البيانات. ولتحليل البيانات طرق متعددة، منها البدء في فهم مبادئ الإحصاء، وتكوين فهم جيد للمجال الذي تحلل فيه البيانات.

وقد يتم تحليل البيانات عن طريق بعض البرامج مثل (Microsoft Excel) أو (Google Spreadsheet). وقد يتم أيضًا ببعض لغات البرمجة، مثل لغة الأر R Language أو لغة البايثون Python.

وبعد عملية تحليل البيانات، نشرع في رسم البيانات والوصول إلى الهدف والإجابة على الأسئلة التي بدأنا من أجلها العمل على البيانات. وهذا الرسم يكون للتوضيح والاختصار وسهولة التواصل وشرح البيانات. 

٧. الخطوة الأخيرة وهي تقييم العمل

لا يتم العمل بشكل صحيح إلا بعد تقييمه بعد ظهور النتائج. إذ نعمل على تقديم البيانات ومراجعة التقرير بشكل فعال، ونرى ما إذا كان هناك تطابق لهذه النتائج مع بيانات أخرى أو مع نتائج أخرى. ونعمل على مشاركة ردود الأفعال والنتائج مع أصحاب العمل. ويتنبأ الكثيرون بأن مهارة تحليل البيانات ستصبح مهارة أساسية للموظف مستقبلًا، ويضعها أصحاب الأعمال على قائمة الأولويات في الموظف المطلوب. فما رأيك؟

المصادر

Investopedia
Talend

Exit mobile version