أشهر أدوات المعلوماتية الحيوية، ما هي أداة بلاست BLAST وفيم تستخدم؟

أداة بلاست BLAST

تعد أداة بلاست «BLAST» من أهم أدوات البحث في المعلوماتية الحيوية وهي عبارة عن خوارزمية لمقارنة معلومات التسلسل البيولوجي، مثل تسلسل الأحماض الأمينية في البروتينات أو تسلسل ثلاثيات النيوكليوتيدات في الحمض النووي DNA أو الحمض النووي الريبي RNA. وتعني كلمة «BLAST» أداة بحث الصف المحلية الأساسية أو «basic local alignment search tool». وتمكّن أداة «BLAST» من مقارنة بروتين أو تسلسل نيوكليوتيد بمكتبة أو قاعدة بيانات للتسلسلات، وتحديد تسلسل قاعدة البيانات الموافق للتسلسل الذي تتم دراسته. وعند اكتشاف جين جديد عند الفأر مثلَا، ولمعرفة مقدار التشابه بينه وبين الجينوم البشري، يتم البحث عبر «BLAST»، حيث تقوم بكشف التشابهات بين الجين الجديد والجينات المخزنة ضمن قاعدة بيانات سابقًا. [1]

آلية عمل بلاست BLAST

باستخدام الطريقة «الإرشادية – Heuristic»، تجد الأداة تسلسلات متشابهة من خلال تحديد مواقع التطابق بين التسلسلين، وبعد كشف أول تشابه، تبدأ أداة «BLAST» بالبحث عن الصف. وأثناء البحث عن تشابهات للتسلسل، تعتبر مجموعات الأحرف مهمة حيث كل جزء من التسلسل يرمز له بحرف معين. فلو افترضنا مثلًا أنه لدينا التسلسل التالي «GLKFA»، إذا تم إجراء البحث فسيكون تشكيل كلمات من ثلاثة أحرف من هذا التسلسل. في هذه الحالة، ستكون الكلمات التي تم البحث عنها هي GLK ، LKF ، KFA. وبعد ذلك تحدد الخوارزمية الإرشادية للأداة جميع الكلمات المشابهة للتشكيلات المكونة من ثلاثة أحرف الخاصة بالتسلسل الذي نبحث عنه والتسلسلات الموجودة في قاعدة البيانات.

خوارزمية BLAST

  • إزالة المنطقة منخفضة التعقيد
    المنطقة منخفضة التعقيد تعني منطقة من التسلسل مكونة من عدد قليل من العناصر. وقد تسبب هذه المناطق تشويش يربك البرنامج في بحثه عن التسلسل الفعلي في قاعدة البيانات، لذلك يجب إزالتها. وهذه المناطق تشبه التشويش الموجود في الإشارات الرقمية، ويجب التخلص منها قبل معالجة الإشارة. ويتم تمييز هذه المناطق بالرمز X في تسلسلات البروتين وبالرمز N في تسلسل الحمض النووي، وذلك لتسهل تجاهلها من قبل البرنامج ولأن N مستخدم بالفعل في الحروف التي ترمز لأحد الأحماض الأمينية.
  • إنشاء قائمة كلمات مكونة من عدد K من الحروف للتسلسل

    نفترض k = 3 على سبيل المثال، سنستخلص الكلمات المكونة من 3 أحرف من تسلسل البروتين، حتى يتم تضمين الحرف الأخير.
طريقة تشكيل كلمات ثلاثية من تسلسل الحروف
  • قائمة الكلمات المطابقة المحتملة
    تهتم خوارزمية «BLAST» فقط بالكلمات ذات الدرجات العالية. ويتم إنشاء الدرجات من خلال مقارنة الكلمة الموجودة في المشكلة في الخطوة السابقة بجميع الكلمات المكونة من 3 أحرف ضمن قاعدة البيانات. وتُستخدم مصفوفة التسجيل (مصفوفة الاستبدال) لتسجيل المقارنة بين كل زوج من المخلفات. وكلما زاد التطابق، زادت الدرجة والعكس صحيح.
  • تنظيم الكلمات المتبقية عالية الدرجات في ترتيبات بحث فعالة
    يسمح هذا للبرنامج بمقارنة الكلمات عالية الدرجات بسرعة مع تسلسلات قاعدة البيانات. ويتم تكرار الخطوات 3 و 4 حتى الانتهاء من التسلسل بشكل كامل.

تحميل برنامج BLAST

يمكن تحميل برنامج «BLAST» وتشغيله كأداة مساعدة أو الوصول إليه مجانًا عبر الويب. ويسمح خادم الويب «BLAST»، الذي يستضيفه موقع «NCBI»، لأي شخص لديه متصفح ويب بإجراء عمليات بحث عن التشابهات ضمن قواعد البيانات المحدثة باستمرار للبروتينات والحمض النووي والتي تشمل معظم الكائنات الحية. ويعتمد برنامج «BLAST» على تنسيق مفتوح المصدر، مما يتيح للجميع الوصول إليه ويمكّنهم من تغيير الكود البرمجي الخاص بالبرنامج مما أدى إلى إنشاء العديد من المشاريع الفرعية المشتقة من هذا المصدر. ويمكنك تحميل وتفحص البرنامج من هنا.[2]

أنواع برنامج BLAST

  • BLASTn: يقارن واحدًا أو أكثر من تسلسل النيوكليوتيدات بتسلسل النوكليوتيدات في قاعدة البيانات أو تسلسل واحد معين.
  • BLASTx: يقارن هذا البرنامج منتجات ترجمة ستة إطارات لتسلسل النوكليوتيدات ضمن الـ DNA بقاعدة بيانات تسلسل البروتين للعثور على الجين المسؤول عن إنتاج بروتين أو حمض أميني معين.
  • TBLASTn: وهو بعكس «BLASTX » ويستخدم لرسم خريطة للبروتين والحمض النووي المسؤول عنه.
  • BLASTp: يقارن تسلسلًا واحدًا أو أكثر من تسلسل البروتين بالتسلسلات ضمن قاعدة بيانات. مما يساعد في محاولة التعرف على بروتين معين.

يمكن استكشاف عدد من عمليات البحث ضمن البرنامج من هنا. [3]

أصبح «BLAST» أداة أساسية لعلماء الأحياء. حيث تسمح سرعته وحساسيته للعلماء بمقارنة تسلسل النيوكليوتيدات والبروتينات بالتسلسلات ضمن قواعد البيانات الكبيرة. وأصبح من المعتاد قراءة بحث في مجال علم الأحياء الحديث يحمل اسم «BLAST» كأداة مستخدمة. وقد سمحت «BLAST» وتطبيقاتها التابعة للعلماء بالتنبؤ بوظائف الجينات والبروتينات في الجينوم الكامل، والإجابة على أسئلة كان لا يمكن الإجابة عليها بالعمل المختبري فقط.

المصادر
[1] Berkley library
[2] BLAST NCBI
[3]
NCBI Github

 

 

 

 

 

 

مقدمة عن مجال المعلوماتية الحيوية Bioinformatics

ما هي المعلوماتية الحيوية؟

هي مجال متعدد التخصصات يطور أساليب وأدوات برمجية لفهم البيانات البيولوجية، خصوصًا عندما تكون مجموعات البيانات المستخدمة كبيرة ومعقدة. تجمع المعلوماتية الحيوية ما بين علم الأحياء والكيمياء والفيزياء وهندسة المعلومات والرياضيات والإحصاء بهدف تحليل وتفسير البيانات البيولوجية.


مجالات تجمع بينها المعلوماتية الحيوية

تطبيقات المعلوماتية الحيوية

يعتبر هذا المجال من التخصصات الغنية حيث تبحث في المجالات علم الأدوية, والمضادات الحيوية، والمستحضرات الصيدلانية وحتى التقنيات الصديقة للبيئة ودراسات تغير المناخ. ويهتم هذا المجال بعلم الوراثة والجينوم، ويستخدم لجمع وتخزين وتحليل البيانات والمعلومات البيولوجية، مثل تسلسل الحمض النووي (DNA) أو الحمض النووي الريبي (RNA) أو البروتين والأحماض الأمينية. حيث يستخدم العلماء والأطباء قواعد البيانات التي تنظم هذه المعلومات من أجل مقارنة الجينات والتسلسلات الأخرى في البروتينات والتسلسلات الأخرى داخل الكائنات الحية والنظر في العلاقات التطورية فيما بينها. وأيضا استخدام الأنماط الموجودة عبر تسلسل الحمض النووي والبروتين لمعرفة وظيفتها وأهميتها.[1]

يستخدم علماء المعلوماتية الحيوية التطورية برمجيات خاصة تم تطويرها لتتبع البيانات الجينية وتحقيق تقدم جديد في فهم جينوم المريض وعوامل الخطر الجينية والتي عملت المعلوماتية الحيوية على تسهيل فهمها إلى حد كبير.

كما يتم إنشاء خرائط الجينوم عن طريق إدخال البيانات الحيوية في البرامج، لتبني بعد ذلك نماذج معقدة من العينات الجينية. ويساعد هذا الربط العلماء على قضاء وقت أقل في رسم خرائط الجينات والمزيد من الوقت في دراسة وتحديد مواقع بروتينات معينة. ويُطلق على هذا اسم نمذجة البروتين، ويستخدم لاختبار نظريات متخصص حول كيفية تفاعل البروتينات للتأثير على التغيير الجيني والتكيف والتطور.

نمذجة لشكل البروتين باستخدام برمجيات خاصة

دور المعلوماتية الحيوية في تحليل البيانات

إن زيادة كمية البيانات الناتجة من مشاريع وأبحاث الجينوم أدت إلى زيادة الحاجة لإدارة قواعد بيانات الكمبيوتر التي تتميز بالاستيعاب الفعال والعملي. وبسبب التنوع الموجود في طبيعة هذه البيانات، فمن الصعب حصرها بقاعدة بيانات واحدة شاملة. وتحتاج إدارة هذا النوع من البيانات إلى متخصصين، بحيث يكونوا قادرين على فهمها والتعامل معها للوصول إلى تنسيق وصيغة مفيدة للأكاديميين والأطباء.

وتختلف إمكانية الوصول لهذه القواعد ما بين قواعد بيانات عامة متاحة لكل الراغبين، وأخرى خاصة متاحة لمشتركين معينين أو فريق بحث معين. فمثلاً مشروع «Ensemble» هو مشروع مشترك بين المعهد الأوروبي للمعلومات الحيوية ومركز «Sanger». ويقوم هذا الموقع بتتبع القطع المتسلسلة من الجينوم البشري تلقائيًا وتجميعها وتحليلها لتحديد الجينات وغيرها من الميزات التي تهم الباحثين في الطب الحيوي. [2]

أداة أخرى في هذا المجال تسمى «BLAST» وهي تعمل وفق خوارزمية قادرة على البحث في قواعد البيانات عن الجينات ذات البنية النوكليوتيدية المتشابهة. ويسمح بمقارنة تسلسل غير معروف للحمض النووي أو الأحماض الأمينية مع مئات أو آلاف التسلسلات من البشر أو الكائنات الحية الأخرى حتى يتم العثور على تطابق.

اختصاصات ومجالات المعلوماتية الحيوية

أدى الكم الكبير والمتزايد من البيانات المستخرجة معمليًا في علم الأحياء إلى توسع هذا المجال بحيث أصبح يشمل مجموعة واسعة من التخصصات الفرعية ومنها:

  • علم الأحياء الحوسبي
    يختص باستخدام تحليل البيانات والنمذجة الرياضية والمحاكاة الحاسوبية لفهم الأنظمة والعلاقات البيولوجية.
  • علم الوراثة
    علم الوراثة هو دراسة كيفية انتقال الجينات والصفات من جيل إلى جيل.
  • علم الجينوم
    فرع من علم الأحياء الجزيئي يهتم ببنية الجينوم ووظيفته وتطوره ورسم خرائطه.
  • علم البروتينات
    وهو تخصص يهتم بدراسة البروتينات ووظائفها وأشكالها.
  • علوم الميتاجينوميا
    يمكن الإشارة إلى المجال الواسع أيضًا باسم الجينوم البيئي أو الجينوميات المجتمعية. حيث أنها تهتم بدراسة المادة الوراثية المستخرجة مباشرة من العينات البيئية، مثل المجتمعات الفطرية.
  • علم الاستنساخ
    وهي دراسة نسخة كاملة من الحمض النووي الريبي RNA. وغيرها الكثير من التخصصات الدقيقة والمعقدة.

برامج دراسات المعلوماتية الحيوية

تعتبر هذا المجال تخصص على مستوى الدراسات العليا في أغلب الجامعات العربية. ويأتي معظم الطلاب من دورات دراسية جامعية في مجالات مثل البيولوجيا وعلوم الكمبيوتر والكيمياء والهندسة الطبية الحيوية والصيدلة والطب. ويمكن لبرامج درجة الماجستير في المعلوماتية الحيوية إعداد الخريجين لشغل وظائف في التدريس الجامعي أو وظائف البحث لتطبيق تقنياتها في مراكز البحث. وسوف نذكر بعض برامج درجة الماجستير في عدة جامعات حول العالم:

  • برنامج الماجستير بجامعة كولومبيا

    تقدم جامعة كولومبيا درجة الماجستير في العلوم عبر الإنترنت (MS) في علم الأحياء الحسابي الذي يركز على موضوعات مثل علوم البيانات، وطرق المعلوماتية الحيوية الحسابية، وعلم الإحصاء الرياضي. يمكن زيارة الموقع من هنا. [3]

  • برنامج ماجستير المعلوماتية الحيوية بجامعة نورث إيسترن

    تقدم جامعة نورث إيسترن درجة الماجستير عبر الإنترنت في المعلوماتية الحيوية التي تركز على موضوعات مثل برمجة المعلوماتية الحيوية وأخلاقيات البحث الطبي الحيوي. ويقدم البرنامج أيضًا شهادة الدراسات العليا في علوم البيانات. حيث أن كلية العلوم بجامعة نورث إيسترن تعد مؤسسة رائدة عبر الإنترنت في مجال دراسات البيانات الحيوية وتضم هيئة تدريس من المتخصصين في المعلوماتية الحيوية. يمكن زيارة الموقع من هنا. [4]


    المصادر

[1] Genome.gov
[2] NCBI
[3] برنامج جامعة كولومبيا
[4] برنامج جامعة نورث إيسترن

 

 

 

 

 

مقدمة في علم الحوسبة البيولوجية

هذه المقالة هي الجزء 15 من 17 في سلسلة مقدمة في علم البيانات وتطبيقاته

علم الحوسبة البيولوجية هو تخصص تتداخل فيه البيولوجيا وعلوم الحاسب والرياضيات التطبيقية للعمل على مسائل في البيولوجيا. ويتألف من عدة فروع منها المعلوماتية الحيوية وعلم الجينوم الحاسوبي وعلم الأحياء والنمذجة الجزيئية والتنبؤ بالأمراض. 

تاريخ وركائز علم الحوسبة البيولوجية

تعود بدايات هذا العلم إلى تاريخ نشأة علم الكمبيوتر؛ حيث عالم الرياضيات البريطاني «آلان تورينج-Alan Turing» أبو الكمبيوتر. باستخدام الكمبيوتر البدائي في إدخال أنظمة من تطور الكائنات الحية في بداية سنة ١٩٥٠م قبل وفاته، وفي نفس الوقت قام بنفس التجارب مجموعة من الباحثين في المعمل القومي لأبحاث الأسلحة بمختبر لوس آلاموس بالولايات المتحدة الأمريكية. 

Alan Turing

سنة ١٩٦٠م، تطور الكمبيوتر للتعامل مع تحليل البيانات بشكل أفضل وأكثر تعمقًا والوصول إلى تركيب البروتينات. ومن هنا تم اعتبار الأحياء الحاسوبي علمًا منفصلًا، وأصبح الكمبيوتر قادرًا على تمثيل شكل ثلاثي الأبعاد لتركيب البروتينات. وبالعودة إلى ١٩٥٠م، استخدم خبراء التصنيف الكمبيوتر في عملهم وأصبح المجال أكثر تطورًا في عام ١٩٦٠م عندما تطورت هذه التقنيات للتصنيف اعتمادًا على الحمض النووي. 

سنة ١٩٨٠م، تطور علم الحوسبة البيولوجية بسبب التطور الكبير في عالم الكمبيوتر وخاصة الذكاء الاصطناعي الذي ساهم في معرفة أصل الكائنات الحية والعلاقات بينهم. وسنة ١٩٩٠م، تعرف العلماء على وظائف البروتينات، وتحليل تفاعلات البروتينات مع جزيئات أخرى إلى أن أصبح لم يعد هناك مجال بيولوجي بدون استخدام طرق علم الكمبيوتر. [1]

ما الفرق بين علم الحوسبة البيولوجية ومجالات أخرى؟

  • المعلوماتية الحيوية: يستخدم الخبراء المجالين معًا بنفس التعريف ولا يرون أهمية للتفرقة بينهما، ولكن تتضمن المعلومات الحيوية تحليل وإدارة البيانات باستخدام أدوات تساعد على تأكيد التجارب وفحصها داخل المعامل. أما الحوسبة البيولوجية فهي فرع من فروع الأحياء مثل الفيزياء الحاسوبية التي تعتبر فرع من فروع الفيزياء، والحوسبة البيولوجية فرع من فروع الأحياء طُور بواسطة الكمبيوتر. [2]
  • ومن السهل تمييزه عن البيولوجيا الحسابية: بالرغم من التداخلات إلا أن النظام القديم للبيولوجيا الحسابية يهتم بتطبيق التحليلات الرقمية على موضوعات مثل ديناميكا السكان وتطور التطبيق على الجينات. وبالأساس أن البيولوجيا الحسابية تعتمد على التحليل الرقمي، لكن الحوسبة البيولوجية تعتمد على الرياضيات المتقطعة التي تعتبر ركيزة أساسية في تطبيق الكمبيوتر في علم البيولوجيا. 
  • أما البيولوجيا النظرية تتميز عنها الحوسبة البيولوجية في التطبيق على أرض الواقع والخروج بنتيجة عملية. وتتداخل أحيانًا البيولوجيا النظرية مع البيولوجيا الحسابية ومن الممكن أن يكونوا مجالًا واحدًا. 

ما هي أنواع المشاكل التي يعمل عليها علم الحوسبة البيولوجية؟

  • تحليل جزيئات البيانات من الحمض النووي « DNA, RNA ». 
  • تحليل تركيب البروتينات ثلاثية الأبعاد والجينات. 
  • التعرف على الأمراض التي تسببها الجينات.
  • التعرف على هيكلة تطور الكائنات تاريخيًا. 
  • العمل أيضًا على البيانات غير الجينية مثل البيانات الإكلينيكية والبيانات البيئية. 

أهمية علم الحوسبة البيولوجية

  • التنبؤ بوظيفة البروتينات اعتمادًا على التركيب. 
  • التعرف على بروتينات إضافية غير معروف تسلسلها مُسبقًا. 
  • التعرف على المناطق النشطة في البروتينات باستخدام الوصف والتركيب ثلاثي الأبعاد. 
  • تصميم الأدوية اعتمادًا على الرؤية الواضحة في التعرف على البروتين. 
  • ابتكار طرق علاجية من خلال التعرف على الجينات وسلوكياتها فيما يعرف ب «Personalized Medicine – الطب الشخصي».  [3]

كيف تغيرت أوضاع علم الحوسبة البيولوجية؟

  • في البحث العلمي: انتشرت الأبحاث عن تسلسل الأحماض النووية والبروتينات في ال ٥ سنوات السابقة ٥ أضعاف؛ فزاد الاحتياج بشكل كبير إلى محللي بيانات بخبرة في الكمبيوتر. وازداد الاتجاه من مجرد تحليل البيانات وابتكار خوارزميات إلى التعمق في البيولوجيا والأمراض مثل أمراض السرطان.
  • التغير البيئي وانتشار عدد كبير من الأمراض مما أدى إلى انتشار المراكز البحثية المتخصصة على سبيل المثال مجال الخلايا الجذعية، حيث كان يعمل به سابقًا علماء من أقسام الجلدية والمخ والأعصاب، ولكن أصبح الآن لعلماء الحوسبة البيولوجية دورًا كبيرًا في هذه المراكز.
  • أصبح تخليق البيانات جزءًا مهمًا، حيث ركز العلماء السابقون على البيانات المتاحة، ولكن بعد ظهور القدرة على تخليق البيانات وانتشار أكبر قدر من البيانات أصبحت الفرص أفضل. 
  • فحص البيانات: لم يعد الوضع متعلقًا بفرضية معينة وإثباتها كما يقوم العديد من العلماء، ولكن تطور الوضع بالفحص المتعمق في البيانات واكتشاف طفرة جديدة أو قصة جديدة غير متوقعة. [4]

ما هي أهم الخوارزميات في الحوسبة البيولوجية؟

  •  «Global Matching»: استغلال معرفتنا ببروتينات كائن معين لفهم أكثر عدد من البروتينات في الكائنات الأخرى عن طريق محاولة مطابقتها. 
  • «Hidden Markov model»: استخدام بديل للاحتمالية بمعنى أن نطلق جين وبعدها ننتقل للحالة التي تليها، وهذه الحالة يوجد احتمال أن تساوي الأصلية. 
  • «population genetics»: محاولة مماثلة ما يحدث في موقع ما بمواقع أخرى. 
  • «Population tree»: لتوضيح المسافات بين الأنواع المختلفة في حالة دراسة تطور الكائنات الحية. 
  • «gene regulation networks»: النظر في التفاعلات بين البروتينات المختلفة في كائن حي قد يحدد نوع الخلية. 

الأعمال المتوفرة في الحوسبة البيولوجية

  1. ضمن العمل الحكومي لتحليل البيانات الضخمة المتاحة للأبحاث المستخدمة في الطب والدواء والجينات وانتشار الأمراض. 
  2. عالم أبحاث مع تقدم منظومة الشركات الصيدلانية والشركات العالمية في تفاعلات الأدوية وتطوير برامج تحليلية قوية. 
  3. التدريس في الجامعات في الدراسات العليا والأبحاث على الجينات وتحليلها وفحص البيانات. [6]

الأماكن المتاحة للعمل دائمًا

  1. المعدات والأجهزة الطبية. 
  2. الأبحاث.
  3. الكيماويات الزراعية. 
  4. المستحضرات الصيدلانية.
  5. معاهد الصحة. [6]

المهارات

  • البرمجة مثل بايثون وجالاكسي 
  • أدوات المعلوماتية الحيوية مثل (Bio-edit) والخوارزميات. 
  • قواعد البيانات مثل (sql) بالإضافة إلى تنظيف البيانات ورسم البيانات. 
  • فهم البيولوجيا والصبر والمرونة.

المصادر

[1] Britannica
[2] Cornell cals
[3] NCBI
[4] Genome Biology
[5] towards data science
[6] BioTecNika Times

Exit mobile version