Ad

أداة بلاست BLAST

تعد أداة بلاست «BLAST» من أهم أدوات البحث في المعلوماتية الحيوية وهي عبارة عن خوارزمية لمقارنة معلومات التسلسل البيولوجي، مثل تسلسل الأحماض الأمينية في البروتينات أو تسلسل ثلاثيات النيوكليوتيدات في الحمض النووي DNA أو الحمض النووي الريبي RNA. وتعني كلمة «BLAST» أداة بحث الصف المحلية الأساسية أو «basic local alignment search tool». وتمكّن أداة «BLAST» من مقارنة بروتين أو تسلسل نيوكليوتيد بمكتبة أو قاعدة بيانات للتسلسلات، وتحديد تسلسل قاعدة البيانات الموافق للتسلسل الذي تتم دراسته. وعند اكتشاف جين جديد عند الفأر مثلَا، ولمعرفة مقدار التشابه بينه وبين الجينوم البشري، يتم البحث عبر «BLAST»، حيث تقوم بكشف التشابهات بين الجين الجديد والجينات المخزنة ضمن قاعدة بيانات سابقًا. [1]

آلية عمل بلاست BLAST

باستخدام الطريقة «الإرشادية – Heuristic»، تجد الأداة تسلسلات متشابهة من خلال تحديد مواقع التطابق بين التسلسلين، وبعد كشف أول تشابه، تبدأ أداة «BLAST» بالبحث عن الصف. وأثناء البحث عن تشابهات للتسلسل، تعتبر مجموعات الأحرف مهمة حيث كل جزء من التسلسل يرمز له بحرف معين. فلو افترضنا مثلًا أنه لدينا التسلسل التالي «GLKFA»، إذا تم إجراء البحث فسيكون تشكيل كلمات من ثلاثة أحرف من هذا التسلسل. في هذه الحالة، ستكون الكلمات التي تم البحث عنها هي GLK ، LKF ، KFA. وبعد ذلك تحدد الخوارزمية الإرشادية للأداة جميع الكلمات المشابهة للتشكيلات المكونة من ثلاثة أحرف الخاصة بالتسلسل الذي نبحث عنه والتسلسلات الموجودة في قاعدة البيانات.

خوارزمية BLAST

  • إزالة المنطقة منخفضة التعقيد
    المنطقة منخفضة التعقيد تعني منطقة من التسلسل مكونة من عدد قليل من العناصر. وقد تسبب هذه المناطق تشويش يربك البرنامج في بحثه عن التسلسل الفعلي في قاعدة البيانات، لذلك يجب إزالتها. وهذه المناطق تشبه التشويش الموجود في الإشارات الرقمية، ويجب التخلص منها قبل معالجة الإشارة. ويتم تمييز هذه المناطق بالرمز X في تسلسلات البروتين وبالرمز N في تسلسل الحمض النووي، وذلك لتسهل تجاهلها من قبل البرنامج ولأن N مستخدم بالفعل في الحروف التي ترمز لأحد الأحماض الأمينية.
  • إنشاء قائمة كلمات مكونة من عدد K من الحروف للتسلسل

    نفترض k = 3 على سبيل المثال، سنستخلص الكلمات المكونة من 3 أحرف من تسلسل البروتين، حتى يتم تضمين الحرف الأخير.
طريقة تشكيل كلمات ثلاثية من تسلسل الحروف
  • قائمة الكلمات المطابقة المحتملة
    تهتم خوارزمية «BLAST» فقط بالكلمات ذات الدرجات العالية. ويتم إنشاء الدرجات من خلال مقارنة الكلمة الموجودة في المشكلة في الخطوة السابقة بجميع الكلمات المكونة من 3 أحرف ضمن قاعدة البيانات. وتُستخدم مصفوفة التسجيل (مصفوفة الاستبدال) لتسجيل المقارنة بين كل زوج من المخلفات. وكلما زاد التطابق، زادت الدرجة والعكس صحيح.
  • تنظيم الكلمات المتبقية عالية الدرجات في ترتيبات بحث فعالة
    يسمح هذا للبرنامج بمقارنة الكلمات عالية الدرجات بسرعة مع تسلسلات قاعدة البيانات. ويتم تكرار الخطوات 3 و 4 حتى الانتهاء من التسلسل بشكل كامل.

تحميل برنامج BLAST

يمكن تحميل برنامج «BLAST» وتشغيله كأداة مساعدة أو الوصول إليه مجانًا عبر الويب. ويسمح خادم الويب «BLAST»، الذي يستضيفه موقع «NCBI»، لأي شخص لديه متصفح ويب بإجراء عمليات بحث عن التشابهات ضمن قواعد البيانات المحدثة باستمرار للبروتينات والحمض النووي والتي تشمل معظم الكائنات الحية. ويعتمد برنامج «BLAST» على تنسيق مفتوح المصدر، مما يتيح للجميع الوصول إليه ويمكّنهم من تغيير الكود البرمجي الخاص بالبرنامج مما أدى إلى إنشاء العديد من المشاريع الفرعية المشتقة من هذا المصدر. ويمكنك تحميل وتفحص البرنامج من هنا.[2]

أنواع برنامج BLAST

  • BLASTn: يقارن واحدًا أو أكثر من تسلسل النيوكليوتيدات بتسلسل النوكليوتيدات في قاعدة البيانات أو تسلسل واحد معين.
  • BLASTx: يقارن هذا البرنامج منتجات ترجمة ستة إطارات لتسلسل النوكليوتيدات ضمن الـ DNA بقاعدة بيانات تسلسل البروتين للعثور على الجين المسؤول عن إنتاج بروتين أو حمض أميني معين.
  • TBLASTn: وهو بعكس «BLASTX » ويستخدم لرسم خريطة للبروتين والحمض النووي المسؤول عنه.
  • BLASTp: يقارن تسلسلًا واحدًا أو أكثر من تسلسل البروتين بالتسلسلات ضمن قاعدة بيانات. مما يساعد في محاولة التعرف على بروتين معين.

يمكن استكشاف عدد من عمليات البحث ضمن البرنامج من هنا. [3]

أصبح «BLAST» أداة أساسية لعلماء الأحياء. حيث تسمح سرعته وحساسيته للعلماء بمقارنة تسلسل النيوكليوتيدات والبروتينات بالتسلسلات ضمن قواعد البيانات الكبيرة. وأصبح من المعتاد قراءة بحث في مجال علم الأحياء الحديث يحمل اسم «BLAST» كأداة مستخدمة. وقد سمحت «BLAST» وتطبيقاتها التابعة للعلماء بالتنبؤ بوظائف الجينات والبروتينات في الجينوم الكامل، والإجابة على أسئلة كان لا يمكن الإجابة عليها بالعمل المختبري فقط.

المصادر
[1] Berkley library
[2] BLAST NCBI
[3]
NCBI Github

 

 

 

 

 

 

سعدنا بزيارتك، جميع مقالات الموقع هي ملك موقع الأكاديمية بوست ولا يحق لأي شخص أو جهة استخدامها دون الإشارة إليها كمصدر. تعمل إدارة الموقع على إدارة عملية كتابة المحتوى العلمي دون تدخل مباشر في أسلوب الكاتب، مما يحمل الكاتب المسؤولية عن مدى دقة وسلامة ما يكتب.


غير مصنف

User Avatar

Hasan Abdulrahman

مهندس اختصاصي في الهندسة الطبية الحيوية ، مهتم بالبرمجة والذكاء الصنعي ودمجهما مع الطب.


عدد مقالات الكاتب : 21
الملف الشخصي للكاتب :

شارك في الإعداد :
تدقيق لغوي : abdalla taha

مقالات مقترحة

التعليقات :

اترك تعليق