Ad
هذه المقالة هي الجزء 14 من 17 في سلسلة مقدمة في علم البيانات وتطبيقاته

علم الجينوم هو أحد فروع علم الوراثة المتعلق بدراسة الجينوم، أي كامل المادة الوراثية داخل مختلف الكائنات الحية. وتتطابق الجينات بين كل الأفراد بنسبة ٩٩,٩٪ وتختلف في نسبة قليلة تجعل كل شخص فريدًا من نوعه. وجينات البشر تكون أقرب ما يمكن إلى حيوان الشمبانزي. علم البيانات الجينية هو علم يجمع بين البيولوجيا والإحصاء والكمبيوتر من أجل تمكين الباحثين من استخدام التقدم التكنولوجي في الكمبيوتر والإحصاء لاستكشاف المعلومات والوظائف الخاصة بالجينات.

حجم البيانات الجينية

قد تساعد الأبحاث الجينية في وجود من ٢ – ٤٠ إكسابايت من البيانات الجينية في العقد المقبل، وإكسابايت يساوي ١ مليون تيرابايت. وتصل كمية البيانات المتاحة حاليًا سنويا من ٢ – ٤٠ مليار جيجابايت، ويستغلها العلماء أفضل استغلال في الدراسة من أجل صحة الإنسان والأمراض. ولكن من الواجب أن يكون هناك أخلاقيات وقواعد تحكم للحفاظ على خصوصيات الأشخاص؛ حيث كل جين مرتبط بشخص يعبر عن العديد من الأشياء بالنسبة إليه. 

إذا أردت أن تتعلم علم البيانات الجينية، عليك بدراسة قوية في البيولوجيا والكمبيوتر والإحصاء. ولا يشترط أن تكون ملمًا بكل كبيرة وصغيرة في المجالات الثلاثة، ولكن على الأقل أن تكون حاصلًا على دراسة قوية في مجال منها وملمًا بما تحتاج إليه في مجال آخر، وبعدها قد تصل إلى راتب بمعدل ١١٠ ألف دولار سنويًا.

بداية علم البيانات الجينية

بدأ علم البيانات الجينية كمجال بحث ودراسة سنة ١٩٩٠م عن طريق الدمج بين:

  • استخلاص التسلسل الجيني من دراسة جينات الكائنات الحية. 
  • تحليل البيانات باستخدام الإحصاء والكمبيوتر في تحليل ورسم البيانات الجينية، وتتضمن الحصول على البيانات وتخزينها واستخدام الخوارزميات لتحليل البيانات الجينية للأشخاص. [2]

علم البيانات الجينية يُعتبر من البيانات الضخمة

كل خلية في جسم الإنسان تحتوي على نسختين من الجينات كاملة، يتكون جسم الإنسان من ترليونات الخلايا. البيانات الجينية لشخص واحد من الممكن أن تشكل ٢٠٠ جيجا بايت. وسنحتاج إلى تقريبًا ٤٠ إكسابايت لتخزين التسلسل الجيني عالميًا بحلول عام ٢٠٢٥م،  بما يعادل تقريبًا مليون قرص مدمج. ونظرًا لوجود هذا الكم الهائل من البيانات الجينية اعتبر هذا المجال من مجال البيانات الضخمة. 

كيف يدرس العلماء العلوم البيانات الجينية؟

يخترع العلماء أدوات تسهل دراسة الجينات اعتمادًا على التطور التكنولوجي في الكمبيوتر والإحصاء، من أهم هذه الأدوات:

  • أداة « aligners » لتحديد أين تقع كل قطعة من الترتيب الجيني للحمض النووي. 
  • أداة « Variant Callers » تتعرف على الأماكن المختلفة في التسلسل الجيني عن باقي التسلسلات الجينية العادية، هذه الاختلافات الجينية تختلف أحجامها فقد تكون حرف واحد من الحمض النووي في ما يعرف ب «single neuclotide polymorphism »، وقد تكون حروف متعددة وتعرف بإسم «Structural Variants». 

قد تكون هذه التغيرات بدون أخطار، وقد تكون سببًا لمشاكل وراثية نادرة كالسرطان أو أمراض أخرى شائعة. [1]

كيف يدير ويخزن الباحثون هذه الكمية الضخمة من البيانات؟

  1. استخدام برامج وأدوات الكمبيوتر والإحصاء. 
  2. اعتبار مراكز تحليل البيانات جزءًا أساسيًا من العمل. 
  3. دعم مالي كبير من المعاهد العلمية على سبيل المثال « NHGRI – المعهد الوطني لبحوث الجينوم البشري»، والذي بدوره يوفر أكثر من ١٢٥ مليون دولار سنويًا لدعم علم البيانات الجينية.
  4. جعل البيانات مفتوحة المصدر في المجتمع العلمي لتسهيل تحليل البيانات وتنظيم أفضل لها. 
  5. تقديم سُبل تعاون أفضل بين بعض المراكز الخاصة والتجارية والمعاهد الحكومية على سبيل المثال، المعهد الوطني للصحة بالولايات المتحدة من أجل توفير تخزين واستضافة البيانات بشكل أفضل وتعزيز الخصوصية. 

أخلاقيات مشاركة البيانات الجينية

  • معرفة المريض بمشاركة البيانات الجينية الخاصة به وإعطاءه معلومات واضحة عن  مدى درجة الخصوصية. 
  • عدم التعريف بالشخص مالك الجينات إلا في حالات الكشف عن المجرمين. 

كيف يتشارك الباحثون البيانات الجينية؟

يقسم العلماء مصادر البيانات الجينية إلى ٣ أنواع:

  1. مفتوحة المصدر: وهي النوع الأكثر انتشارًا، وتكون البيانات متاحة للعامة لأهداف بحثية. 
  2. تحتاج إلى تسجيل: يستطيع أن يصل إليها الباحثون، ولكن بعد تسجيل معلوماتهم وأعمالهم مع البيانات للموافقة. لذلك هي بين المفتوحه والمغلقة. 
  3. مغلقة المصدر: عرض الطلب على لجنة وقد توافق عليه لغرض البحث أو لا توافق، ولكن يظل الباحثون فقط هم الذين لديهم القدرة على الوصول إلى هذه البيانات. [1]

أهم المجالات المرتبطة بعلم البيانات الجينية

يحاول العلماء والباحثون اختراع أدوات تتعرف على الاختلافات في التسلسل الجيني وربطها بالمعلومات الطبية مثل:

  • اكتشاف عوامل خطورة لمرضٍ ما. 
  • استخدام جديد لدواء معين.
  • استخدم الباحثون الذكاء الاصطناعي لتطوير البيانات الجينية للأغراض الإكلينيكية.

فما هو الاختلاف الجيني؟

يمتلك كل شخص ٦ مليار جين ويوجد اختلافات بسيطة بين الأفراد، بعض الاختلافات من الممكن أن تكون عامل خطورة لمرض معين وبعضها يقلل خطر مرضٍ ما وهناك ما ليس لها تأثير. 

وتنقسم هذه الأمراض الجينية  إلى نوعين:

  •  نوع مرتبط بتغير جين واحد على سبيل المثال « Cystic Fibrosis – التليف الكيسي » وهو اضطراب وراثي يسبب تلفًا شديدًا في الرئتين والجهاز الهضمي والأعضاء الأخرى في الجسم. ويحدث بسبب اختلاف في الجين الذي يعمل على تشفر بروتين منظم الإيصالية عبر الغشاء في التليف الكيسي (CFTR)
التليف الكيسي جينيًا
https://www.genome.gov/Health/Genomics-and-Medicine/Polygenic-risk-scoresالتليف الكيسي جينيًا
  • نوع مرتبط باختلافات جينية كثيرة بالإضافة إلى عوامل بيئية مثل نظام الغذاء والنوم والضغط والتوتر والتدخين. وتصل هذه الاختلافات الجينية مثلًا إلى ٦٠ جين تقريبًا مختلف كما في الأشخاص المصابين بمرض تصلب الشريان التاجي. [3]
https://www.genome.gov/Health/Genomics-and-Medicine/Polygenic-risk-scores

«Polygenic Risk Score – درجة مخاطر الاختلافات الجينية المتعددة» 

يفحص العلماء كل الاختلافات الجينية في شخص ما ثم يسجلوا هذه المعلومات على الكمبيوتر، وباستخدام برامج الإحصاء والكمبيوتر المتقدمة يعملون على تقدير هذه الاختلافات إن كانت عامل مؤثر في مرض معين أم لا. 

وجود درجة اختلاف جيني ليس مؤكدًا على وجود مرض معين. فإذا افترضنا أن شخصًا لديه اختلاف جيني ولكنه يبلغ من العمر ٢٢ عامًا ويسير على نظام غذائي وصحي جيد،  وشخصًا آخر يبلغ من العمر ٦٠ عامًا ولا يمتلك نظامًا جيدًا في الغذاء والصحة ولديه اختلاف جيني، سيكون الشخص الثاني أكثر عرضة للمرض. ففي النهاية هي توضح علاقة ما وليست طريقة حسابات مؤكدة. [3]

مصادر

[1] National Human Genome Research Institute
[2] Springer link
[3] NHGRI

Hossam Gadallah
Author: Hossam Gadallah

صيدلي مهتم بتحليل البيانات في تطوير مستوى الصحة، ومهتم بالتكنولوجيا والإدارة.

سعدنا بزيارتك، جميع مقالات الموقع هي ملك موقع الأكاديمية بوست ولا يحق لأي شخص أو جهة استخدامها دون الإشارة إليها كمصدر. تعمل إدارة الموقع على إدارة عملية كتابة المحتوى العلمي دون تدخل مباشر في أسلوب الكاتب، مما يحمل الكاتب المسؤولية عن مدى دقة وسلامة ما يكتب.


طب صحة أحياء تقنية

User Avatar

Hossam Gadallah

صيدلي مهتم بتحليل البيانات في تطوير مستوى الصحة، ومهتم بالتكنولوجيا والإدارة.


عدد مقالات الكاتب : 46
الملف الشخصي للكاتب :

مقالات مقترحة

التعليقات :

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *