مشروع جينوم الأرض الحيوي: تسلسل الحياة من أجل مستقبلها
لماذا يجب الحفاظ على مكتبة جينوم الأرض الكاملة في سفينة المعرفة
أُعد لمبادرة سفينة المعرفة (arkive.su). مارس 2026.
مقدمة: لماذا نقوم بتسلسل جميع أشكال الحياة على الأرض؟
في عام 2018، أطلق المجتمع العلمي الدولي أحد أكثر المشاريع طموحًا في تاريخ علم الأحياء: مشروع جينوم الأرض الحيوي (Earth BioGenome Project - EBP) — وهو مبادرة لتسلسل وفهرسة وتوصيف جينومات جميع الأنواع حقيقية النواة الموصوفة على الكوكب. يشمل ذلك حوالي 1.67 مليون نوع — من الطحالب المجهرية إلى الحيتان الزرقاء، ومن فطريات التربة إلى أشجار السيكويا التي تعود لآلاف السنين.
إذا كان مشروع الجينوم البشري، الذي اكتمل في عام 2003، قد فك الشفرة الجينية لنوع واحد فقط بتكلفة 6 مليارات دولار، فإن مشروع جينوم الأرض الحيوي يهدف إلى القيام بذلك لجميع الأنواع حقيقية النواة. التكلفة التقديرية هي 3.9 مليار دولار، وهي أقل من التوقعات الأولية بفضل الانخفاض السريع في تكاليف تكنولوجيا التسلسل.
مشروع جينوم الأرض الحيوي ليس مختبرًا واحدًا بل هو "شبكة من الشبكات": أكثر من 2200 عالم في 88 دولة، متصلون من خلال أكثر من 61 مشروعًا تابعًا. يتم تنسيق العمل من جامعة ولاية أريزونا (السكرتارية) بمشاركة أكبر مراكز التسلسل في العالم.
بالنسبة لـ مبادرة سفينة المعرفة، تمثل بيانات مشروع جينوم الأرض الحيوي قيمة استثنائية: إنها مخطط جزيئي كامل للمحيط الحيوي للأرض — فهرس للحلول التنظيمية التي طورها التطور على مدى 4 مليارات سنة. إن فقدان هذه البيانات سيكون خسارة لا يمكن تعويضها لأي حضارة مستقبلية تحاول فهم الحياة أو الهندسة الحيوية أو استعادة الأنظمة البيئية المفقودة.
النطاق والتقدم الحالي
ينقسم المشروع إلى ثلاث مراحل:
- المرحلة التجريبية (2018-2020): وضعت المعايير والأطر الأخلاقية والمنهجيات.
- المرحلة الأولى (منذ 2021): تهدف إلى الحصول على جينوم مرجعي لكل عائلة من العائلات التصنيفية حقيقية النواة التي يبلغ عددها حوالي 10000 عائلة.
- المرحلة الثانية (بحلول 2030): تتضمن جمع عينات من 300000 نوع وتسلسل 150000 منها، مما يتطلب إنتاج 3000 جينوم مرجعي شهريًا — أي تسريع بمقدار عشرة أضعاف مقارنة بالمعدلات الحالية.
اعتبارًا من أوائل عام 2025، أصدرت المشروعات التابعة لـ EBP أكثر من 3300 تجميع جينومي عالي الجودة، تغطي أكثر من 500 عائلة حقيقية النواة. يتوفر أكثر من 3400 جينوم تلبي الحد الأدنى من معايير EBP (contig N50 >1 Mb, scaffold N50 >10 Mb، وأكثر من 95% من الجينوم في هياكل صبغية فائقة) في قواعد بيانات INSDC (International Nucleotide Sequence Database Collaboration). من بين هذه التجميعات، تم إنتاج 48% مباشرة من قبل المشروعات التابعة لـ EBP — مما يعني أن المشروع ينتج بالفعل ما يقرب من نصف جميع الجينومات عالية الجودة حقيقية النواة في العالم.
المشاركون الرئيسيون والمشاريع التابعة
أكبر مراكز التسلسل
- معهد ويلكوم سانجر (كامبريدج، المملكة المتحدة) — أكبر منتج منفرد للجينومات المرجعية. من خلال مشروع شجرة الحياة لداروين (DToL)، يقوم بتسلسل الأنواع الحيوانية والنباتية البريطانية بشكل منهجي؛ وقد تم تجاوز علامة 2000 جينوم. مدير برنامج شجرة الحياة — مارك بلاكستر. المصدر: darwintreeoflife.org.
- BGI (شنجن، الصين) — ثاني أقوى مركز تسلسل في العالم بمدى عالمي.
الاتحادات الإقليمية والتصنيفية
- أطلس الجينوم المرجعي الأوروبي (ERGA): الشريك الأوروبي لـ EBP، الذي ينسق إنتاج الجينومات المرجعية للتنوع البيولوجي الأوروبي. مشروع BioProject الشامل: PRJEB43510. المصدر: erga-biodiversity.eu.
- مشروع جينوم الفقاريات (VGP): مشروع بقيادة إريك جارفيس (جامعة روكفلر)، يهدف إلى الحصول على جينومات مرجعية لجميع أنواع الفقاريات. المصدر: vertebrategenomesproject.org.
- مشروع جينوم أفريقيا الحيوي (AfricaBP): مبادرة لتسلسل التنوع البيولوجي الأفريقي مع التركيز على تطوير الخبرات في القارة. بحلول عام 2025، عُقدت 45 ورشة عمل، وشارك فيها 5000 مشارك من 75 دولة، وتم تدريب 545 باحثًا أفريقيًا.
- مبادرة كتالونيا لمشروع جينوم الأرض الحيوي (CBP): مشروع إقليمي لفهرسة جينومات التنوع البيولوجي الكتالوني. BioProject: PRJEB49670.
- مبادرة i5k: تسلسل جينومات 5000 نوع من مفصليات الأرجل.
- B10K: مشروع لتسلسل جينومات جميع أنواع الطيور على الأرض.
- EBP-Nor (النرويج): تسلسل جميع الأنواع حقيقية النواة في النرويج، بما في ذلك الأنواع القطبية. المصدر: ebpnor.org.
القائمة الكاملة للمشاريع التابعة: earthbiogenome.org/affiliated-project-networks.
قيادة المشروع
هاريس ليوين (جامعة ولاية أريزونا) — أحد مهندسي ومؤسسي EBP، ورئيس السكرتارية. جين إي. روبنسون (جامعة إلينوي) و و. جون كريس (مؤسسة سميثسونيان) — المبادرون بالمشروع. بيث شابيرو (جامعة كاليفورنيا سانتا كروز) و فيديريكا دبيالما (جينوم بريتيش كولومبيا) — أعضاء رئيسيون في القيادة العلمية للمرحلة الثانية.
خط الإنتاج التقني: من الميدان إلى قاعدة البيانات
جمع العينات
يتطلب التسلسل المرجعي أنسجة طازجة ذات حمض نووي سليم عالي الوزن الجزيئي. الإجراء المعياري: يتم تجميد العينة في النيتروجين السائل (-196 درجة مئوية) في الظروف الميدانية أو بأسرع ما يمكن بعد الجمع وتخزينها في درجة حرارة -80 درجة مئوية. يتم تعيين معرف فريد لكل عينة يسمى ToLID (معرف شجرة الحياة) — وهو معرف يضمن التتبع من العينة إلى التجميع الجينومي. يتم إيداع عينة مادية كمرجع في مجموعات المتاحف. تشمل البيانات الوصفية: إحداثيات GPS، تاريخ الجمع، البيئة، طريقة التثبيت، واسم الجامع.
التسلسل
التقنيات الحالية (اعتبارًا من 2024-2025): تسلسل القراءة الطويلة على منصات Pacific Biosciences (دقة >99.9%، طول القراءة 10-20 كيلو قاعدة) و Oxford Nanopore Technologies (دقة متوسطة إلى عالية على كيمياء R10.4، طول يصل إلى 1000 كيلو قاعدة). لتجميع القراءات في هياكل صبغية، يتم استخدام Hi-C — وهي طريقة لتثبيت الكروماتين تسمح بتحديد الموقع النسبي لشظايا الجينوم. تبلغ تكلفة الجينوم المرجعي الذي تبلغ مساحته حوالي 1 جيجابايت حوالي 5000 دولار من التكاليف المباشرة؛ التكلفة المستهدفة للمرحلتين الثانية والثالثة هي 800 دولار لكل نوع.
التجميع ومراقبة الجودة
معايير EBP للتجميع المرجعي: contig N50 >1 Mb, scaffold N50 >10 Mb، وأكثر من 95% من الجينوم في هياكل صبغية فائقة. يتم تقييم الاكتمال باستخدام BUSCO (أكثر من 90% من الجينات ذات النسخة الواحدة)، والدقة على مستوى القواعد باستخدام Merqury. تشمل خطوط التجميع verkko و hifiasm.
التوصيف (Annotation)
التوصيف هو عملية تعيين المعنى البيولوجي لتسلسل الجينوم: تحديد حدود الجينات (الإكسونات والإنترونات)، العناصر التنظيمية، التكرارات، والجينات الكاذبة. يتضمن التوصيف الوظيفي تحديد الوظيفة المحتملة لكل جين من خلال التماثل مع الجينات المعروفة وتعيين مصطلحات معيارية (Gene Ontology). خدمات التوصيف المركزية هي Ensembl (EMBL-EBI) و RefSeq (NCBI). يتم توفير التوصيفات بتنسيق GFF3 ويجب أن تكون مفتوحة بالكامل (CC0 / ملكية عامة). كما أصدر NCBI أداة EGAPx — وهو خط توصيف جينوم حقيقي النواة مفتوح متاح للاستخدام المستقل (github.com/ncbi/egapx).
إيداع البيانات
يتم إيداع جميع بيانات EBP في INSDC — وهي ثلاث قواعد بيانات متطابقة: GenBank (NCBI، الولايات المتحدة)، وأرشيف النوكليوتيدات الأوروبي (ENA, EMBL-EBI)، وبنك بيانات الحمض النووي الياباني (DDBJ). القراءات الخام توضع في أرشيف قراءات التسلسل (SRA). التجميعات تحصل على رقم GCA. التسلسل الهرمي للمشاريع: EBP الشامل (PRJNA533106) ← المظلات الإقليمية (ERGA: PRJEB43510, DToL: PRJEB40665، إلخ) ← المشاريع الوطنية/التصنيفية ← الأنواع الفردية. يتم تتبع التقدم من خلال Genomes on a Tree (GoaT) (goat.genomehubs.org)، وهو نظام بيانات وصفية لـ 1.5 مليون نوع حقيقي النواة.
البيانات المفتوحة: المبادئ والأهمية
بُني EBP على مبدأ الانفتاح التام للبيانات. تلتزم جميع المشاريع التابعة بإيداع التجميعات الجينومية مع البيانات الخام في INSDC مع فترة حظر لا تتجاوز عامًا واحدًا. جميع التوصيفات هي CC0 أو ملكية عامة، بدون قيود على الاستخدام الإضافي. يتم نسخ البيانات يوميًا بين المراكز الثلاثة لـ INSDC في ثلاث قارات (أمريكا الشمالية، أوروبا، اليابان).
يعد GenBank أكبر قاعدة بيانات عامة لتسلسلات النوكليوتيدات، وقد احتوى بحلول فبراير 2026 على 51.56 تريليون زوج من القواعد في 6.12 مليار سجل لـ 581 ألف نوع. وتعمل INSDC منذ عام 1982 على مبادئ الوصول الحر وغير المحدود، وهي واحدة من أقدم الأمثلة على البنية التحتية العلمية المفتوحة في العالم.
كما يتخذ EBP موقفًا مبدئيًا من براءات الاختراع: المشروع يعارض تسجيل براءات اختراع لتسلسلات مرجعية، ويعتبرها ملكية عامة.
لماذا تعد بيانات EBP بالغة الأهمية لسفينة المعرفة
مبادرة سفينة المعرفة (arkive.su): مشروع للحفاظ على معرفة البشرية على المدى الطويل باستخدام تقنيات تخزين بيانات فائقة المتانة (الخزف، بلورات الكوارتز، إلخ). تمثل البيانات الجينومية لـ EBP واحدة من أكثر فئات المعلومات قيمة للأرشفة للأسباب التالية:
استحالة تعويض المعلومات
الأنواع آخذة في الانقراض. وفقًا لتقديرات الصندوق العالمي للطبيعة (WWF)، انخفضت أعداد الحيوانات البرية التي يتم رصدها بنسبة 73% منذ عام 1970. وبحلول عام 2050، قد يختفي 30-50% من جميع أنواع الحيوانات. كل نوع يُفقد قبل التسلسل يمثل خسارة لا رجعة فيها لمعلومات طورتها المليارات من السنين من التطور. كل جينوم يحتوي على حلول فريدة للتكيف: إنزيمات، مسارات استقلابية، ومخططات تنظيمية لا يمكن استعادتها بعد الفقدان.
الضغط والاكتفاء الذاتي للبيانات
البيانات الجينومية مثالية للتخزين طويل المدى. الجينوم المرجعي لنوع واحد هو تسلسل من أربعة أحرف (A, T, G, C) بحجم يتراوح من عشرات الميجابايت إلى عدة جيجابايت. في شكل مضغوط، يمكن أن يتسع كتالوج EBP بالكامل المكون من 1.67 مليون نوع في بضعة بيتابايت. تنسيق البيانات بسيط وموثق ذاتيًا: FASTA للتسلسلات، و GFF3 للتوصيفات — وهي ملفات نصية يمكن لأي حضارة مستقبلية قراءتها.
القيمة العملية للأجيال القادمة
المكتبة الجينومية الكاملة هي:
- أ) أساس لعلم الأحياء التركيبي واستعادة الأنواع المنقرضة (de-extinction)؛
- ب) كتالوج للحلول البروتينية للتكنولوجيا الحيوية (إنزيمات، مضادات حيوية، نواتج استقلابية)؛
- ج) مجموعة بيانات تدريبية لنماذج الذكاء الاصطناعي في علم الأحياء (protein language models, genomic foundation models)؛
- د) مرجع لتشخيص الأمراض، التربية، والمراقبة البيئية.
حتى لو لم نتمكن من التنبؤ بتطبيقات محددة، فإن قيمة الكتالوج الكامل للمعلومات البيولوجية ستزداد مع مرور الوقت.
توصيات الأرشفة
بالنسبة لسفينة المعرفة، يُنصح بحفظ بيانات EBP الجينومية على عدة مستويات: 1) التجميعات المرجعية الكاملة (FASTA، مستوى الكروموسوم)؛ 2) التوصيفات (GFF3)؛ 3) البيانات الوصفية (BioSample, BioProject)؛ 4) المنشورات العلمية الرئيسية التي تصف منهجية المشروع ومعاييره.
التخزين المادي للمواد الحيوية: البنوك المبردة العالمية
بالإضافة إلى البيانات الرقمية، يلعب الحفاظ على المواد الحيوية المادية (خلايا حية، أنسجة، أمشاج، بذور) دورًا حيويًا. هذا مستوى إضافي من التأمين: يمكن استخراج المعلومات التي لا نعرف كيف نقرأها بعد من الخلايا الحية، أو استعادة الكائن الحي بتقنيات المستقبل.
- Frozen Zoo® (تحالف حديقة حيوان سان دييغو للحياة البرية، الولايات المتحدة): أكبر بنك مبرد للخلايا الحية للحيوانات البرية في العالم، يضم أكثر من 11000 خط خلوي حيوي من أكثر من 2200 فرد. تأسس عام 1972. في عام 2020، تم استنساخ مهر من خيول برزوالسكي، كيرت، من خلايا مجمدة عام 1980 — مما أكد حيوية الخلايا بعد 40 عامًا من التخزين.
- Nature’s SAFE (حديقة حيوان تشستر، المملكة المتحدة): أحد أكبر البنوك الحيوية في أوروبا، بالشراكة مع حدائق الحيوان المعتمدة.
- Millennium Seed Bank (حدائق كيو، المملكة المتحدة): أكبر بنك لبذور النباتات البرية في العالم، تخزن البذور في درجة حرارة -20 مئوية.
- Svalbard Global Seed Vault (سفالبارد، النرويج): قبو احتياطي في التربة الصقيعية، للمحاصيل الزراعية بشكل أساسي.
تتراوح تكلفة الحفظ المبرد لعينة واحدة من 42 دولارًا إلى 1500 دولار (لمرة واحدة)، و1-2 دولار سنويًا للصيانة. وتكمن نقطة الضعف الحرجة في الاعتماد على إمدادات الطاقة والنيتروجين السائل. وهذا ما يجعل مهمة حفظ البيانات رقميًا على وسائط فائقة المتانة (الخزف، الكوارتز) مهمة استراتيجية.
علم الجينوم والذكاء الاصطناعي: إمكانات التآزر
تخلق مكتبة جينوم EBP الكاملة مجموعة بيانات تدريبية غير مسبوقة لنماذج الذكاء الاصطناعي في علم الأحياء. أظهر AlphaFold (DeepMind، جائزة نوبل في الكيمياء 2024) أن التنبؤ ببنية البروتين ممكن من التسلسلات وحدها. عندما يتم تغذية هذه النماذج ببيانات لأكثر من 1.5 مليون نوع بدلاً من بضعة آلاف — ستكون قفزة نوعية تماثل الانتقال من GPT-2 إلى GPT-4 في النماذج اللغوية.
المنشورات العلمية الرئيسية
- Lewin H. A. et al. (2018). «Earth BioGenome Project: Sequencing life for the future of life.» PNAS, 115(17), 4325–4333.
- Lewin H. A. et al. (2022). «The Earth BioGenome Project 2020: Starting the clock.» PNAS, 119(4).
- Blaxter M. et al. (2025). «The Earth BioGenome Project Phase II.» Frontiers in Science, 3.
الموارد وقواعد البيانات الرئيسية
خاتمة
مشروع جينوم الأرض الحيوي هو محاولة لإنشاء مكتبة رقمية كاملة للحياة حقيقية النواة على الأرض قبل فقدان جزء كبير منها. بالنسبة لـ سفينة المعرفة، تعد بيانات EBP واحدة من أعلى أولويات الأرشفة.
وكما هو مكتوب في معرض Frozen Zoo® في سان دييغو: "يجب عليك جمع الأشياء لأسباب لا تفهمها بعد". نحن نجمع لأن الفهم يأتي لاحقًا. ولكن ما يُفقد يُفقد للأبد.
أُعد كجزء من مبادرة سفينة المعرفة (arkive.su). مارس 2026.