نهج التصنيف الترادفي لتوطين المتنبئين المورفولوجي لعمر C. Elegans والحركة

Sep 26, 2022

الرجاء التواصلoscar.xiao@wecistanche.comللمزيد من المعلومات


الملخص

يعتبر C. elegans كائنًا نموذجيًا راسخًا لدراسة التأثيرات الوراثية والأدوية على الشيخوخة ، وكثير منها محفوظ في البشر. وهو أيضًا نموذج أساسي للبحث الأساسي ، وتعد أمراض C. elegans مجالًا ناشئًا حديثًا. نحن هنا نطور منصة قائمة على أساس الشبكة العصبية التلافيفية لإثبات المبدأ لتقسيم C. ايليجانس واستخراج الميزات التي قد تكون مفيدة للتنبؤ مدى الحياة. نستخدم مجموعة بيانات مكونة من 734 دودة تم تتبعها طوال حياتها وتصنيفها إلى طويلة العمر وقصيرة العمر. لقد صممنا WormNet- وهي شبكة عصبية تلافيفية (CNN) للتنبؤ بفئة عمر الدودة استنادًا إلى صور صغار البالغين (اليوم 1- البالغون من العمر 3 أيام) وأظهرنا أن WormNet ، أيضًا ، يمكن لـ InceptionV3 CNN تصنيف العمر بنجاح. استنادًا إلى بنية U-Net ، نقوم بتطوير HydraNet CNNs التي تسمح بتقسيم الديدان بدقة إلى الأجزاء الأمامية والمتوسطة والخلفية. نحن نجمع بين تجزئة HydraNet ، وتنبؤ WormNet ، ونهج خريطة تنشيط الفئة لتحديد القطاعات الأكثر أهمية لتصنيف مدى الحياة. يُظهر نهج التصنيف الترادفي هذا أن الجزء الخلفي من الدودة قد يكون أكثر أهمية لتصنيف الديدان طويلة العمر. يمكن أن يكون نهجنا مفيدًا لتسريع اكتشاف الأدوية المضادة للشيخوخة ودراسة أمراض الربداء الرشيقة.

KSL03

الرجاء الضغط هنا لمعرفة المزيد

المقدمة

الديدان الخيطية Caenorhabditis elegans (C. elegans) هي نموذج راسخ لدراسة التدخلات المختلفة في عملية الشيخوخة ، والتي سمحت بالعثور على العديد من الجينات والأدوية التي تتداخل مع الشيخوخة. 5 من 7 من المستوى 1 و 4 من أصل 6 من الأدوية المضادة للشيخوخة من المستوى 2 التي تم اعتبارها للتجارب البشرية ، تعمل على إطالة العمر الافتراضي في نموذج C. elegans.cistanche แอ ม เว ย์هناك العديد من مسارات الشيخوخة المحفوظة بين الأنواع ومن المتوقع أن يتم استخدام الديدان على نطاق واسع ليس فقط في أبحاث طول العمر ولكن أيضًا في ظهور صناعة مكافحة الشيخوخة [1]. بالإضافة إلى ذلك ، يتم الآن استخدام الديدان المتوافقة مع البشر لإنشاء نماذج واعدة للتنكس العصبي [2]. ومع ذلك ، على عكس جينات طول العمر ، لم يتم دراسة الأنماط الظاهرية للشيخوخة من C. elegans جيدًا حتى الآن. على وجه الخصوص ، لا نعرف سوى القليل عن الأمراض المرتبطة بالعمر وتطورها ، وكذلك عن الأمراض التي تحدد العمر وكيف تسبب الوفاة [3]. تم وصف العديد من الأمراض مؤخرًا بما في ذلك ضمور الأمعاء وأورام الرحم والتهاب البلعوم [4-6]. في ضوء ذلك ، فإن اكتشاف أمراض جديدة من الرشيقة الرشيقة ، وخاصة تحديد العمر الافتراضي ، أصبح تحديًا مهمًا. قد تساعد دراسة الأمراض في C. elegans في الحصول على فهم أفضل لعملية الشيخوخة ، وكذلك آليات وتأثيرات الأدوية المضادة للشيخوخة.

KSL04

يمكن cistanche مكافحة الشيخوخة

قد تساعد التطورات الحديثة في التعلم الآلي (ML) والتعلم العميق (DL) [7] في دراسات الشيخوخة التي تستخدم C.elegans من خلال الكشف عن الأنماط السلوكية والمورفولوجية غير المرئية سابقًا وتلخيصها في مجموعات البيانات التجريبية الكبيرة. على سبيل المثال ، في عمل حديث تم قياس العديد من المعلمات الفسيولوجية طوليًا وسمح تطبيق انحدار ناقل الدعم بتفسير مقدار التباين المختلف في عمر C. elegans من خلال: الحركة (57 بالمائة) ، المقطع العرضيتألق ذاتي (52 بالمائة) ، معدل زرع البويضات (28 بالمائة) [8]. ومن المثير للاهتمام ، أنه وجد أن حجم الحضنة يرتبط بعمر الخنثى في التزاوج (ص=0. 28) [9]. علاوة على ذلك ، تؤكد الدراسات المستقلة أن وظيفة العضلات هي على الأرجح أفضل ميزة فسيولوجية للتنبؤ: تم العثور على مدى ضخ سريع للبلعوم (r =0. 49) ، ومدى ضخ البلعوم (r =0. 83). ترتبط ارتباطا وثيقا بطول العمر [10]. أيضًا ، تتنبأ السرعة القصوى في اليوم 9 [11] ومعدل تضاؤل ​​السرعة (الأيام 3-9) [12] بنسبة 71 بالمائة و 91 بالمائة من التباين في العمر وفقًا لذلك. كما تم اكتشاف تنبؤات خلوية وجزيئية لطول عمر C. elegans. تم العثور على تعبير hsp -16. 2 الناجم عن الصدمة الحرارية في اليوم الأول من البالغين مرتبطًا بعمرهم [13]. خالٍ من التأثيرات المربكة للتدخلات مثل الصدمة الحرارية ، يرتبط التعبير القاعدية للحمض -3 في اليوم 9 أيضًا بعمر (ص=0. 57) ، والذي ربما يعكس الاستجابة للأغذية المسببة للأمراض [14]. يمكن أن يكون تعبير Mir -71 من اليوم الرابع فصاعدًا تنبؤيًا بدرجة عالية ويفسر 47 بالمائة من التباين في العمر [15]. اللافت للنظر أن الارتباط العكسي القوي (ص =-0 93) بين الحجم النووي (يقاس في اليوم الأول) وطول العمر يشير إلى تخليق البروتين غير المنظم كمكون مهم للشيخوخة [16]. تجدر الإشارة إلى أنه في وقت مبكر تم تطبيق نهج Machine Vision أيضًا لتصنيف الأنماط الظاهرية الشيخوخة في C. elegans. على وجه الخصوص ، تم استخدام المصنف المميز الخطي لفصل صور البلعوم من مختلف الأعمار من أجل التوصيف الجزيئي اللاحق [17].

KSL05

من بين الطرق الأخرى ، يعد استخدام الشبكات العصبية التلافيفية (CNN) [18] أحد أقوى أساليب التعلم الآلي ، خاصةً لتحليل الصور ، المستوحاة من تنظيم الشبكة العصبية للقشرة البصرية. سمحت CNN بتحقيق نتائج رائعة في التعرف على الصور ، مع أداء شبه بشري على مجموعة بيانات MNIST وتفوق أداء البشر على التعرف على إشارات المرور بمعامل اثنين [19]. أظهرت CNN مرارًا وتكرارًا أفضل أداء خلال "تحدي التعرف المرئي على نطاق واسع على ImageNet" في تصنيف الصور [20 ، 21].كم cistanche لاتخاذأدى إدخال الاتصالات التي تم تخطيها إلى CNN إلى تحسين سرعتها ودقتها بشكل كبير ، وأصبحت شبكات CNN المتبقية الآن من أحدث التقنيات لتصنيف الصور [22 ، 23]. تتفوق الشبكات المتبقية في وحدة فك التشفير مثل U-Net [24] و V-Net و Tiramisu أيضًا على طرق استخراج الحدود التقليدية والعتبة والطرق القائمة على المنطقة المستخدمة في مجال تجزئة الصور الطبية [25]. على الرغم من النتائج المذهلة مع مناهج DL ، فإن أحد العوائق الرئيسية هو أن شبكات DL عبارة عن صناديق سوداء لذلك يصعب الحصول على الميزات المهمة لاتخاذ القرار من قبل الشبكة [26]. للتحايل على هذا القصور ، تم اقتراح العديد من تقنيات الملوحة [27-29]. أحد هذه الأساليب هو استخدام متوسط ​​طبقة التجميع العالمية لإنتاج ما يسمى بخريطة تنشيط الفئة (CAM) وتحديد مناطق الصور الخاصة بالفئة بطريقة غير خاضعة للإشراف [30]. يمكن للسمات العميقة القابلة للترجمة العامة المنتجة أن تساعد الباحثين في فهم أساس التمييز الذي تستخدمه شبكات CNN في مهامهم. ومع ذلك ، حتى الآن ، لم يتم تطوير أي نهج للجمع بين تجزئة الصورة ذات المغزى البيولوجي وتصنيف الملوحة لتسهيل اكتشاف النمط الظاهري من خلال التفسير.

KSL06

بشكل ملحوظ ، تم استخدام CNN مؤخرًا للتنبؤ بعمر الديدان. في الورقة الأولى ، تم استخدام مجموعة بيانات من 913 صورة من C. elegans. كل نقطة زمنية (اليوم) بها ما لا يقل عن 3 0 ديدان ، وتم تخديرهم جميعًا قبل التصوير. حققت العمارة القائمة على InceptionResNetV 2- متوسط ​​خطأ مطلق (MAE) قدره 0. 96 يومًا في وضع الانحدار ، ودقة قدرها 57.6 بالمائة في وضع التصنيف [31]. في عمل آخر ، استخدم المؤلفون نظام تصوير أوتوماتيكي قادر على تتبع نفس الدودة طوال العمر الافتراضي ، لذلك لديهم بيانات لـ 734 دودة تم التقاط صور لها كل 3.5 ساعة. استخدموا U-Net لتقسيم الديدان من الخلفية ثم أجروا انحدار تنسيق جسم الدودة لإنشاء تمثيلات دودة مستقيمة. ثم استخدموا ResNet34 المعدل وتمكنوا من تراجع عمر الدودة مع حد أدنى من MAE يبلغ 0.6 يوم للصور الأولية [32].

استخدمنا هنا نفس مجموعة البيانات كما في [8 ، 32] ، ولكن بدلاً من التنبؤ بعمر كل دودة ، قمنا بتطوير نظام أساسي قائم على شبكة CNN أطلقنا عليه اسم WormNet القادر على تصنيف الشباب (اليوم 1-3) إلى فئة قصيرة العمر وطويلة الأمد ، وكذلك تصميم نهج لاستخراج السمات المهمة لمثل هذا التصنيف. وبالمثل ، قمنا بتطبيق WormNet لتصنيف حركة C. elegans. لتفسير نتائج التصنيف بطريقة التصميم الثانوي ، قمنا بمرافقة تصنيف CNN بتجزئة ترادفية CNN. لهذا الغرض ، ابتكرنا بنية جديدة قائمة على U-Net (HydraNet) لتقسيم الديدان من الخلفية وأيضًا تقسيم جسم الدودة إلى أجزاء أمامية ومنتصف الجسم وأجزاء خلفية. تم تحقيق تفسير نتائج التصنيف من خلال اتحاد تجزئة HydraNet وخرائط تنشيط الفئة التي تم إنشاؤها باستخدام WormNet. سمحت لنا تحليلات خرائط تنشيط الفصل جنبًا إلى جنب مع تجزئة أجزاء الجسم بهذه الطريقة الترادفية باستخراج الميزات المسؤولة عن التنبؤ بالعمر. أخيرًا ، باستخدام نسخة مجزأة عالية الدقة من صور C. elegans ، قمنا بالتحقق من نتائجنا في سعة تعبيرية أعلى متبقية CNN InceptionV3 مصحوبًا بتفسير يدوي.

النتائج

تم استخدام بيانات الفاصل الزمني لـ 734 درجة مئوية. لتطوير نهج للتفسير الآلي لهذه الصور ، قمنا بمعالجة مشكلة تقسيم الديدان من خلفيتها ، وكذلك التمييز بين الأجزاء المورفولوجية للديدان (الشكل 1). لهذا ، قمنا يدويًا بتعليق 13 0 صورة للديدان البالغة بأقنعة للأجزاء الأمامية والمتوسطة والخلفية من الدودة وتلخيصها إلى قناع دودة كامل (الشكل 1F -1 H). تم بعد ذلك تقسيم مجموعة البيانات هذه إلى القطار (9 0) واختبار (4 0) الكسور بناءً على معرف مجموعة البيانات لدودة فردية للتأكد من أن ميزات الدودة الفردية لن تتسرب إلى الاختبار- خارج. أولاً ، لمعالجة مشكلة تجزئة الدودة الكلية ، قمنا ببناء بنية ضحلة نسبيًا تشبه U-Net [24] مصحوبة برأس سيني للتصنيف الثنائي. من أجل الوضوح ، يتم عرض أجزاء التشفير وفك تشفير U-Net في الشكل lA على شكل a و. تم تغيير حجم الصور الأولية إلى 96 × 96 بكسل لتحقيق الكفاءة الحسابية. استخدمنا وظيفة فقدان النرد ومراقبة مؤشر Jaccard لتقييم جودة التجزئة. في هذه المشكلة البسيطة نسبيًا للتجزئة ، وصل مؤشر Jaccard إلى 0.97 في كل من كسور القطار والاختبار (الشكل 1A ، 1B ، انظر المواد والطرق لمعلمات التشعب المفصلة). بعد ذلك ، لتوسيع هذا النهج ليشمل تقسيم أجزاء الجسم الفردية من C. elegans ، قمنا بإعادة صياغة المشكلة كتقسيم متعدد الفئات بأقنعة مشفرة واحدة ساخنة وبنية مشابهة على شكل U-Net (الشكل 1C ، 11). مما لا يثير الدهشة ، نظرًا لأن التصنيف متعدد الفئات يمثل مشكلة أصعب ، فقد أدى ذلك إلى أداء أسوأ بمقدار 0.92 و 0.91 من مؤشر Jaccard على جزء القطار والاختبار على التوالي مما يشير إلى زيادة طفيفة في التجهيز.

من اللافت للنظر ، أن أحد جوانب U-Net متعددة الفئات لم يكن أداءً جيدًا وهو التمييز بين الأجزاء الأمامية والخلفية من الدودة مما أدى إلى إنشاء أقنعة متداخلة (الشكل 1). للتحايل على هذا القيد ، قمنا بتصميم بنية بديلة باستخدام U-Net a وأجزاء ، مع أجزاء متعددة مخصصة لكل منها لمشكلة التجزئة الثنائية الخاصة بها (الشكل 1D ، 1E) ، والتي أطلقنا عليها اسم HydraNet. هذا النهج يخلق بنية مدربة بشكل مشترك مع طبقات إدخال مشتركة وطبقات مخصصة لكل جزء من الأجزاء المورفولوجية من الدودة ، مما يسمح بالحصول على نموذج من طرف إلى طرف ، مع حل مشكلة تصنيف ثنائية أبسط. تم تجهيز HydraNet3 بثلاثة أجزاء مخصصة للأجزاء الأمامية والمتوسطة والخلفية من جسم الدودة. تم تجهيز HydraNet4 ، بدوره ، بأربعة أجزاء مخصصة للأجزاء الأمامية والمتوسطة والخلفية بالإضافة إلى جسم الدودة بالكامل. لتقدير الأداء المشترك لـ HydraNet ، قمنا بقياس مؤشر Jaccard لكل جزء على حدة وقمنا أخيرًا بتقييم متوسط ​​مؤشر Jaccard. بشكل ملحوظ ، حقق كل من HydraNet3 و HydraNet4 متوسط ​​مؤشر Jaccard 0. 97 في كل من كسور القطار والاختبار مما يدل على التعميم الجيد (الشكل 1D ، IE ، 1J ، 1K). تجدر الإشارة إلى أن HydraNet4 حققت التحويل في وقت سابق عن HydraNet3 (الشكل 1D ، الأشكال الداخلية IE) مما يشير إلى تأثير إيجابي محتمل من مرافقة الهندسة المعمارية بفئة دلالية أكثر عمومية.

بعد ذلك ، للحصول على المصنفات لحركة C. elegans أو العمر الافتراضي ، قمنا بتقسيم جميع الديدان الـ 734 إلى فئتين إجماليتين لمقدار الحركة: الحركة المنخفضة أو العالية المقدرة على أنها حركة أعلى أو أقل من متوسط ​​المسافة التي تم الزحف إليها خلال فترة الحياة ؛ و 2 فصول العمر الافتراضي: "قصير الأجل" بعمر 7 أيام أو أقل ، و "طويل العمر" بعمر 8 أيام وأكثر. كانت المهمة هي التنبؤ بالفصول الدراسية بناءً على صور اليوم الأول أو اليوم الثاني أو اليوم الثالث. نظرًا لأن مجموعة البيانات صغيرة نسبيًا ، فقد يؤدي استخدام بنيات ذات سعة تعبيرية عالية إلى زيادة التجهيز. لذلك ، قمنا بتصميم شبكة CNN ضحلة نسبيًا أطلقنا عليها اسم WormNet. تتكون هذه البنية من 5 طبقات تلافيفية ، يتبع كل منها طبقة تجميع قصوى. تم تنفيذ التسرب والتطبيع الدفعي لكل طبقة تلافيفية في الشبكة العصبية لتحسين التعميم.ما هو الكفالةتم تسوية آخر طبقة تجميع كحد أقصى وربطها بطبقة متصلة بالكامل متبوعة بطبقة softmax. استخدمنا الانتروبيا الثنائية كدالة خسارة. استخدمت جميع الطبقات ، باستثناء الأخيرة ، وحدة خطية مصححة (ReLU) كوظيفة تنشيط (الشكل 2 أ ، انظر المواد والطرق للحصول على معلمات تشعبية مفصلة). تم استخدام WormNet للحصول على مصنفات الحركة والعمر (الشكلان 2 و 3). لمزيد من التخفيف من احتمالية حدوث فرط في التخصيص ، أجرينا 30- زيادة في حجم البيانات باستخدام مولدات صور Keras. على وجه التحديد ، تخضع الصور للتقليب العشوائي الأفقي والرأسي ، والإزاحة الأفقية والرأسية في نطاق 10 بالمائة ، بالإضافة إلى التدوير العشوائي ضمن نطاق 90 درجة من الأصل. تم ملء الفراغات في الصور المحولة باستخدام استراتيجية القيمة الأقرب.

أظهر WormNet أداءً جيدًا في تصنيف الحركة الكلي الذي وصل إلى دقة 88 بالمائة (دقة 0. 86 ، استدعاء 0. 86 ، المنطقة تحت المنحنى لخاصية تشغيل جهاز الاستقبال - AUC ROC - كان 0. 56) في مجموعة بيانات الاختبار لكسر اليوم الثالث للبالغين. كان أداء صور اليوم الأول والثاني أقل قليلاً (الشكل 2 ب -2 د) مع ROC AUC بقيمة 0. 51 و 0. 55 على التوالي. للتأكد من أن تنبؤنا يتأثر في الغالب بمورفولوجيا الدودة بدلاً من محيطها ، فقد أنشأنا مجموعة بيانات من صور الخلفية الاصطناعية حيث تمت إزالة C. elegans من خلال التجزئة. للتخفيف من تأثير صورة ظلية الدودة على التدريب ، قمنا بملء وحدات البكسل الصفرية المتبقية بضوضاء عشوائية (الشكل التكميلي 1). تشير نتائجنا إلى أن أداء النموذج يُعزى في الغالب إلى مورفولوجيا C. elegans بدلاً من خلفية الصور. لتقييم أي جزء من الجسم قد يكون مسؤولاً عن اتخاذ قرارات WormNet ، باستخدام نهج تصنيف التجزئة الترادفي لدينا ، حصلنا على CAMs لدودة فئة الحركة المنخفضة (الشكل 2E ، 2F) ودودة عالية الحركة (الشكل 2G ، 2H) من WormNet.بيوفلافونويدسبعد ذلك ، تم تقسيم كل صورة باستخدام HydraNet4 وتم الحصول على اتحاد WormNet للربع العلوي CAM مع تجزئة الجزء المورفولوجي من HydraNet4. لأغراض التفسير ، قمنا بحساب النسبة المئوية لـ CAMs التي تنتمي إلى قطاع مورفولوجي خاص لكل دودة تنتمي إلى فئة حركة عالية أو منخفضة. علاوة على ذلك ، قمنا بتقييم أهمية هذا التفسير حسب التصميم باستخدام ANOVA أحادي الاتجاه مع تصحيح الاختلاف الكبير الصادق (HSD) الخاص بـ Tukey (الشكل 2F- الديدان ذات الحركة المنخفضة ، الشكل 2H - الديدان عالية الحركة). اقترحت المقارنة أن الجزء الأمامي تمت تغطيته بشكل أقل (31 بالمائة) من منتصف الجسم (34 بالمائة) والأجزاء الخلفية (34 بالمائة) لكل من الديدان منخفضة وعالية الحركة. لم يكن هناك فرق كبير بين منتصف الجسم والجزء الخلفي من الجسم.

بعد ذلك ، استخدمنا WormNet لتصنيف الديدان طويلة وقصيرة العمر. بشكل مشابه لتصنيف الحركة ، كان أداء WormNet أفضل في عينة البالغين في اليوم الثالث حيث وصلت دقة إلى 72 بالمائة (دقة 0. 73 ، استدعاء 0. 71 ، AUC ROC 0. 61) في مجموعة بيانات الاختبار ، مقارنةً بـ AUC ROC لـ 0. 53 و 0. 52 لليوم 2 و 1 على التوالي.شراء cistancheاقترح تحليل مصفوفة الارتباك أن أداء سي إن إن كان ضعيفًا في تصنيف الديدان قصيرة العمر (الشكل 3 أ -3 ج). بعد ذلك ، قمنا بتفسير المصنف باستخدام ترادف HydraNet4 و WormNet مصحوبًا باختبار إحصائي ANOVA أحادي الاتجاه. في حالة تصنيف العمر ، اقترح تفسير التصميم حسب التصميم أنه عند 32 بالمائة كان الجزء الأمامي أقل وضوحًا في CAMs مقارنةً بالجزء الأوسط والجزء الخلفي (الشكل ثلاثي الأبعاد ، 3E-short life ، الشكل 3F ، 3G-long فترة الحياة). كان هذا الاختلاف أقل أهمية بالنسبة للعمر الطويل مقارنة بالعمر القصير. لم يكن هناك فرق كبير بين منتصف الجسم والجزء الخلفي.

للتحقق من هذه النتائج بطريقة مستقلة ، قمنا بتدريب مصنف عمر آخر باستخدام بنية InceptionV3 المتبقية [3] مصحوبة بتفسير يدوي (الشكل 4). علاوة على ذلك ، في هذه الحالة لضمان دقة عالية لـ CAMs بدلاً من القياس إلى 96 × 96 بكسل ، تم استخدام الدقة الكاملة 900 × 900 صورة تم اقتصاصها إلى 800 × 800 بكسل (516 × 516 ميكرومتر). نظرًا لأن قدرة CNN التعبيرية أعلى بكثير ، كان InceptionV3 عرضة للإفراط في التجهيز على مجموعة البيانات الصغيرة نسبيًا (الشكل 4C ، 4D). للتحايل على هذا ، قمنا بتنفيذ التوقف المبكر أثناء التدريب. بالإضافة إلى ذلك ، قمنا بتجزئة الديدان من خلفيتها لضمان تقديم InceptionV3 فقط مع الجزء ذي الصلة من الصورة. تم إجراء InceptionV3 بشكل مشابه لـ WormNet مع دقة تصل إلى 70 بالمائة على مجموعة بيانات الاختبار لتصنيف العمر (الشكل 4 أ). تمشيا مع نهج HydraNet الترادفي 4- WormNet للتفسير ، في حالة التفسير اليدوي ، تم تمييز الجزء الأمامي من الدودة بواسطة InceptionV3 CAM بشكل أقل تكرارًا. الأهم من ذلك ، نظرًا للدقة العالية لصور الإدخال ، قامت وحدات CAM الآن بترجمة أجزاء الجسم بشكل أفضل ، مما يسمح بتعيين جزء من الجسم كمميز محتمل في كل حالة (الشكل 4 ب). ومن المثير للاهتمام أن توزيع أجزاء الجسم التي أبرزها تحليل الطبابة البديلة يوضح أن الجزء الخلفي أكثر أهمية لتصنيف الديدان طويلة العمر ، مما يشير إلى أن الميزات التي تتنبأ بطول العمر يمكن أن توجد في الجزء الخلفي من جسم الدودة.

نقاش

على الرغم من كون C. elegans نموذجًا كلاسيكيًا في أبحاث الشيخوخة مع نشر أكثر من 4000 ورقة بحثية حتى الآن ، والتقدم في مجال الروبوتات ، إلا أن عملية قياس عمر C. elegans لا تزال يدوية وشاقة. ومع ذلك ، تظهر مناهج جديدة مثل آلة العمر التي تستخدم الماسحات الضوئية المسطحة لتقييم قابلية عدد كبير من الديدان على اللوحات في نفس الوقت [34]. نهج آخر هو الشعاب المرجانية الدودية - وهي طريقة آلية لزراعة الديدان تسمح بتتبع الديدان طوال حياتها بقياسات تفصيلية أفضل بكثير [8]. أظهرت البيانات الفسيولوجية التفصيلية التي تم إنتاجها عن الشعاب المرجانية الدودية أن الحركة والتألق الذاتي وتدهور النسيج هي أفضل المؤشرات على العمر الافتراضي. ومع ذلك ، لا يزال من غير الواضح ما هي السمات المورفولوجية الدقيقة التي تعكس الأمراض وتحدد طول العمر الافتراضي. وجد أيضًا أن القياسات الفسيولوجية قبل اليوم الثالث أو الرابع من مرحلة البلوغ والمؤشرات الحيوية المسمى GFP الفردية لا يمكنها التمييز بين الديدان قصيرة وطويلة العمر [8 ، 15]. يتم إجراء التنبؤات المستندة إلى النواة التي تم إجراؤها على البالغين يوميًا باستخدام تكبير 100 × على الديدان الثابتة ، وهو أمر لا يمكن تحقيقه لأي منصة فحص آلية.

لقد عملنا هنا مع مجموعة البيانات التي تم إنشاؤها في مختبر Pincus [8،15] ، وأظهرنا أن تطبيق WormNet المصمم حديثًا كان قادرًا على التمييز بنجاح بين الديدان قصيرة وطويلة العمر حتى بالنسبة للصور التي تم التقاطها في اليوم الأول أو اليوم الثاني ؛ الأهم من ذلك ، بالنسبة لليوم الثالث ، أظهرت CNN أفضل أداء (الشكل 2 أ -2 ج). كانت WormNet أفضل في تصنيف الديدان ذات الحركة الكلية العالية والمنخفضة ، حيث حققت دقة بنسبة 88 بالمائة للبالغين في اليوم الأول (الشكل 3). نتوقع أن يولد المزيد من البيانات ويطور توقع عمر CNN [32]. كما ذكرنا سابقًا ، قام المؤلفون بتقسيم الديدان وإنشاء تمثيلات دودة مستقيمة ، والتي تم استخدامها لتدريب CNN [32]. أدى زيادة عدد العينات إلى تحسين التنبؤ القائم على الانحدار بعمر الدودة. ومن المثير للاهتمام ، أن المؤلفين حدوا من صورة ظلية تم العثور عليها لوحدها تلك المعلومات الدودية لتقدير العمر ، في حين أن خلفية المعلومات من تحسين دقة العلبة بشكل كبير ، على الرغم من أن القيمة التنبؤية للخلفية هي قطعة أثرية من الظروف التجريبية. لذلك ، قد يكون من الممكن تفسير الدقة التنبؤية لـ WormNet في عمليات المحاكاة الخاصة بنا جزئيًا من خلال معلومات الخلفية. ومع ذلك ، كما تشير تجاربنا (الشكل التكميلي 1) ، يعتمد أداء WormNet في الغالب على مورفولوجيا C. elegans بدلاً من خلفية الصور. الأهم من ذلك ، التدريب المسبق على تمثيلات تنسيق الجسم في [32] تحسين الدقة على الصور الخام مما يشير إلى أن أعضاء الدودة وملمسها مفيدة للتنبؤ بالعمر.

بالإضافة إلى تصنيف العمر أو الحركة استنادًا إلى صور الشباب ، نهدف أيضًا إلى العثور على ميزات مهمة للتنبؤ. كمهمة نموذجية ، قررنا تحديد أي جزء من الجسم - الأمامي أو منتصف الجسم أو الجزء الخلفي - يحتوي على ميزات تؤثر على طول العمر أكثر من غيرها. لقد قمنا بتصميم HydraNet 3 و 4 ، وهي هياكل جديدة تستند إلى U-Net وأظهرنا أنها تستطيع تقسيم أجزاء جسم الدودة بنجاح لتحقيق قيم مؤشر Jaccard المثالية. الأهم من ذلك ، من أجل تطوير نهج تفسير التصميم الثانوي ، استخدمنا ترادفًا من التصنيف ذي المعنى البيولوجي (العمر والحركة) مما أدى إلى البروز من خلال خرائط تنشيط الفصل [30 ، 35] والتجزئة المورفولوجية (المناطق الأمامية والمتوسطة والخلفية) للعثور على أي منها جزء الجسم مفيد في التصنيفات. علاوة على ذلك ، على الرغم من أنه تم حلها بشكل أقل ، إلا أن النتائج التي تم الحصول عليها من النهج الترادفي كانت متسقة مع مصنف مدرب بشكل مستقل. اعتمد هذا المصنف الثنائي على InveptionV3 CNN. تم تدريبه على صور بدقة بصرية كاملة 800 × 800 بكسل مع ديدان مجزأة من خلفيتها وحققت نتائج مماثلة لـ WormNet ، على الرغم من أن النموذج أقل قابلية للتعميم بسبب زيادة التجهيز (الشكل 4). ومع ذلك ، في حالة InceptionV3 ، يمكن توطين أجزاء الجسم المتميزة في CAMs ، وتشير التحليلات إلى أن الميزات الموجودة في الجزء الخلفي من الدودة قد تكون أكثر أهمية لتصنيف الديدان طويلة العمر. يوفر هذا النهج وسيلة لاكتشاف المؤشرات الحيوية العمرية الجديدة والمهمة في C. elegans في إعداد آلي ، نظرًا للزيادة الكبيرة في دقة الصورة واستخدام تمثيل إحداثيات الجسم. يمكن تقسيم الأعضاء غير المصنفة مثل البلعوم أو الكيانات التي تحمل علامة GFP باستخدام HydraNets وتقييم قدرتها التنبؤية مدى الحياة باستخدام نهج CAM و WormNet. من المغري التكهن بأنه على غرار شبكات الخصومة التوليدية [36] ، فإن التطبيقات المستقبلية لتفسير التصميم الثانوي من خلال ترادف التجزئة والتصنيف قد يتم تدريبها من البداية إلى النهاية واستخدامها في الاكتشافات العلمية الروتينية. سيكون النظام الأساسي التحليلي المؤتمت لإثبات المبدأ مفيدًا لاكتشاف المؤشرات الحيوية للشيخوخة غير الغازية ، لا سيما في الشباب 1-3 من البالغين C. elegans. هذا لديه إمكانات كبيرة لتسريع الفحص الصيدلاني للأدوية المضادة للشيخوخة. سيكون تطوير المنهجية مفيدًا أيضًا في العثور على أمراض جديدة وتوصيفها في C. elegans المهمة لأبحاث الشيخوخة الأساسية. لجعل الكود متاحًا لمجتمع البحث الذي قمنا بإيداعه.


تم استخراج هذه المقالة من www.aging-us.com AGING 2022، Vol. 14 ، رقم 4






















































قد يعجبك ايضا