تكشف المقارنة بين QPCR و RNA seq عن تحديات قياس تعبير HLA الجزء 2
May 25, 2023
تطبيع
استخدمنا تقديرات التعبير في النصوص لكل مليون (TPM) ، وهو التطبيع القياسي الذي ينتجه Salmon ويتوافق مع المقدار النسبي لنسخة معينة في عينة. بالنسبة لأي جين معين ، فإن التقدير هو ببساطة مجموع TPM لنسخه. في بعض الحالات عندما نعرض التقديرات المحولة العادية القياسية ، أجرينا تحويلًا عاديًا للترتيب لبيانات RNAseq باستخدام حزمة GenABEL R (Aulchenko et al.2007) ، والتي يتم تطبيقها عادةً ، على سبيل المثال ، في النماذج الخطية لرسم خرائط eQTL (Delaneau وآخرون 2017).
رسم خرائط QTL هو طريقة لدراسة الآلية التنظيمية للتعبير الجيني من خلال مقارنة الارتباط بين التعبير الجيني وتعدد الأشكال الجيني في مجموعة سكانية. النموذج الخطي هو طريقة رسم خرائط eQTL شائعة الاستخدام ، والتي يمكن أن تستخدم نموذج الانحدار الخطي لتقدير الارتباط بين التعبير الجيني وتعدد الأشكال الجيني.
جهاز المناعة هو نظام بيولوجي معقد يحمي الجسم من الالتهابات والأمراض مثل السرطان. يلعب تنظيم التعبير الجيني دورًا مهمًا في جهاز المناعة ويمكن أن يؤثر على تطور الخلايا المناعية وتمايزها ووظيفتها.
لذلك ، يمكن استخدام النماذج الخطية لرسم خرائط eQTL لتحليل العلاقة بين آليات تنظيم التعبير الجيني والمناعة. على سبيل المثال ، دراسة الارتباط بين نمط وراثي معين والتعبير عن الجين المناعي الرئيسي في مجموعة سكانية يمكن أن تكشف عن تأثير هذا النمط الجيني في تنظيم التعبير الجيني المناعي. يمكن لمثل هذا البحث أن يوفر تنويرًا مهمًا لعلاج أمراض المناعة والوقاية منها. هذا يدل على أهمية المناعة ، لذلك نحن بحاجة إلى تحسين مناعتنا كل يوم. كما أن اللحوم المفرومة لها تأثيرات مضادة للفيروسات ، ومضادة للسرطان ، وغيرها من التأثيرات التي يمكن أن تقوي المناعة ، وقدرة النظام على مقاومة وتحسين مناعة الجسم.

انقر فوق الفوائد الصحية من cistanche
اقرأ محاذاة الجينوم المرجعي
لتحليل تغطية القراءة في جينات HLA الواردة في الشكل S7 ، قمنا بمحاذاة القراءات إلى الجينوم المرجعي GRCh38 مع STAR v2.7.3a (Dobin et al. 2013) ، باستخدام شروح الجين Gencode v37. للتحكم في رسم الخرائط للتحيز في جينات HLA ، قمنا بمعالجة ملفات BAM باستخدام hlamapper v4.3 (Castelli et al. 2018).
محاكاة
بيانات الحقيقة الأرضية
لإنشاء بيانات محاكاة ، قمنا أولاً بتشغيل Salmon v1.3. 0 (Patro et al. 2 0 17) على العينة الحقيقية # 66K00003 لمعرفة مستويات التعبير لنصوص Gencode v37. ثم استخدمنا حزمة البوليستر (الإصدار 1.26.0) لإنشاء 50 عينة اصطناعية بمستويات تعبير متطابقة على مستوى النسخ ، باستثناء HLA-A و -B و -C. استندت مستويات التعبير عن هذه الجينات إلى 50 فردًا تم اختيارهم عشوائيًا من بياناتنا الحقيقية (التي تتوفر لدينا بيانات أليل HLA لها). لكل جين HLA ، اخترنا الأشكال الإسوية التي تمثل 90 في المائة على الأقل من إجمالي تعبير نسخة ترميز البروتين في سمك السلمون الذي يعمل على مجموعة البيانات الحقيقية (مما أدى إلى نسخة واحدة فقط لكل جين) وتخصيص تسلسل النسخ وفقًا لـ أليلات HLA التي يحملها كل فرد.
سمح لنا هذا الإجراء بتوليد 50 فردًا اصطناعيًا بمستويات تعبير خلفية متطابقة ، ولكن مع تعبير HLA متغير ومع تعدد أشكال HLA المدمج في القراءات المحاكاة.
لعكس بياناتنا الحقيقية ، تمت محاكاة ثلاثين مليونًا من 126 نقطة أساس للقراءة المزدوجة بمتوسط حجم جزء يبلغ 261 نقطة أساس لكل فرد ، باستخدام الإعدادات الافتراضية لمعلمات البوليستر الأخرى (على سبيل المثال ، الانحراف المعياري لطول الجزء =25 bp ، ومعدل الخطأ =0. 005 ، والتوزيع المنتظم للقراءات ، وعدم التحيز). يخرج البوليستر ملفات FASTA ، والتي أنتجنا منها ملفات FASTQ بنقاط جودة ثابتة (الرمز المقابل "F").
مقاييس الدقة
تم حساب TPMs على التهم المحاكاة بالنظر إلى أطوال النسخ ومتوسط حجم الجزء البالغ 261 نقطة أساس. تُستخدم نسبة "TPM / True TPM المقدرة" لتقييم الأداء في استعادة مستويات التعبير المحاكاة وتسمح لنا بمراقبة أو المبالغة في التقدير.
الرسومات
قمنا بإعداد جميع المؤامرات في هذه المقالة باستخدام حزمة ggplot2 v3.3.2 (Wickham 2016) في R.

نتائج
دقة القياس الكمي لـ RNA seq HLA
نظرًا لعدم وجود طريقة يمكن اعتبارها المعيار الذهبي التجريبي لتقدير تعبير HLA من بيانات RNA-seq ، قمنا في البداية بتقييم دقة طرق القياس الكمي لـ RNA-seq لـ HLA باستخدام بيانات محاكاة حيث تُعرف مستويات التعبير الحقيقي منذ إنشائها في الكمبيوتر لمحاكاة تجارب حقيقية. تم إجراء ذلك لاختيار أفضل نهج حسابي من بين الأساليب القائمة على RNA-seq ، مما يسمح بالتناقض اللاحق مع الأساليب غير المتسلسلة من RNA.
قمنا بمحاكاة تجربة RNA-seq لـ 50 فردًا باستخدام حزمة البوليستر (Frazee et al. 2015). هؤلاء الأفراد الاصطناعية لديهم نفس مستويات التعبير لجميع الجينات في الجينوم ، باستثناء HLA-A و -B و -C ، والتي قمنا بتغيير مستويات التعبير عنها. قمنا أيضًا بتخصيص تسلسل نص HLA المشروح من Gencode v37 لتقديم تباين جيني حقيقي لوحظ في الأفراد المختارين عشوائيًا من مجموعة بيانات من 96 فردًا (تم التنميط الجيني HLA بواسطة تسلسل Sanger كما هو موضح أدناه). تحتوي النصوص الشخصية الناتجة على هوية تسلسل متوسط بمرجع أكبر من 95 بالمائة لجميع مواقع HLA.
قارنا تقديرات تعبير HLA التي تم الحصول عليها من خلال طريقتين للمعلومات الحيوية: (1) "نسخة المرجع" ، والتي تستخدم السلمون (باترو وآخرون. 2017) لمحاذاة القراءات مع النسخة المرجعية القياسية ، وتحديد كمية النسخ و (2) "شخصية" الذي يستخدم أيضًا سمك السلمون ، لكن الخرائط تقرأ إلى نصوص HLA الشخصية ، مما يعكس النمط الوراثي لـ HLA للفرد (الشكل 1). يمتد النهج "المخصص" لاستراتيجيتنا السابقة (Aguiar et al. 2019) باستخدام نسخة مخصصة ، بدلاً من تسلسل تشفير أساسي واحد لكل أليل يحمله الفرد.

طريقة "نسخة المرجع" قللت من تقدير مستويات التعبير ، خاصة بالنسبة للأليلات التي تحتوي على نسبة أكبر من الاختلافات في التسلسل فيما يتعلق بالجينوم المرجعي (الشكل 1). هذا متوقع نظرًا لأن معدل عدم التطابق المرتفع بين القراءات والمرجع يؤثر سلبًا على المحاذاة (Brandt et al. 2015). هذا النهج أيضًا بالغ في تقدير تعبير HLA-C لبعض الأفراد ، نتيجة للقراءات من HLA-B التي يتم تعيينها إلى النصوص المرجعية لـ HLA-C (الشكل S1). من ناحية أخرى ، يتحكم النهج "المخصص" في تحيز التعيين ويحقق الدقة المثلى.
على الرغم من أن محاكاتنا توفر نتائج مشجعة فيما يتعلق بالتقدير الكمي لتعبير HLA باستخدام RNAseq ، يجب أن نأخذ في الاعتبار بعض المحاذير. قمنا بتعديل تسلسل الأشكال الإسوية المشروحة وفقًا لأليلات HLA للأفراد باستخدام مجموعة واحدة من الأشكال الإسوية لجميع الأليلات في جين HLA معين. تم استخدام هذه التسلسلات في محاكاة القراءات وكذلك في القياس الكمي للتعبير ؛ وبالتالي ، فإننا نتوقع الدقة المثلى. في سيناريو حقيقي ، قد ترتبط أليلات HLA المختلفة بأشكال إسوية مختلفة. لاحقًا في هذه الورقة ، نناقش مثالًا محددًا لاحظناه لـ HLA-A ، بما يتفق مع فرضية أن بعض الأشكال الإسوية تقتصر على أليلات معينة. ومع ذلك ، نظرًا لأننا مهتمون بشكل أساسي بتقديرات التعبير على مستوى الجينات ومستوى أليل HLA ، فإننا نتوقع أن تمثل التسلسلات الشخصية تحسينًا على نسخة مرجعية واحدة عن طريق تقليل تحيز التعيين.
تقدير تعبير HLA من بيانات RNA الحقيقية
أجرينا تقديرًا للتعبير على بيانات RNA-seq كاملة النسخ لـ 96 فردًا ، والتي تم تقدير مستويات التعبير السطحي لـ qPCR لـ HLAA و -B و -C و HLA-C مسبقًا (Kulkarni وآخرون 2013 ؛ Ramsuran et al. 2015 ، 2017) ، ويمكن استخدامها للمقارنة بنتائج RNAseq (انظر الشكل S2 لتحليلات مراقبة الجودة على بيانات RNA-seq).
نظرًا للدقة العالية للنهج المخصص في المحاكاة ، فإننا نقارن هذه الطريقة لتقديرات التعبير المستندة إلى RNA-seq مع تلك الأساليب الأخرى غير المتسلسلة من RNA ، ولكننا نقدم النتائج للنُهج المستندة إلى النسخ المرجعية في "المعلومات التكميلية". " قمنا بتخصيص تسلسل النسخ بالنظر إلى الأنماط الجينية الفردية لـ HLA التي تم الحصول عليها عن طريق تسلسل Sanger. قمنا بتشغيل HLApers (Aguiar et al. 2019) و Kourami (Lee and Kingsford 2018) لاستنتاج الأليلات مباشرةً من بيانات RNA-seq وتأكيد مكالمات Sanger (انظر "المواد والأساليب").
تُظهر تقديرات التعبير على مستوى الجين أن HLA-B لديه أعلى تعبير بين مواضع HLA في مجموعة البيانات الخاصة بنا ، متبوعًا بـ HLA-C و HLA-A (الشكل 2 أ). يتوافق هذا الطلب مع مجموعة بيانات الدم الكاملة GTEx (GTEx Consortium 2020) ومع طريقة RNAseq السابقة لالتقاط HLA المطبقة على PBMCs (Yamamoto et al. 2020). ومع ذلك ، يختلف هذا النمط عن ذلك الذي شاهده Boegel et al (2018) ، الذين لاحظوا مستويات مماثلة عبر الجينات باستخدام استراتيجية مختلفة للتعامل مع تعيين القراءات لمواقع متعددة ، مما قد يساهم في عدم التمييز عبر المواقع من حيث مستوى التعبير. ). سيتعين على الدراسات المستقبلية أن تفصل بين مساهمة الاختلافات في المنهجيات أو تكوين نوع الخلية في هذه الاختلافات.

مقارنة RNA seq و qPCR على بيانات حقيقية
قمنا بعد ذلك بمقارنة تقديرات تعبير RNA-seq بتلك التي تم الحصول عليها باستخدام qPCR (الشكل 2 ب). على الرغم من أن العلاقة بين RNA-seq و qPCR كانت ذات دلالة إحصائية لجميع الجينات (p =0. 0 24 ، 0. 002 ، 0.000000016 ، لـ HLA-A ، -B ، و -C ، على التوالي ؛ اختبار سبيرمان للارتباط الإيجابي) ، كان حجم الارتباطات متواضعًا لـ HLA-A و -B ، وأعلى لـ -C. أدى استخدام مرجع شخصي لـ RNA-seq إلى زيادة متواضعة في الارتباط مع qPCR مقارنة بالمرجع القياسي (الشكل S3). يتفق هذا مع ملاحظتنا السابقة بأن تقديرات التعبير على مستوى الجين لا تختلف اختلافًا جوهريًا بين المقاربات المستندة إلى الجينوم المرجعي أو المقاربات الشخصية لجينات الفئة الأولى من HLA (Aguiar et al. 2019) ، مع الفائدة الرئيسية من الأساليب الشخصية هي التقديرات في مستوى أليل HLA ، الذي نستكشفه أدناه. يؤدي استخدام تصحيح التحيز في السلمون (انحياز GC ، والتحيز الخاص بالتسلسل ، والتحيز الخاص بالموقف) إلى تحسين الارتباط مع qPCR ، مع أعلى تأثير لـ HLA-B (قارن الشكلين 2 ب و S4 ، للبيانات المصححة وغير المصححة ، على التوالى).

مقارنة مستويات الرنا المرسال مع التعبير السطحي
نظرًا لأن تعبير RNA غني بالمعلومات حول الخطوات الأولية لإشارات الخلية والاستجابة للمنبهات ، فإن تحليل علاقتها بالأنماط الظاهرية الجزيئية (مثل تعبير البروتين على سطح الخلية) يمكن أن يساعدنا في فهم دور التنظيم اللاحق للنسخ وما بعد الترجمة على تعبير HLA. من المتوقع حدوث اختلافات بين الحمض النووي الريبي ووفرة البروتين لأنها تخضع لأنماط مختلفة من التنظيم. يمكن أن تؤدي التأثيرات التقنية أيضًا إلى اختلافات نظرًا لاختلاف تقنيات الحمض النووي الريبي والبروتين وتتأثر بأنواع الخطأ غير المرتبطة (Li and Biggin 2015 ؛ Kaur et al. 2017 ؛ Carey et al. 2019). علاوة على ذلك ، في حالة دراستنا ، تم قياس التعبير الجيني على إجمالي PBMCs ، بينما تم قياس تعبير البروتين على خلايا CD3 plus المصنفة. مع وضع هذا الاختلاف في الاعتبار ، قمنا بقياس الدرجة التي يمكن بها التنبؤ ببروتين HLA على سطح الخلية عن طريق تعبير mRNA. تم إجراء هذا التحليل حصريًا لـ HLA-C نظرًا لأنه الموضع الوحيد الذي يتوفر له جسم مضاد يمكنه ربط جميع الأليلات بصلات متساوية. ومن المثير للاهتمام ، أنه كان هناك ارتباط كبير بين mRNA وتعبير البروتين لـ HLAC ، مع وجود ارتباط أعلى قليلاً لـ RNA-seq (الشكل 2C).
تعبير مستوى أليل HLA
تحتوي جينات HLA على عناصر تنظيمية مرتبطة بالنسخ التأسيسي والنسخ المنشط ديناميكيًا (René et al. 2016). نتيجة لذلك ، يختلف تعبير HLA عبر الأنسجة ويمكن تعديله بواسطة شبكات تنظيمية ناتجة عن محفزات مختلفة (Anderson 2018 ؛ Carey et al. 2019). هناك اهتمام متزايد بفهم ما إذا كانت أليلات HLA المتميزة مرتبطة بمستويات التعبير القاعدية المختلفة والبرامج التنظيمية (Aguiar et al. 2019 ؛ Gutierrez-Arcelus et al. 2020) ، وما إذا كان هذا الاختلاف يساهم في الأنماط الظاهرية للمرض أو نتائج الزرع (Petersdorf et 2014 ، 2015 ؛ رينيه وآخرون 2016 ؛ بيتينز وآخرون 2022 ؛ جوهانسون وآخرون 2022). لذلك ، تمت مقارنة تقديرات التعبير على مستوى أليل HLA لـ qPCR و RNA-seq. نظرًا لأن الأليلات الفردية غالبًا ما تكون نادرة جدًا في مجموعة البيانات ، فقد قمنا بتجميعها حسب سلالات الأليلات (أي مجموعات الأليلات التي يتم تحديدها نسبيًا من خلال علاقة exons) (Elsner et al.2002).
صنفنا الأنساب وفقًا لمستويات تعبيرها بناءً على بيانات RNA-seq و qPCR وقمنا بتقييم توافق التصنيفات عبر الطرق (الشكل 3). يوفر نهج RNA-seq المخصص لدينا تقديرات على مستوى الأليل بشكل مباشر ، حيث يتم استخدام تسلسل أليل HLA لفهرسة المحاذاة ، لذلك قمنا بترتيب الأنساب الأليلية وفقًا لمستويات التعبير المتوسط. نظرًا لأن تقديرات تعبير qPCR الخاصة بنا تقع على مستوى الجينات ولا توفر تقديرات مباشرة على مستوى الأليل ، فقد طلبنا السلالات الأليلية وفقًا لتأثيراتها في نموذج خطي لمستويات التعبير الموضح بواسطة النمط الجيني HLA (انظر Ramsuran et al. 2015). في الشكل 3 ، تم رسم قيم التعبير مرتين لكل مستوى لكل أليل للفرد ، وبالنسبة لـ qPCR ، فهو ببساطة تعبير على مستوى الجين تم رسمه مرتين ، مما يعكس وجود أليلين.

يعتبر ترتيب تقديرات التعبير أكثر تشابهًا بين RNA-seq و qPCR لـ HLA-C مقارنةً بـ -A و -B (متوسط فرق الطلب المطلق ، حيث يشير اختلاف الترتيب إلى الاختلاف الملحوظ في المواضع ضمن ترتيب مُرتَّب لقيم التعبير ، بين RNA-seq و qPCR الكمي ، 2.3 لـ HLA-C ، 3.1 لـ -A ، و 3.9 لـ -B) ، باتباع نمط مماثل لاتفاق مع التعبير على مستوى الجين ، والذي وجدنا فيه أعلى ارتباط بين RNA-seq و qPCR لـ HLA-C.
من بين السلالات ذات الاختلاف الأكبر بين RNA-seq و qPCR A * 11. قمنا بقياس تعبير السطح على مجموعة فرعية من الزيجوت غير المتجانسة لـ A * 03 أو A * 11 باستخدام جسم مضاد له تقارب متساوٍ لكل من السلالتين ولاحظنا أن qPCR يرتبط بشكل أقوى مع تعبير سطح الخلية لهذين النوعين من الأنماط المتباينة مقارنةً بـ RNA-seq (الشكل. S5). بعد ذلك ، نقدم تقييمًا أكثر شمولاً لطلبات الأليل من خلال مقارنات مع الدراسات السابقة لتعبير HLA mRNA.
في حين أن هناك اهتمامًا بمقارنة اختلافات التعبير بين أليلات HLA ، تظهر دراسات مختلفة أن التباين في التعبير داخل أليل أو سلالة أليلية غالبًا ما يكون مرتفعًا جدًا ، وغالبًا ما تكون الاختلافات بين الأليلات ذات الرتب المختلفة صغيرة وغير مهمة. نتيجة لذلك ، قد يكون من غير الواقعي توقع الحفاظ على الرتب عبر الأليلات المتعددة ، وقد يكون من الأفضل مقارنة تقديرات التعبير للأليلات في أقصى حدود التعبير.
بالنسبة لبيانات RNA-seq الخاصة بنا ، نقارن تقديراتنا مع تلك من نهجين سابقين من RNA-seq المصممين لـ HLA على PBMCs. هناك توافق جيد بشكل عام مع Yamamoto et al. (2020) ، حيث يتم التعبير عن A * 24 و A * 02 و C * 04 و C * 06 بدرجة عالية ، ويتم التعبير عن A * 03 و C * 03 و B * 15 بمستويات منخفضة ، على الرغم من أننا نرى أيضًا اختلافات مثل بالنسبة إلى B * 35 ، والتي ستتفق أكثر مع بيانات qPCR الخاصة بنا. عندما نقارن بيانات RNA-seq الخاصة بنا مع Johansson et al. (2021) ، ومع ذلك ، نرى العديد من الاختلافات ، على الرغم من أن لديهم عينات صغيرة جدًا للعديد من السلالات.
نحن أيضًا نقارن نتائجنا مع تلك التي تم الحصول عليها من دراستين سابقتين لـ qPCR التي طبقت البادئات الخاصة بالأليل. بيتينز وآخرون (2014) استخدمت البادئات الخاصة بالأليل لبعض سلالات HLAC وشهدت C * 04 و C * 06 معبرًا عنها بدرجة عالية ، بينما تم التعبير عن C * 07 و C * 03 بمستويات منخفضة ، بما يتوافق مع ما لدينا لكل من RNA-seq و qPCR. رينيه وآخرون (2015) طبق الاشعال الخاص بالأليل لـ HLA-A ، ولاحظ A * 02 (مرتفع) و A * 29 (منخفض) في أقصى درجات التعبير ، والذي يتوافق مع نتائج RNAseq أكثر من qPCR ؛ ومع ذلك ، فإننا نرى اختلافات كثيرة في الأنساب الأليلية الأخرى
في بعض الحالات ، يمكننا أيضًا تقييم الاتفاق مع الدراسات الوظيفية. على سبيل المثال ، تُظهر التحليلات السابقة لمواقع ربط عامل النسخ (TFBS) ونشاط المروج (تمت مراجعته في Anderson 2018) ، والدراسات حول تنظيم miRNA (Kulkarni وآخرون. 2011) ، أن C * 03 و C * 07 معبران بشكل ضعيف الأليلات ، الذي يتفق مع ملاحظاتنا لكل من RNA-seq و qPCR.
المصادر المحتملة للاختلافات
قمنا بعد ذلك بالتحقيق فيما إذا كانت معالجة العينات المستخدمة في RNA-seq قد ساهمت في الاختلافات بين تقديرات التعبير التي تم الحصول عليها باستخدام qPCR و RNA-seq.
كان أحد المخاوف المحددة هو طول الفترة الزمنية التي تم فيها تخزين العينات في مجمد -80 درجة (حوالي 4 سنوات بين مقايسات qPCR و RNA-seq) ، بالإضافة إلى خطوات أخرى خاصة بتجربة RNA-seq ، بما في ذلك إذابة العينات. لمعالجة هذا الأمر ، أجرينا تجربة RNAseq ثانية على الدم الطازج المعاد رسمه من 11 فردًا ، وهي مجموعة فرعية من 96 تم تحليلها في هذه الدراسة ، وقارننا تقديرات التعبير بين نقطتي الوقت. على الرغم من أن هذا الاختبار الثاني يحمل كلاً من الاختلافات التقنية والبيولوجية فيما يتعلق بتجربة RNA-seq الأولى (الشكل S6A و B) ، إلا أن الارتباط الواسع للنسخة في تقديرات التعبير بين النقاط الزمنية مرتفع (الشكل S6C).
على الرغم من أن تقييم الارتباط مع 11 فردًا يمكن أن يكون صاخبًا ، إلا أن الارتباطات في جينات HLA تعد من بين أكبر الارتباطات الجينية بين العينتين (الشكل S6D و F). قمنا أيضًا بحساب نسب الأليل داخل الفرد ، وهي نسبة التعبير بين أليلين HLA لفرد متغاير الزيجوت ، وقارناها بين نقاط زمنية. كان الارتباط أكبر من 0 .94 لـ HLA-A و -B و -C (الشكل S6E). لذلك ، لم نر أي دليل على مساهمة كبيرة في تدهور الحمض النووي الريبي لشرح الارتباط المنخفض بين RNA-seq و qPCR في عينتنا الأصلية.
مساهمة أخرى محتملة في الاختلافات بين RNA-seq و qPCR هي أن أليل HLA المحدد قد يكون أكثر تحيزًا في طريقة أو أخرى ، وفي هذه الحالة فإن الأفراد الذين يحملون هذه الأليلات سيساهمون في اختلافات كبيرة. على سبيل المثال ، بالنسبة للأفراد الذين يحملون A * 03 ، أو متجانسة الزيجوت لـ C * 07 ، هناك علاقة سلبية بين qPCR و RNA-seq (الشكل 4 أ).

قد ينشأ مصدر إضافي للاختلافات بين الطرق من حقيقة أنه في نهج RNA-seq الخاص بنا ، نقوم بتخصيص جميع نصوص Gencode المشروحة لكل أليل HLA ؛ ومع ذلك ، فإن تنوع النص الحقيقي وارتباطه بأليلات HLA المحددة ليست مفهومة جيدًا. على سبيل المثال ، Kulkarni et al. (2017) أظهر أن A * 01 و A * 11 ينتجان 3′-UTRs أقصر. للتحقق مما إذا كان بإمكاننا تكرار هذا التمويل في بيانات RNA-seq الخاصة بنا ، قمنا بتعيين القراءات إلى الجينوم المرجعي وتصحيحها من أجل تعيين التحيز في جينات HLA باستخدام مخطط hla (Castelli et al. 2018). في الواقع ، بالنسبة للأفراد الذين يحملون A * 01 أو A * 11 ، تُظهر تغطية القراءة عند 3′-UTR لـ HLA-A انخفاضًا حادًا عند 120 نقطة أساس قبل نهاية الجين المشروح (الشكل S7).

نظرًا لأنه يتم حساب قيم النص لكل مليون (TPM) مع الأخذ في الاعتبار طول المرجع ، فإن استخدام مرجع أطول من النص الحقيقي يؤدي إلى التقليل من التعبير. لقد حاولنا التحكم في إمكانية وجود مثل هذه النصوص الأقصر من خلال تضمين نسخة من كل نص HLA-A مع 3′-UTR مختصر في فهرسنا لمحاذاة القراءة. ومع ذلك ، لم نعثر على أي دليل على التعبير عن الشكل الإسوي الأقصر (الشكل S8) ، ربما بسبب احتواء هذه الأشكال الإسوية الأقصر ضمن الأشكال الإسوية ذات الطول الطبيعي ، ويقوم تنفيذ Salmon بتعيين جميع القراءات إلى الشكل الإسوي الأكبر. ومن المثير للاهتمام ، أن التعبير على مستوى الشكل الإسوي يكشف عن شكل إسوي ذي 5′-UTR أطول حصريًا لـ A * 11 ، والذي يساهم بنسبة كبيرة من التعبير الكلي لهذا الأليل (الشكل S8).
اختبرنا أيضًا تطبيع تقديرات التعبير لدينا ، حيث قمنا بتعديل أطوال القراءة نظرًا لتغطية القراءة التي تدعم نهاية UTR القريبة أو البعيدة 3′-UTR (المتوسط المرجح لأطوال النص باستخدام تغطية القراءة كأوزان). على الرغم من أننا نلاحظ مكسبًا يصل إلى 20 بالمائة في مستويات التعبير للأفراد الذين يحملون A * 01 و / أو A * 11 ، إلا أننا لا نرى سوى تحسن طفيف في الارتباط مع qPCR بعد هذا التعديل (من rho =0. 20 في الشكل 2 إلى rho =0. 24 في الشكل 4B).
A * 01 و A * 11 من بين الأليلات ذات أكبر اختلافات في الترتيب بين RNA-seq و qPCR (الشكل 3) ، وقد يؤدي التمثيل غير الكامل للنصوص المرتبطة بها في التعليق التوضيحي إلى التحيز في تقديرات تسلسل الحمض النووي الريبي.
أخيرًا ، يمكن أيضًا أن تكون طرق التطبيع المستخدمة للحصول على تقديرات التعبير النهائي من بيانات qPCR الخام مصدرًا للاختلافات بين تقديرات qPCR و RNA-see. عادةً ما تعمل مقايسات PCR الكمية لجينات الفئة الأولى من HLA على تضخيم المناطق داخل exons 1 إلى 4 ، ويتم عادةً إجراء التوحيد من خلال التعبير عن جين التدبير المنزلي مثل B2M (2- ميكروغلوبولين) (كما كان الحال في الدراسة الحالية ). الأساس المنطقي لهذا الإجراء هو أنه إذا تم توحيد مستويات التعبير من خلال مرجع معبر عنه بثبات ، يتم وضع التقديرات للأفراد المختلفين على نفس المقياس ، مما يسمح بإجراء مقارنات بين الأفراد.
يُشفِّر B2M للسلسلة الخفيفة في جزيء HLA Class I ، ومن المعقول أن يكون لجينات B2M و HLA class I بعض التنسيق في التعبير ، نظرًا لأنها تشترك في بنى محفز مماثلة (Kobayashi و van den Elsen 2 {{1 {{12} }}} 12 ؛ Vijayan et al. 2 0 19) ، ويمكن تنظيمها بواسطة عوامل النسخ المشتركة (على سبيل المثال ، تحفز NLRC5 / CITA التعبير عن كل من HLA class I و B2M في خطوط خلايا Jurkat (Meissner et al. 2 {{2 0} 1 0). قد يؤدي تطبيع التعبير الجيني HLA عن طريق القيم المرتبطة إلى حدوث تحيز في تقديراتنا qPCR ، خاصة بالنسبة لـ HLA-B ، والتي نرى ارتفاعًا فيها الارتباط بتعبير B2M (الشكل 4C). يمكن أن يؤدي قياس متغير بواسطة متغير مختلف ولكنه مرتبط إلى حدوث اضطراب عن طريق جلب القيم القصوى إلى منتصف التوزيع وتقليل التباين ؛ بما يتوافق مع هذه الفرضية ، فإن معاملات التباين لبيانات qPCR هي 0.61 و 0.50 لـ HLA-A و -C ، على التوالي ، ولكن تنخفض إلى 0.17 لـ HLA-B (على سبيل المقارنة ، السير الذاتية لبيانات RNA-seq هي 0.20 و 0.14 و 0.29 لـ HLA-A و -B و -C ، على التوالى). ومع ذلك ، باستخدام نفس تصميم qPCR ، Ramsuran et al. (2017) تطبيع تعبير HLA-B بواسطة جين B2M و GAPDH و 18 s و b-Actin ، ولاحظت نتائج متسقة للغاية ، والتي لا تدعم تأثير تطبيع B2M على تقديرات qPCR.
مناقشة
يمكن أن تساهم التقديرات الموثوقة لتعبير نص HLA في أسئلة بحثية متنوعة ، وعلى الرغم من استكشاف نتائج المرض بشكل متكرر في سياق تباين ترميز HLA ، فمن المرجح أيضًا أن تفسر مستويات التعبير التباين في النتائج السريرية (تمت مراجعته في Dendrou et al. 2018 ؛ وفي يوهانسون وآخرون 2022). تتمتع مستويات التعبير أيضًا بالقدرة على اتخاذ قرارات مدروسة عند التخطيط لزرع الخلايا الجذعية المكونة للدم ؛ على سبيل المثال ، إذا لم يكن التطابق التام متاحًا في الاختيار للمانحين الخيفيين ، فيبدو من المفيد اختيار أولئك غير المتطابقين في الأليلات منخفضة التعبير (Petersdorf et al. 2014 ، 2015). قد تساعد التقديرات الموثوقة لتعبير النص أيضًا في تحديد eQTLs التي تكمن وراء التحكم في تعبير HLA ، والذي يمكن دمجه في نتائج GWAS ، من خلال الاستعلام عما إذا كانت النتائج المعروفة في منطقة MHC تتطابق مع eQTLs لجينات HLA (انظر ، على سبيل المثال ، الجدول S6 في Aguiar et al. 2019). بشكل أكثر عمومية ، ستساعدنا التقديرات المحسّنة لتعبير نسخة HLA على فهم البنية الجينية لتنظيم HLA ، وتحديد المساهمة النسبية للمتغيرات التي تعمل في رابطة الدول المستقلة (أي تلك الموجودة في جوار جين HLA الذي ينظمونه) ومتغيرات المعاملات (تلك الموجودة في أماكن بعيدة. المواقع الجينومية ، بما في ذلك الكروموسومات الأخرى). سيوفر هذا معلومات تتعلق بالدرجة التي يكون فيها التباين في تعبير HLA خاصية خاصة بالأليل مقابل خاصية فردية مستقلة عن الهوية الأليلية (انظر Bettens et al. 2022).
مكنتنا تقنيات PCR الكمية من الكشف عن الارتباطات بين تعبير HLA وأنماط المرض. في الآونة الأخيرة ، أصبح RNA-seq هو الطريقة المفضلة لتقييم التعبير الجيني في مجموعات بيانات كبيرة كاملة النسخ من مجموعات سكانية مختلفة. تعد القدرة على استخراج معلومات دقيقة لتعبير HLA من هذه البيانات تحديًا مهمًا ، وقد تم اقتراح العديد من الطرق لتحقيق هذا الهدف. ومع ذلك ، فإن الدرجة التي تتفق بها النتائج الناشئة من تحليلات RNA-seq مع تلك المتراكمة باستخدام qPCR غير معروفة حاليًا. على الرغم من أن هذه الأساليب تستهدف نفس النمط الظاهري الجزيئي (وفرة الحمض النووي الريبي) ، إلا أنها تختلف بشكل ملحوظ في التقنيات التجريبية المستخدمة ، وأشكال تحليل وتطبيع البيانات ، وإجراءات المعلومات الحيوية ، والتحيزات التي تخضع لها.
على حد علمنا ، تضمنت الدراسات السابقة التي قارنت مناهج HLAtailored RNA-seq مع qPCR عينات صغيرة. على سبيل المثال ، Johansson et al. (2 0 21) تحقق من صحة RNA-seq الذي يستهدف HLA مع qPCR على 5 عينات فقط في HLA-C ، بتمويل معامل ارتباط Pearson البالغ 0.9 ، والذي لم يكن مهمًا (ص =0. 08) .
في هذه الدراسة ، قمنا بمقارنة تقديرات تعبير PCR و RNA-seq الكمي لجين HLA class I الكلاسيكي HLA-A و -B و -C في مجموعة متطابقة من 96 فردًا. وجدنا ارتباطات متواضعة ولكنها مهمة في التعبير على عينة من 96 فردًا. نظرًا لعدم وجود معيار ذهبي لمقارنة هذه التقديرات ، فقد تساهم أخطاء التقدير والتحيزات المرتبطة بكلتا الطريقتين في النتيجة الإجمالية.
استكشفنا تأثيرات العوامل المختلفة التي قد تفسر الارتباط المنخفض بين تقديرات RNA-seq و qPCR ، مثل التقدير الضعيف للتعبير عن أليلات HLA المحددة والتطبيع بواسطة جين واحد للتدبير المنزلي في qPCR. لا يمكن تعميم نتائجنا على كل تصميم qPCR أو خط أنابيب RNA-seq ، حيث توجد مجموعة متنوعة من الأساليب المختلفة. ومع ذلك ، على حد علمنا ، هذه هي المقارنة المباشرة الأولى بين qPCR و RNA-seq لتقدير تعبير HLA.
تقترح دراستنا المجالات التي تتطلب تحسينًا في تحديد تعبير نسخة HLA. المقارنات بين RNA-seq و qPCR ، على سبيل المثال ، يجب أن تستخدم معالجة موحدة للعينات عبر الطرق (على سبيل المثال ، بروتوكول عزل RNA نفسه ، ووقت التخزين / الذوبان ، وسلامة الحمض النووي الريبي) للحد من الاختلافات الواقعية المرتبطة بهذه الطرق. يُنشئ رسم الخرائط القصيرة لجينومات مرجعية واحدة أو نسخ نصية تحيزات ، والاستراتيجيات التي تقرأ خرائط توضح تعدد الأشكال HLA ضرورية. نظرًا لوجود العديد من الاستراتيجيات لتحقيق ذلك (Boegel et al. 2012؛ Lee et al. 2018؛ Aguiar et al. 2019؛ Gutierrez-Arcelus et al. 2020؛ Darby et al. 2020) ، سيكون من الأساسي مقارنة الدقة النسبية لهذه الأساليب.
هناك أيضًا حاجة لتطوير طرق تفسر بشكل مناسب تباين الشكل الإسوي ، ليس فقط لتوفير طبقة أخرى من المعلومات ولكن أيضًا تقديرات تعبير أكثر دقة ، نظرًا لأن تسوية أعداد القراءة بطول نص غير صحيح يعد مصدرًا محتملاً للخطأ. في هذا السياق ، يمكن أن تكون البيانات طويلة القراءة ، والتي تولد معلومات نصية كاملة مباشرة ، أداة قوية (Cornaby et al. 2022). أخيرًا ، يجب أيضًا مراعاة تباين رقم النسخ ، وهي ميزة معروفة لمواضع HLA معينة (على سبيل المثال ، DRB) عند قياس مستويات التعبير.
شكر وتقدير
نشكر تاتيانا توريس (جامعة ساو باولو) ، ويانغ لو (كلية الطب بجامعة هارفارد) ، وأعضاء اتحاد علم الأحياء المشترك في بوسطن ، على مناقشاتهم المفيدة.
مساهمة المؤلف
ساهم ديوغو ماير وماري كارينجتون وريتشارد إم سينجل وفيتور آر سي أغيار في تصور الدراسة وتصميمها. تم إجراء تحضير المواد وجمع البيانات والتجارب من قبل مورين ب.مارتن وفيرون رامسوران وسميتا كولكارني وأرمان باشيروفا ودانيلو جي أوغوستو وماري كارينجتون. تم إجراء تحليل البيانات بواسطة Vitor RC Aguiar و Erick Castelli و Richard M. Single و Maria Gutierrez-Arcelus و Diogo Meyer. كتب المخطوطة فيتور آر سي أغيار وديوغو ماير. قرأ جميع المؤلفين وقدموا مساهمات ووافقوا على المخطوطة النهائية.
التمويل
قدمت وكالة تمويل ساو باولو (FAPESP، http: //www.fapesp. br / en /) التمويل إلى DM (2012 / 18010-0 و 2013 / 22007-7) وإلى VRCA (2014 / {{ 5}} و 2016 / 24734-1). قدمت المعاهد الوطنية للصحة ، الولايات المتحدة الأمريكية التمويل إلى DM (NIH R01 GM075091) ، والتي دعمت جزءًا من VRCA لما بعد الدكتوراة. قدمت Conselho Nacional de Desenvolvimento Científco e Tecnológico (CNPq) ووزارة الصحة ، البرازيل التمويل لتجارب RNA-seq وزيارات السفر البحثية ، كجزء من اقتراح مشترك بين الولايات المتحدة والبرازيل مُنح إلى MC و DM (470043 / {{13} }). NIH / NIAID R01AI157850 يدعم SK. تم تمويل VR من قبل مجلس البحوث الطبية في جنوب إفريقيا (SAMRC) بتمويل من قسم العلوم والتكنولوجيا (DST) ؛ كما تم دعمها جزئيًا من خلال الشبكة الأفريقية جنوب الصحراء الكبرى للتميز في أبحاث السل / فيروس نقص المناعة البشرية (SANTHE) ، وهي مبادرة DELTAS Africa (المنحة # DEL -15-006) من قبل AAS.
تم تمويل هذا المشروع كليًا أو جزئيًا بتمويل اتحادي من مختبر فريدريك الوطني لأبحاث السرطان ، بموجب العقد رقم HHSN261200800001E. لا يعكس محتوى هذا المنشور بالضرورة وجهات نظر أو سياسات وزارة الصحة والخدمات البشرية ، كما لا يشير ذكر الأسماء التجارية أو المنتجات التجارية أو المنظمات إلى تأييد حكومة الولايات المتحدة. تم دعم هذا البحث جزئيًا من قبل برنامج البحث الداخلي للمعاهد الوطنية للصحة ، مختبر فريدريك الوطني ، مركز أبحاث السرطان.
توافر البيانات
تم إيداع بيانات RNA-seq المقدمة في المنشور الحالي في قاعدة بيانات dbGaP وهي متاحة من خلال dbGaP accession phs003177.v1.p1.
مراجع
1. Aguiar VRC و César J و Delaneau O et al (2019) تقدير التعبير ورسم خرائط eQTL لجينات HLA مع خط أنابيب مخصص. بلوس جينيت 15: e1008091.
2. Alcina A ، Abad-Grau MDM ، Fedetz M et al (2012) يرتبط متغير مخاطر التصلب المتعدد HLA-DRB1 * 1501 بالتعبير العالي عن جين DRB1 في مجموعات بشرية مختلفة. بلوس واحد 7: e29819.
3. Anderson SK (2018) التطور الجزيئي للعناصر التي تتحكم في تعبير HLA-C: التكيف مع دور ليجند مستقبلات شبيهة بالجلوبيولين المناعي للخلية القاتلة ينظم وظيفة الخلية القاتلة الطبيعية. HLA 92: 271-278.
4. Apps R و Meng Z و Del Prete GQ وآخرون (2015) مستويات التعبير النسبي لبروتينات HLA class-I في الخلايا الطبيعية والمصابة بفيروس نقص المناعة البشرية. J إمونول 194: 3594-3600.
5. Apps R و Qi Y و Carlson JM وآخرون (2013) تأثير مستوى التعبير HLA-C على مكافحة فيروس نقص المناعة البشرية. Science 340: 87-91.
6. Arshad N ، Laurent-Rolle M ، Ahmed WS et al (2023) SARS-CoV -2 بروتينات ملحقة ORF7a و ORF3a تستخدم آليات متميزة لخفض تنظيم التعبير السطحي لـ MHC-I. Proc Natl Acad Sci USA 120: e2208525120.
7. Aulchenko YS، Ripke S، Isaacs A، van Duijn CM (2007) GenABEL: مكتبة R لتحليل الارتباط على مستوى الجينوم. المعلوماتية الحيوية 23: 1294-1296.
8. Bachtel ND، Umviligihozo G، Pickering S، et al (2018) HLA-C downregulation by HIV -1 تتكيف لاستضافة النمط الجيني HLA. بلوس باثوج 14: e1007257.
9. Bettens F ، Brunet L ، Tiercy JM (2014) تباين عالي الأليلات في تعبير HLA-C mRNA: الارتباط بالأنماط الفردانية الممتدة HLA. مناعة الجينات 15: 176 - 181.
10. Bettens F ، Ongen H ، Rey G et al (2022) تنظيم تعبير HLA من الفئة الأولى عن طريق الاختلافات الجينية غير المشفرة. بلوس جينيت 18: e1010212
11- بويجل إس ، بكور تي ، كاسل جي سي ، شاهين يو (2018) في طباعة سيليكو لأليلات HLA الكلاسيكية وغير الكلاسيكية من قراءات RNA-Seq القياسية. طرق Mol Biol 1802: 177–191.
For more information:1950477648nn@gmail.com






