تصنيف مستوى الأعطال للخلايا الكهروضوئية باستخدام نماذج تعلم عميق وخفيفة الوزن
Jun 27, 2023
نشر الخلايا الكهروضوئية كخلايا متجددةمصدر طاقةتم تعزيزه مؤخرًا ، مما عزز الحاجة إلى تطوير نظام آلي وسريع لاكتشاف الأعطال للخلايا الكهروضوئية. قبل العزل للإصلاح أو الاستبدال ، من الأهمية بمكان الحكم على مستوى الخطأ الذي حدث في الخلية الكهروضوئية. الهدف من هذه الدراسة البحثية هو تصنيف مستوى الخطأ للخلايا الكهروضوئية التي تستخدم نماذج الشبكة العصبية العميقة. تم إجراء التجربة باستخدام مجموعة بيانات متاحة للجمهور تتكون من 2624 صورة تلألؤ كهربي للخلايا الكهروضوئية ، والتي تم تصنيفها بأربعة احتمالات عيب مميزة محددة على أنها مستويات الخلل. تم تطوير البنى العميقة للشبكات العصبية الاصطناعية الكلاسيكية أثناء استخدام ميزات النسيج المصنوعة يدويًا المستخرجة من بيانات صورة EL. علاوة على ذلك ، تم تطوير بنيات محسّنة للشبكة العصبية التلافيفية مع التركيز بشكل خاص على النماذج خفيفة الوزن للمعالجة في الوقت الفعلي. يتم إجراء التجارب للتصنيف الثنائي ثنائي الاتجاه والتصنيف متعدد الطبقات. بالنسبة للتصنيف الثنائي الأول ، تفوق نموذج CNN المقترح على أحدث الحلول بهامش دقة يبلغ 1.3 بالمائة مع تعقيد حسابي أقل بنسبة 5 0 بالمائة. في مهمة التصنيف الثنائي الثانية ، تفوق النموذج المقترح المعتمد على وحدة المعالجة المركزية على الحل القائم على وحدة معالجة الرسومات بهامش دقة 0.9 بالمائة مع بنية أخف 8 ×. أخيرًا ، يتم إجراء التصنيف متعدد الطبقات للخلايا الكهروضوئية ويتم تحقيق أحدث النتائج بدقة 83.5 بالمائة. تقدم النماذج المقترحة حلاً يعتمد على وحدة المعالجة المركزية (CPU) خفيف الوزن وفعال وأرخص تكلفة من الناحية الحسابية لتصنيف مستوى الخطأ في الوقت الفعلي للخلايا الكهروضوئية.

انقر هنا للحصول على أقراص Cistanche لزيادة الطاقة
1 المقدمة
لاكتشاف الخطأ ، يتم إجراء مقارنة بين القياس المرجعي والملاحظ. للحفاظ على كفاءة النظام الكهروضوئي ، يجب اكتشاف الأعطال في المقام الأول متبوعة بعزل الخلية المعيبة أو صيانتها. لاكتشاف العيوب مثل microcracks في الأنظمة الكهروضوئية ، يمكن العثور على العديد من التقنيات في الأدبيات [4]. واحد من بينها هو شعاع الليزر المستحث بالتيار (LBIC).
من هذه الورقة تتلخص على النحو التالي:
(4) حقق نموذج CNN المقترح لـ Te نتائج متطورة مع وقت تدريب أقصر بمقدار 23 ×. علاوة على ذلك ، يتم تقديم أحدث نتيجة للتصنيف المتعدد لبيانات صورة EL.
تم تنظيم بقية الورقة على النحو التالي: يعرض القسم 2 العمل ذي الصلة ، ويتم توفير تفاصيل مجموعة البيانات في القسم 3 ، ويتم شرح المنهجية في القسم 4 ، واستراتيجية تقييم الأداء والمقاييس معروضة في القسم 5 ، القسم 6 يتضمن النتائج والمناقشة ، ويقدم القسم 7 تحليلاً مقارناً مفصلاً ، وأخيراً ، تمت إضافة الاستنتاج في القسم 8.
2. العمل ذات الصلة
حدد موقع الدائرة القصيرة (SC) في الخلايا الكهروضوئية [18]. في دراسة أخرى ، تم استخدام شبكة بايزي (BN) لوصف أسباب الأخطاء المكتشفة [19]. ادعى بحث آخر أن معدل الخطأ هو 0 35 - 0 55 من خلال الجمع بين نهجين: SVM وأقرب جار لاكتشاف أخطاء PV [20]. قدم محمد ونصار حلاً قائمًا على ANN لتشخيص وإصلاح الأنظمة الكهروضوئية [21]. تضمنت الدراسات المذكورة أعلاه تقنيات التعلم الآلي لاكتشاف الأخطاء وتشخيصها. ومع ذلك ، كانت الميزات المستخدمة في تلك الدراسات هي القراءات المقاسة للتيار والجهد والطاقة ، والتي تنطوي على الفحص اليدوي والتسجيل الممل.
بصرف النظر عن الكشف عن الخلل أو تصنيفه ، فقد أجريت مؤخرًا دراسات للكشف عن مستوى الخلل. قدمت دراسة نهج التعلم العميق لتصنيف مستوى الخلل في الخلايا الكهروضوئية باستخدام صور EL [38]. لهذا الغرض ، تم استخدام مجموعة بيانات عامة لصور EL مُصنَّفة بأربعة مستويات عيب مميزة مثل الفئات [39]. استخدم المؤلف نموذج VGG -19 الذي تم تدريبه مسبقًا على CNN وضبطه عبر نقل التعلم. أنتج النموذج دقة 88.4 بالمائة للتصنيف الثنائي ؛ ومع ذلك ، تم إجراء التجربة على آلة تعتمد على وحدة معالجة الرسومات (GPU) ، مما يجعلها حلاً مكلفًا من الناحية الحسابية. أجرى المؤلفون أيضًا تصنيفًا قائمًا على SVM للمعالجة في الوقت الفعلي وحققوا دقة تصل إلى 82.4 بالمائة. اقترحت دراسة حديثة أخرى بنية CNN خفيفة لتصنيف ثنائي على مستوى الخلل لنفس بيانات صورة EL [40]. اعتبر المؤلفون VGG -11 بمثابة بنية CNN الأولية وقاموا بتبسيطها للحصول على البنية المثالية والخفيفة لمهمة التصنيف. ادعى المؤلفون دقة تصنيف 93.02 في المائة ؛ ومع ذلك ، لم يتم ذكر كيف انتهى الأمر بالفئات المستهدفة الأربعة الأصلية إلى فئتين لإجراء التصنيف الثنائي. تم إجراء زيادة البيانات أيضًا ولكن لم يتم ذكر إجمالي العينات ، بالإضافة إلى دليل على موازنة الفئات بعد إجراء الزيادة.

بشكل ملموس ، لا يزال تحليل وتصنيف العيوب وكذلك تصنيف مستوى الخطأ في الصور الكهروضوئية في الوقت الفعلي يتطلب مزيدًا من البحث في العديد من الجوانب مثل زيادة حجم البيانات عبر طرق زيادة البيانات الفعالة ؛ تقدير خوارزميات التعلم الآلي الأبسط والأمثل لتعزيز المتانة ؛ ولتقدير شبكة أخف وزناً لتحقيق المعالجة في الوقت الفعلي. بالإضافة إلى ذلك ، نظرًا لكونها فئات ذات أربع تصنيفات لبيانات صورة EL المتاحة للجمهور [39] ، فلا يوجد دليل على تصنيف متعدد الفئات في الأدبيات. لذلك ، هناك حاجة لتطوير نظام لتصنيف متعدد المستويات أيضًا.
3. مجموعة البيانات
تم تحليل الصور الأصلية في البداية من قبل خبراء بشريين بناءً على حالة عمل الخلية ، وتم تعيين الملصقات من حيث احتمال العيب. هناك أربع فئات مميزة مسماة باحتمالية العيب {{0}. 0 ، 0. 33 ، 0. 66 ، 1. 0 ، حيث يمثل احتمال العيب 0. {{1 0} يمثل الخلية السليمة الكاملة ؛ احتمال وجود عيب 0. 33 يميز الخلية الأقل عيبًا ؛ يمثل 0.66 احتمالًا متوسطًا للخطأ والعيب ، ويشير 1.0 إلى الخلية المعيبة الكاملة. بشكل ملموس ، يمثل احتمال الخلل مستوى عيب الخلية الكهروضوئية.

يتم عرض بعض العينات من مجموعة البيانات التي تنتمي إلى الفئات الفردية في الشكل 2. هناك أنواع مختلفة من العيوب المصنفة بما في ذلك التشققات الصغيرة وعيوب المواد وانقطاعات الأصابع والكسور التي تؤثر على كفاءة الخلايا الكهروضوئية. على الرغم من أن مجموعة بيانات صورة EL تتكون من عينات صور بأربع تسميات للفصول ؛ ومع ذلك ، فإن عدد الصور التي تنتمي إلى كل فئة ليس هو نفسه. ينتمي الحد الأقصى لعدد العينات إلى الفئة السليمة (احتمال العيب 0. 0) ، في حين أن أقل تمثيل هو للفئة ذات احتمال العيب 0. 66. يرد عدد العينات الأصلية في مجموعة البيانات في الجدول 2.
4. المنهجية
من كل طبقة مخفية يتم تقديرها أيضًا في العملية من خلال ملاحظة خطأ التحقق من الصحة. تُستخدم خوارزمية Levenberg-Marquardt (LM) لتدريب الشبكة مع صفر خطأ مربع متوسط (MSE) كمعايير التقارب. تمت إضافة وصف البنى التقديرية النهائية في قسم النتائج.

4.2 ميزات مصنوعة يدويًا.يتطلب ANN ميزاتتتغذى. هناك عدة أنواع من الميزات التي قد تكونفي الاعتبار ، بما في ذلك سمات كثيرة الحدود [41-43]. كيفمن أي وقت مضى ، اخترنا نوعين من الشعبية والمستخدمة على نطاق واسعالميزات المصنوعة يدويًا: مصفوفة التواجد المشترك ذات المستوى الرمادي(GLCM) وميزات النمط الثنائي المحلي (LBP).
4.2.1. مصفوفة تواجد المستوى الرمادي. تمثل GLCM احتمالات مشتركة مكانيًا لشدة البكسل في الصورة. الميزات المحسوبة من GLCM كلاسيكية لكنها فعالة وتوفر تحليل نسيج الصورة ، الذي اقترحه في الأصل Haralick et al. [44]. تم حساب إجمالي الميزات الـ 22 التالية من كلٍ من أربع GLCMs المحسوبة بزوايا 0 و 45 و 90 و 135 درجة [45]: au \ tocorrelation 1 ، التباين ، الارتباط التلقائي 2 ، الارتباط التبادلي ، بروز المجموعة ، الظل العنقودي ، الاختلاف ،طاقة، الانتروبيا ، التجانس ، الاحتمال الأقصى ، مجموع المربعات ، متوسط المجموع ، مجموع التباين ، مجموع الانتروبيا ، تباين الاختلاف ، إنتروبيا الفرق ، قياس معلومات الارتباط 1 ، قياس معلومات الارتباط 2 ، الفرق العكسي ، الفروق العكسية المقيسة ، وحظة الفرق العكسي تطبيع. تم استخراج ما مجموعه 88 ميزة من كل صورة.
4.2.2. الأنماط الثنائية المحلية. تم أيضًا استخدام الأنماط الثنائية المحلية (LBP) كميزات على نطاق واسع لتطبيقات التعرف على الأنماط ورؤية الكمبيوتر. يتم إنشاء أبسط متجه لميزة LBP وفقًا للخطوات التالية:
(6) ربط الرسوم البيانية الطبيعية لجميع الخلايا.
من كل صورة ، تم حساب 59- الأبعاد لمتجه LBP.
4.3 شبكة عصبية تلافيفية مخصصة.
تم استخدام شبكات CNN بنجاح في الماضي القريب للعديد من التطبيقات من مهام التعرف البصري البسيطة إلى أنظمة القيادة الذاتية للمركبة. تتكون شبكة CNN من طبقات تلافيفية وطبقات تجميع ووظائف تنشيط وطبقات متصلة بالكامل (FC). تلعب الطبقة التلافيفية دورًا حيويًا لأنها تستخرج الميزات من الصور. ترتبط الطبقة التلافيفية الأولى بالبكسل الخام ، وتستخرج ميزات منخفضة المستوى مثل الحواف ، حيث تحصل الطبقة التالية على معلومات متوسطة المستوى ، وبالتالي تستخرج الطبقات التالية ميزات عالية المستوى. يتم استخدام طبقة التجميع لتقليل حجم الميزات المكتسبة بتجاهل أقلمعلومات مهمة. تشبه طبقة FC طبقةANN ، حيث تكون كل خلية عصبية من الطبقة السابقة تخدعمتصل بكل خلية عصبية في الطبقة الحالية. عدد اليتم الاحتفاظ بالخلايا العصبية في طبقة الإخراج مساوية لعددتسميات الإخراج. حسب الطلب ، فهذا يعني أن الشبكةبنيت من الصفر. يتم اختيار بنية Te عن طريق الزيادةحجم وتسجيل نتائج التصنيف على التدريببيانات. تفاصيل البنى والتصنيفالمهام موصوفة في قسم النتائج.


في البداية ، يتم اختيار البيانات الأصلية بشكل عشوائي وتنقسم إلى تدريب ، والتحقق من الصحة ، والاختبار بنسبة 70 في المائة و 15 في المائة و 15 في المائة على التوالي. في هذه المرحلة ، تحتوي كل من بيانات التحقق من الصحة ومجموعات بيانات الاختبار على 226 ، و 45 ، و 16 ، و 107 صورة للفئات الصحية ، والأقل خللًا ، والمتوسط الخاطئ ، والخطأ الكامل ، حيث تم فصل هذه المجموعات لاستخدامها لاحقًا. بعد ذلك ، يتم استخدام بيانات التدريب للتعزيز لموازنة الفصول بحيث يمكن التأكد من التدريب غير المتحيز للمصنف. من أجل الزيادة ، يتم إجراء تحويل أفيني ، بما في ذلك الترجمة الأفقية والعمودية مع ± 10 بكسل ، وتدوير الصورة عند درجة 90 ± ، والوجه الأفقي والرأسي ، وتحويل الكثافة مع تباين قدره ± 5 بالمائة في كثافة البكسل الأصلية. بلغ عدد العينات في بيانات التدريب قبل الزيادة ، المنتمية إلى فصول صحية ، وأقل خللًا ، ومتوسطًا خاطئًا ، وكامل الخطأ 1056 ، و 205 ، و 74 ، و 501 على التوالي. يقتصر حجم بيانات التدريب بعد الزيادة على 6 ، 000 عينات إجمالاً ، مع 1500 عينة لكل فئة. العينات المعززة لها توزيع متساوٍ لأربعة أنواع من التحولات. نظرًا لأن تمثيل الفصل يظل متساويًا بعد الزيادة ، فإن بيانات التدريب بعد الزيادة تحتوي على أقصى عدد من العينات المعززة (1500-74 × 1426 عينة معززة) للفصل المتوسط المعيب ، حيث كان لديه أقل عدد من عينات التدريب (74 عينة ) قبل الزيادة. بالتالي،
يحتوي الفصل الصحي على أقل عينات معززة (1500 × 1056 × 444 عينة مكبرة) ، والفئة المتوسطة المعيبة بها أكثر العينات زيادة (1 ، 426) في بيانات التدريب بعد الزيادة. لتقييم النتائج ، يتم استخدام كل من البيانات المعززة (البيانات الأصلية) والمعطيات اللاحقة المعززة بشكل منفصل ، ويتم تدريب المصنفات الفردية.
الجدول 3: نتائج التصنيف الثنائي لـ ANN العميق باستخدام البيانات الأصلية: (أ) ميزات GLCM و (ب) ميزات LBP.

5. استراتيجية التقييم والمقاييس
كما ذكرنا سابقًا في قسم زيادة البيانات ، يتم تقسيم البيانات إلى مجموعات تدريب وتحقق واختبار بنسبة 70 بالمائة و 15 بالمائة و 15 بالمائة على التوالي. بالنسبة لمصنف ANN ، يتم استخدام بيانات التدريب لتدريب النموذج ، وبيانات التحقق من الصحة لتحسينه ، واختبار البيانات لتقييم النتائج. لذلك ، يتم فقط استخدام بيانات الاختبار التي تحتوي على 15 بالمائة من العينات الأصلية غير المرئية لتقييم نتائج مصنف ANN العميق. بالنسبة لنموذج CNN ، يتم استخدام بيانات التدريب للتدريب ، ويتم استخدام بيانات الاختبار لتقييم النتائج. يتم تصنيف الخلايا الكهروضوئية بثلاثة اتجاهات: يتم تسجيل نتيجتين منفصلتين للتصنيف الثنائي والأخرى للتصنيف متعدد الفئات. يتم تحديد مهام التصنيف على النحو التالي:
(ط) التصنيف الثنائي. في مهمة التصنيف هذه ، يتم النظر في بيانات فئتين فقط: الفئة الصحية والفئة الكاملة المعيبة. لا يتم استخدام بيانات الفئتين المتبقيتين في هذه الحالة.
(2) التصنيف الثنائي مع {0}. 5 كعتبة. في مهمة التصنيف هذه ، يتم استخدام بيانات جميع الفئات ولكن يتم تمثيلها بملصقين فقط: صحي وخاطئ تمامًا. لهذا الغرض ، يتم الجمع بين عينات من الطبقة الصحية والطبقة الأقل ضررًا وتصنيفها على أنها فئة صحية. يتم الجمع بين عينات الفصول المعيبة والكاملة المعيبة وتصنيفها على أنها فئات معيبة بالكامل. بمعنى آخر ، يتم استخدام احتمال عيب قدره 0 .5 كعتبة لتحويل أربع فئات إلى فئتين ، وهذا هو سبب تعريف هذه المهمة على أنها تصنيف ثنائي مع 0.5 كحد أدنى.

(3) تصنيف متعدد الطبقات. في هذه المهمة ، يتم تصنيف البيانات وفقًا لتسمية الفئة الأصلية الخاصة بهم ، وهي صحية ، أو أقل معيبة ، أو متوسطة الخلل ، أو معيبة بالكامل. بشكل ملموس ، يتم النظر في جميع الفئات الأربعةتصنيف متعدد الطبقات.
وحدة معالجة مركزية Intel Core i3 بسرعة 2.4 جيجا هرتز وذاكرة وصول عشوائي 2 جيجا بايت. البرنامج المستخدم هو MATLAB 2018b في بيئة Windows 10. لتقييم النتائج ، مصفوفات الخلط معيتم عرض الإيجابيات الحقيقية والإيجابيات الكاذبة والسلبيات الحقيقية والسلبيات الكاذبة. كما يتم عرض نتائج الدقة الطبقية ودقة التصنيف الشاملة. علاوة على ذلك ، يتم تقديم منحنيات الخاصية التشغيلية للمستقبل (ROC) جنبًا إلى جنب مع المنطقة الواقعة أسفل المنحنى (AUC).







