تصنيف مستوى الأعطال للخلايا الكهروضوئية باستخدام نماذج تعلم عميق وخفيفة الوزن

Jun 27, 2023

نشر الخلايا الكهروضوئية كخلايا متجددةمصدر طاقةتم تعزيزه مؤخرًا ، مما عزز الحاجة إلى تطوير نظام آلي وسريع لاكتشاف الأعطال للخلايا الكهروضوئية. قبل العزل للإصلاح أو الاستبدال ، من الأهمية بمكان الحكم على مستوى الخطأ الذي حدث في الخلية الكهروضوئية. الهدف من هذه الدراسة البحثية هو تصنيف مستوى الخطأ للخلايا الكهروضوئية التي تستخدم نماذج الشبكة العصبية العميقة. تم إجراء التجربة باستخدام مجموعة بيانات متاحة للجمهور تتكون من 2624 صورة تلألؤ كهربي للخلايا الكهروضوئية ، والتي تم تصنيفها بأربعة احتمالات عيب مميزة محددة على أنها مستويات الخلل. تم تطوير البنى العميقة للشبكات العصبية الاصطناعية الكلاسيكية أثناء استخدام ميزات النسيج المصنوعة يدويًا المستخرجة من بيانات صورة EL. علاوة على ذلك ، تم تطوير بنيات محسّنة للشبكة العصبية التلافيفية مع التركيز بشكل خاص على النماذج خفيفة الوزن للمعالجة في الوقت الفعلي. يتم إجراء التجارب للتصنيف الثنائي ثنائي الاتجاه والتصنيف متعدد الطبقات. بالنسبة للتصنيف الثنائي الأول ، تفوق نموذج CNN المقترح على أحدث الحلول بهامش دقة يبلغ 1.3 بالمائة مع تعقيد حسابي أقل بنسبة 5 0 بالمائة. في مهمة التصنيف الثنائي الثانية ، تفوق النموذج المقترح المعتمد على وحدة المعالجة المركزية على الحل القائم على وحدة معالجة الرسومات بهامش دقة 0.9 بالمائة مع بنية أخف 8 ×. أخيرًا ، يتم إجراء التصنيف متعدد الطبقات للخلايا الكهروضوئية ويتم تحقيق أحدث النتائج بدقة 83.5 بالمائة. تقدم النماذج المقترحة حلاً يعتمد على وحدة المعالجة المركزية (CPU) خفيف الوزن وفعال وأرخص تكلفة من الناحية الحسابية لتصنيف مستوى الخطأ في الوقت الفعلي للخلايا الكهروضوئية.

Cistanche boost energy

انقر هنا للحصول على أقراص Cistanche لزيادة الطاقة

Buy Cistanche

1 المقدمة

مع بداية القرن الحادي والعشرين ، تحفيزتحسين كفاءة الطاقةزادت السياسات من الاهتمام العام بالطاقة المتجددة ، على وجه الخصوصطاقة شمسية، لأنها خالية من الضوضاء والتلوث. فتح هذا الاهتمام أبواب الدراسات البحثية في تحقيق الأداء الأمثل لأنظمة الطاقة الشمسية. أنظمة الطاقة بشكل عام من نوعين: أنظمة نشطة وأنظمة سلبية [1]. الأنظمة السلبية لا تستهلك الطاقة ؛ بل يقومون بتحويل الطاقة من شكل إلى آخر. الأنظمة الكهروضوئية (PV) هي أنظمة سلبية بحتة حيث يتم توليد الطاقة الكهربائية مباشرة من أشباه الموصلات من خلال التأثير الكهروضوئي. مع مرور الوقت ، قد تحدث أنواع مختلفة من الأخطاء مما يقلل من كفاءة الخلية الكهروضوئية مثل خطأ نقطة الاتصال ، وخطأ الصمام الثنائي ، وخطأ صندوق التوصيل ، والخطأ الأرضي ، وخطأ القوس ، وخطأ شريان الحياة [2]. قد ترتفع هذه العيوب بسبب تكسر الزجاج ، والأكسدة ، وتفريغ الخلايا ، والفقاعات [2]. بصرف النظر عن تقليل الكفاءة ، هناك خطر نشوب حريق أيضًا. لاكتشاف وتشخيص مثل هذه الأخطاء ، هناك عدة طرق في الممارسة العملية بما في ذلك معالجة الإشارات ، والأساليب الإحصائية ، وتحليل منحنى الجهد الحالي ، وتحليل فقدان الطاقة ، والتقنيات القائمة على التعلم الآلي [3].

لاكتشاف الخطأ ، يتم إجراء مقارنة بين القياس المرجعي والملاحظ. للحفاظ على كفاءة النظام الكهروضوئي ، يجب اكتشاف الأعطال في المقام الأول متبوعة بعزل الخلية المعيبة أو صيانتها. لاكتشاف العيوب مثل microcracks في الأنظمة الكهروضوئية ، يمكن العثور على العديد من التقنيات في الأدبيات [4]. واحد من بينها هو شعاع الليزر المستحث بالتيار (LBIC).

إنها طريقة بصرية لمراقبة التشققات الدقيقة في الخلايا الكهروضوئية [5 ، 6]. يتم إنتاج شعاع ليزر AC بطول موجة يتراوح من 638 نانومتر إلى 850 نانومتر عن طريق تعديل التيار الكهربائي من خلال الصمام الثنائي الليزري وتوجيهه على جهاز حساس للضوء. هذا يتسبب في تدفق التيار المباشر (DC) عبر أشباه الموصلات. يشير الاختلاف الحالي الكبير عن طريق تغيير موضع الخلية الكهروضوئية إلى وجود الخلل [7-9]. تقنية أخرى ، التيار الناجم عن شعاع الإلكترون (EBIC) هي تقنية التحليل القائمة على أشباه الموصلات التي يتم فيها تحفيز التيار في العينة واستخدامه كإشارة إطلاق لتوليد الصورة. تسلط الصورة الضوء على العيوب المحلية للخلية الكهروضوئية. يتم تنفيذ معظم تقنيات الشعاع الإلكتروني باستخدام المجهر الإلكتروني الماسح (SEM) [10]. التصوير الضوئي (PL) هو طريقة أخرى حيث يتم إثارة الإلكترونات في نطاق التوصيل بعد امتصاص الفوتون. يتسبب في إعادة تركيب زوج ثقب الإلكترون. يتم التقاط الصورة من خلال كاميرا CCD. تُستخدم طريقة التصوير بالتلألؤ الكهربائي (EL) أيضًا للكشف عن التشققات الدقيقة للرقاقات والخلايا الشمسية من خلال استخدام التصوير اللامع. EL هو شكل من أشكال اللمعان الذي يتم فيه إثارة الإلكترونات في نطاق التوصيل عندما يمر تيار كهربائي في وضع التحيز الأمامي من خلاله. ينبعث من إثارة الإلكترونات أشعة تحت حمراء بطول موجة يتراوح بين 950 و 1250 نانومتر. ثم يتم التقاط صورة الخلية الشمسية من خلال كاميرات جهاز الشحن المزدوج (CCD) [10]. تظهر الخلية الكهروضوئية المعيبة أو المنفصلة أكثر قتامة [11]. يمكن تحديد موقع الخلل بسهولة من خلال التصور. تظهر ظاهرة التصوير EL في الشكل 1. والفرق بين EL و PL هو أن تقنية PL تتضمن إثارة الإلكترونات باستخدام ضوء الليزر بدلاً من التيار الكهربائي [12]. تعمل تقنية التصوير EL مع الخلايا الكهروضوئية النهائية ، بينما تستخدم تقنية التصوير PL لكل من الرقائق والخلايا الشمسية.



تم استخدام الشبكات العصبية التلافيفية (CNN) بنجاح لمهام التعرف على الأنماط. ومع ذلك ، في الأدبيات ، لا يوجد سوى عدد قليل من الدراسات التي تتضمن CNN لتصنيف بيانات الصورة EL ، لا سيما التصنيف على مستوى العيب. ركز معظمهم على مشكلة التصنيف الثنائي حيث تم اقتراح حلول باهظة الثمن تعتمد على وحدة معالجة الرسومات. في الواقع ، اقترحت دراستان فقط حلولًا أرخص في الوقت الفعلي تعتمد على وحدة المعالجة المركزية. في هذا البحث ، نهدف إلى تطوير نماذج خفيفة الوزن قائمة على CNN مناسبة لأجهزة وحدة المعالجة المركزية للمعالجة في الوقت الفعلي. مساهمات تي

من هذه الورقة تتلخص على النحو التالي:

(ط) قدرة التعلم العميق لتجارب الشبكة العصبية المتصلة بالكامل مع ميزات مصنوعة يدويًا لتصنيف مستوى الخطأ للخلايا الكهروضوئية. يتم إجراء زيادة البيانات لتحقيق التوازن بين تمثيل الفئة ويتم تقديم كل من نتائج ما قبل التكبير وما بعد الضخ.
(2) يتم إجراء التصنيف الثنائي ثنائي الاتجاه عن طريق فصل البيانات بطريقتين منفصلتين ؛ ومن ثم ، يتم تقديم النتيجتين المستقلتين للتصنيف الثنائي.
(3) تم تطوير بنية CNN مخصصة وأبسط وفعالة حسابيًا لضمان التصنيف في الوقت الفعلي لبيانات صورة EL. يحتوي نموذج CNN المقترح على معلمات أقل بنسبة 50 في المائة من الحل الحديث القائم على شبكة CNN.

(4) حقق نموذج CNN المقترح لـ Te نتائج متطورة مع وقت تدريب أقصر بمقدار 23 ×. علاوة على ذلك ، يتم تقديم أحدث نتيجة للتصنيف المتعدد لبيانات صورة EL.


تم تنظيم بقية الورقة على النحو التالي: يعرض القسم 2 العمل ذي الصلة ، ويتم توفير تفاصيل مجموعة البيانات في القسم 3 ، ويتم شرح المنهجية في القسم 4 ، واستراتيجية تقييم الأداء والمقاييس معروضة في القسم 5 ، القسم 6 يتضمن النتائج والمناقشة ، ويقدم القسم 7 تحليلاً مقارناً مفصلاً ، وأخيراً ، تمت إضافة الاستنتاج في القسم 8.


2. العمل ذات الصلة

إحدى الطرق الأساسية لاكتشاف الأخطاء هي مقارنة طاقة الخرج المرصودة بالقدرة المرجعية. يشير الاختلاف الأعلى من الحد المحدد إلى وجود خطأ [13 ، 14]. قدمت دراسة تطبيق مرشح كالمان للتنبؤ بإخراج الطاقة [15]. تم أخذ القياسات الصاخبة كمدخلات وتم إعطاؤها للنموذج الأساسي المادي ، والذي أنتج قيمة مخرجات مع أعلى احتمال. ثم تم استخدام الخرج لتحديد موقع العيوب ضمن قياسات الجهد والتيار والطاقة. كما تم استخدام تقنيات تستند إلى الذكاء الاصطناعي لاكتشاف الأخطاء. تم اختبار خوارزميات منطق بايزي وضبابي لتحديد ناتج الخلية الكهروضوئية [16]. تم استخدام كل من تقنيات التعلم الآلي الخاضعة للإشراف وغير الخاضعة للإشراف لتشخيص أعطال النظام الكهروضوئي مثل k- الجار الأقرب ، وشجرة القرار ، وآلة ناقلات الدعم (SVM) [17]. في دراسة ، تم تطوير نموذج الشبكة العصبية الاصطناعية (ANN) ل

حدد موقع الدائرة القصيرة (SC) في الخلايا الكهروضوئية [18]. في دراسة أخرى ، تم استخدام شبكة بايزي (BN) لوصف أسباب الأخطاء المكتشفة [19]. ادعى بحث آخر أن معدل الخطأ هو 0 35 - 0 55 من خلال الجمع بين نهجين: SVM وأقرب جار لاكتشاف أخطاء PV [20]. قدم محمد ونصار حلاً قائمًا على ANN لتشخيص وإصلاح الأنظمة الكهروضوئية [21]. تضمنت الدراسات المذكورة أعلاه تقنيات التعلم الآلي لاكتشاف الأخطاء وتشخيصها. ومع ذلك ، كانت الميزات المستخدمة في تلك الدراسات هي القراءات المقاسة للتيار والجهد والطاقة ، والتي تنطوي على الفحص اليدوي والتسجيل الممل.



بالنظر إلى سيناريو الفحص المادي ، في معظم الحالات ، يتم وضع الأنظمة الكهروضوئية في أماكن مرتفعة مما يجعل من الصعب تحديد موقع الخطأ وعزل الخلية المعيبة [22]. قد تكون المركبة الجوية غير المأهولة (UAV) المزودة بكاميرا حرارية حلاً لاكتشاف الأخطاء في مثل هذا السيناريو [23]. تكشف الصور الملتقطة بكاميرا حرارية عن موقع الخلل في الخلايا الشمسية بشكل ملائم للغاية. تُظهر الأدبيات الحديثة استخدام التصوير الحراري للكشف عن الأعطال الكهروضوئية وتصنيفها. ومع ذلك ، فإن لها حدودها الخاصة [24-26]. كما تم إجراء تصوير الأشعة تحت الحمراء (IR) للكشف عن الأعطال في الخلايا الشمسية [9 ، 27]. ومع ذلك ، من الصعب تحديد الموقع الدقيق للخطأ وتحديد التشققات الدقيقة في صور الأشعة تحت الحمراء نظرًا لدقتها المنخفضة نسبيًا. خلص المؤلف إلى أن المنطقة الساخنة في صور الأشعة تحت الحمراء قد تؤدي إلى نتيجة إيجابية خاطئة. التصوير EL ، كما ذكرنا سابقًا ، هو تقنية لتحديد الأعطال في الخلايا الكهروضوئية ، والتي تتضمن التقاططاقة الأشعة تحت الحمراءالمنبعثة من الخلية في شكل صورة ذات مقياس رمادي. توفر صورة EL الناتجة دقة أفضل من صورة الأشعة تحت الحمراء [28 ، 29]. تم إجراء العديد من الدراسات لاكتشاف الأعطال في الخلايا الكهروضوئية ، ولكن القليل منها اعتبر التصوير EL. قدمت دراسة تقنية فورييه لإعادة بناء الصورة لاكتشاف الأخطاء في صور EL [30]. ومع ذلك ، اعتبر المؤلفون عيوبًا محدودة بما في ذلك مقاطعة الأصابع والشقوق الصغيرة والكسور. علاوة على ذلك ، كانت طريقة كشف معقدة بسبب افتراضات الشكل. استخدمت دراسة أخرى [31] تحليل المكونات المستقلة (ICA) لاكتشاف العيوب. ومع ذلك ، اعتبر انقطاع الإصبع والشقوق عيوبًا متساوية. في دراسة أخرى ، قدم Stromer خوارزمية الأوعية الدموية لتجزئة الكراك. ومع ذلك ، تم النظر في الشقوق التي يزيد حجمها عن 20 ملم [32]. في الآونة الأخيرة ، تم استخدام التعلم العميق والشبكات العصبية التلافيفية (CNNs) للكشف عن الخلل في الوحدات الكهروضوئية. في دراسة [33] ، تم تقديم الفحص التلقائي للوحدات الكهروضوئية باستخدام التعلم العميق ، ومع ذلك ، تم النظر فقط في العيوب المرئية. وبالمثل ، تم اقتراح CNN متعدد الأطياف لاكتشاف الخطأ المرئي [34]. قدمت دراسة حديثة تصنيف الخطأ في صور التلألؤ الكهربائي بما في ذلك تصنيفات خالية من العيوب ، والتكسير الدقيق ، والكسر ، وانقطاع الإصبع [35]. تم جمع مجموعة البيانات من شركة خاصة وكذلك من المجال العام. تم استخدام شبكة الخصومة العامة (GAN) لزيادة البيانات وتم استخدام نماذج CNN المدربة مسبقًا لتصنيف العيوب ، والتي تم تدريبها في الأصل على تحدي ImageNet [36]. استخدمت دراسة أخرى نموذج CNN لتصنيف الخلل في الخلايا الكهروضوئية [37]. ومع ذلك ، تم استخدام بيانات صورة الأشعة تحت الحمراء لهذا الغرض



بصرف النظر عن الكشف عن الخلل أو تصنيفه ، فقد أجريت مؤخرًا دراسات للكشف عن مستوى الخلل. قدمت دراسة نهج التعلم العميق لتصنيف مستوى الخلل في الخلايا الكهروضوئية باستخدام صور EL [38]. لهذا الغرض ، تم استخدام مجموعة بيانات عامة لصور EL مُصنَّفة بأربعة مستويات عيب مميزة مثل الفئات [39]. استخدم المؤلف نموذج VGG -19 الذي تم تدريبه مسبقًا على CNN وضبطه عبر نقل التعلم. أنتج النموذج دقة 88.4 بالمائة للتصنيف الثنائي ؛ ومع ذلك ، تم إجراء التجربة على آلة تعتمد على وحدة معالجة الرسومات (GPU) ، مما يجعلها حلاً مكلفًا من الناحية الحسابية. أجرى المؤلفون أيضًا تصنيفًا قائمًا على SVM للمعالجة في الوقت الفعلي وحققوا دقة تصل إلى 82.4 بالمائة. اقترحت دراسة حديثة أخرى بنية CNN خفيفة لتصنيف ثنائي على مستوى الخلل لنفس بيانات صورة EL [40]. اعتبر المؤلفون VGG -11 بمثابة بنية CNN الأولية وقاموا بتبسيطها للحصول على البنية المثالية والخفيفة لمهمة التصنيف. ادعى المؤلفون دقة تصنيف 93.02 في المائة ؛ ومع ذلك ، لم يتم ذكر كيف انتهى الأمر بالفئات المستهدفة الأربعة الأصلية إلى فئتين لإجراء التصنيف الثنائي. تم إجراء زيادة البيانات أيضًا ولكن لم يتم ذكر إجمالي العينات ، بالإضافة إلى دليل على موازنة الفئات بعد إجراء الزيادة.

Cistanche boost energy

بشكل ملموس ، لا يزال تحليل وتصنيف العيوب وكذلك تصنيف مستوى الخطأ في الصور الكهروضوئية في الوقت الفعلي يتطلب مزيدًا من البحث في العديد من الجوانب مثل زيادة حجم البيانات عبر طرق زيادة البيانات الفعالة ؛ تقدير خوارزميات التعلم الآلي الأبسط والأمثل لتعزيز المتانة ؛ ولتقدير شبكة أخف وزناً لتحقيق المعالجة في الوقت الفعلي. بالإضافة إلى ذلك ، نظرًا لكونها فئات ذات أربع تصنيفات لبيانات صورة EL المتاحة للجمهور [39] ، فلا يوجد دليل على تصنيف متعدد الفئات في الأدبيات. لذلك ، هناك حاجة لتطوير نظام لتصنيف متعدد المستويات أيضًا.



3. مجموعة البيانات

في هذا البحث ، يتم استخدام مجموعة بيانات متاحة للجمهور لصور EL [39]. وهو يتألف من 2624 عينة صور من الخلايا الكهروضوئية السليمة وكذلك المعيبة. كل عينة عبارة عن صورة 8- بت ذات مقياس رمادي وبدقة 300 × 300 بكسل. تم استخراج عينات الصور هذه في الأصل على مستوى الخلية من الوحدات الكهروضوئية أحادية ومتعددة البلورات وتم تطبيعها فيما يتعلق بالمنظور والحجم. تم تلخيص تفاصيل مجموعة البيانات في الجدول 1.

تم تحليل الصور الأصلية في البداية من قبل خبراء بشريين بناءً على حالة عمل الخلية ، وتم تعيين الملصقات من حيث احتمال العيب. هناك أربع فئات مميزة مسماة باحتمالية العيب {{0}. 0 ، 0. 33 ، 0. 66 ، 1. 0 ، حيث يمثل احتمال العيب 0. {{1 0} يمثل الخلية السليمة الكاملة ؛ احتمال وجود عيب 0. 33 يميز الخلية الأقل عيبًا ؛ يمثل 0.66 احتمالًا متوسطًا للخطأ والعيب ، ويشير 1.0 إلى الخلية المعيبة الكاملة. بشكل ملموس ، يمثل احتمال الخلل مستوى عيب الخلية الكهروضوئية.



الجدول 1: تفاصيل مجموعة البيانات المستخدمة في العمل المقترح

Cistanche boost energy


يتم عرض بعض العينات من مجموعة البيانات التي تنتمي إلى الفئات الفردية في الشكل 2. هناك أنواع مختلفة من العيوب المصنفة بما في ذلك التشققات الصغيرة وعيوب المواد وانقطاعات الأصابع والكسور التي تؤثر على كفاءة الخلايا الكهروضوئية. على الرغم من أن مجموعة بيانات صورة EL تتكون من عينات صور بأربع تسميات للفصول ؛ ومع ذلك ، فإن عدد الصور التي تنتمي إلى كل فئة ليس هو نفسه. ينتمي الحد الأقصى لعدد العينات إلى الفئة السليمة (احتمال العيب 0. 0) ، في حين أن أقل تمثيل هو للفئة ذات احتمال العيب 0. 66. يرد عدد العينات الأصلية في مجموعة البيانات في الجدول 2.



4. المنهجية

4.1 نموذج الشبكة العصبية الفنية. من بين الأساليب المعتمدة على البيانات لتطبيقات التعرف على الأنماط والتصنيف ، تم استخدام ANN بنجاح في العقدين الماضيين. يمكن تقدير البنى المخصصة للشبكات العصبية للتغذية الأمامية لاستيعاب الطبيعة المعقدة لعلاقة المدخلات والمخرجات للبيانات. في هذا العمل ، يتم استخدام بنى ANN العميقة. لتصنيف بيانات صورة EL ، يتم تقدير بنيات ANN بدءًا من طبقة مخفية واحدة ثم تمتد إلى طبقات مخفية متعددة حتى يتم تحسينها. الحجم

من كل طبقة مخفية يتم تقديرها أيضًا في العملية من خلال ملاحظة خطأ التحقق من الصحة. تُستخدم خوارزمية Levenberg-Marquardt (LM) لتدريب الشبكة مع صفر خطأ مربع متوسط ​​(MSE) كمعايير التقارب. تمت إضافة وصف البنى التقديرية النهائية في قسم النتائج.


Cistanche boost energy

4.2 ميزات مصنوعة يدويًا.يتطلب ANN ميزاتتتغذى. هناك عدة أنواع من الميزات التي قد تكونفي الاعتبار ، بما في ذلك سمات كثيرة الحدود [41-43]. كيفمن أي وقت مضى ، اخترنا نوعين من الشعبية والمستخدمة على نطاق واسعالميزات المصنوعة يدويًا: مصفوفة التواجد المشترك ذات المستوى الرمادي(GLCM) وميزات النمط الثنائي المحلي (LBP).

4.2.1. مصفوفة تواجد المستوى الرمادي. تمثل GLCM احتمالات مشتركة مكانيًا لشدة البكسل في الصورة. الميزات المحسوبة من GLCM كلاسيكية لكنها فعالة وتوفر تحليل نسيج الصورة ، الذي اقترحه في الأصل Haralick et al. [44]. تم حساب إجمالي الميزات الـ 22 التالية من كلٍ من أربع GLCMs المحسوبة بزوايا 0 و 45 و 90 و 135 درجة [45]: au \ tocorrelation 1 ، التباين ، الارتباط التلقائي 2 ، الارتباط التبادلي ، بروز المجموعة ، الظل العنقودي ، الاختلاف ،طاقة، الانتروبيا ، التجانس ، الاحتمال الأقصى ، مجموع المربعات ، متوسط ​​المجموع ، مجموع التباين ، مجموع الانتروبيا ، تباين الاختلاف ، إنتروبيا الفرق ، قياس معلومات الارتباط 1 ، قياس معلومات الارتباط 2 ، الفرق العكسي ، الفروق العكسية المقيسة ، وحظة الفرق العكسي تطبيع. تم استخراج ما مجموعه 88 ميزة من كل صورة.

4.2.2. الأنماط الثنائية المحلية. تم أيضًا استخدام الأنماط الثنائية المحلية (LBP) كميزات على نطاق واسع لتطبيقات التعرف على الأنماط ورؤية الكمبيوتر. يتم إنشاء أبسط متجه لميزة LBP وفقًا للخطوات التالية:

(ط) تقسيم النافذة المراد فحصها إلى خلايا 9 × 9 بكسل لكل خلية.
(2) مقارنة كل بكسل مجاور بالبكسل المركزي
(iii) تعيين قيمته 0 إذا كانت أقل من قيمة البكسل المركزية ، وإلا 1. يوفر هذا رقمًا ثنائيًا 8-.
(4) حساب الرسم البياني للخلية لتكرار كل رقم يحدث.
(ت) تطبيع الرسم البياني.

(6) ربط الرسوم البيانية الطبيعية لجميع الخلايا.

من كل صورة ، تم حساب 59- الأبعاد لمتجه LBP.



4.3 شبكة عصبية تلافيفية مخصصة.

تم استخدام شبكات CNN بنجاح في الماضي القريب للعديد من التطبيقات من مهام التعرف البصري البسيطة إلى أنظمة القيادة الذاتية للمركبة. تتكون شبكة CNN من طبقات تلافيفية وطبقات تجميع ووظائف تنشيط وطبقات متصلة بالكامل (FC). تلعب الطبقة التلافيفية دورًا حيويًا لأنها تستخرج الميزات من الصور. ترتبط الطبقة التلافيفية الأولى بالبكسل الخام ، وتستخرج ميزات منخفضة المستوى مثل الحواف ، حيث تحصل الطبقة التالية على معلومات متوسطة المستوى ، وبالتالي تستخرج الطبقات التالية ميزات عالية المستوى. يتم استخدام طبقة التجميع لتقليل حجم الميزات المكتسبة بتجاهل أقلمعلومات مهمة. تشبه طبقة FC طبقةANN ، حيث تكون كل خلية عصبية من الطبقة السابقة تخدعمتصل بكل خلية عصبية في الطبقة الحالية. عدد اليتم الاحتفاظ بالخلايا العصبية في طبقة الإخراج مساوية لعددتسميات الإخراج. حسب الطلب ، فهذا يعني أن الشبكةبنيت من الصفر. يتم اختيار بنية Te عن طريق الزيادةحجم وتسجيل نتائج التصنيف على التدريببيانات. تفاصيل البنى والتصنيفالمهام موصوفة في قسم النتائج.



Cistanche boost energy


الشكل 2: تُظهر عينات قليلة من مجموعة بيانات صور EL مع احتمالات عيوب واضحة أنواعًا مختلفة من العيوب



الجدول 2: حجم بيانات صورة التلألؤ الكهربائي: طبقي

Cistanche boost energy

4.4. زيادة البيانات. تشتمل مجموعة بيانات صورة EL على أربع فئات متميزة. يمكن ملاحظة من الجدول 3 أن تمثيل الفئة الخاطئة الكاملة (احتمالية العيب 1. 0) تقريبًا 5 0 في المائة من تمثيل الفئة السليمة (احتمال العيب {{7) }}. 0). يمكن أيضًا ملاحظة وجود تمثيل صغير بشكل ملحوظ للفئة المتوسطة الخاطئة (احتمال العيب 0. 33). أقل تمثيل بين الجميع هو فئة الخلل المتوسط ​​(احتمالية العيب 0.66). نظرًا لأن تقنيات التعلم الآلي تعتمد على البيانات ، لذلك ، بالنسبة لأي مجموعة بيانات ، يكون المصنف متحيزًا بطبيعته تجاه الفئة المستهدفة التي تحتوي على أكبر عدد من العينات. لذلك ، لضمان التعلم غير المتحيز للمصنف ، من المهم موازنة الفئات المستهدفة قبل تدريب النموذج. يتم ذلك عادةً باستخدام زيادة البيانات عندما لا يكون الحصول على بيانات جديدة عملية سهلة. من المهم أيضًا أن يتم تطبيق الزيادة على بيانات التدريب فقط ، بينما يتم فصل بيانات الاختبار مسبقًا. بمعنى آخر ، يجب تدريب المصنف على بيانات التدريب حيث قد يكون لديه عينات معززة لموازنة جميع الفئات المستهدفة ؛ ومع ذلك ، يجب أن تكون بيانات الاختبار أصلية دون أي عينة مكثفة.



في البداية ، يتم اختيار البيانات الأصلية بشكل عشوائي وتنقسم إلى تدريب ، والتحقق من الصحة ، والاختبار بنسبة 70 في المائة و 15 في المائة و 15 في المائة على التوالي. في هذه المرحلة ، تحتوي كل من بيانات التحقق من الصحة ومجموعات بيانات الاختبار على 226 ، و 45 ، و 16 ، و 107 صورة للفئات الصحية ، والأقل خللًا ، والمتوسط ​​الخاطئ ، والخطأ الكامل ، حيث تم فصل هذه المجموعات لاستخدامها لاحقًا. بعد ذلك ، يتم استخدام بيانات التدريب للتعزيز لموازنة الفصول بحيث يمكن التأكد من التدريب غير المتحيز للمصنف. من أجل الزيادة ، يتم إجراء تحويل أفيني ، بما في ذلك الترجمة الأفقية والعمودية مع ± 10 بكسل ، وتدوير الصورة عند درجة 90 ± ، والوجه الأفقي والرأسي ، وتحويل الكثافة مع تباين قدره ± 5 بالمائة في كثافة البكسل الأصلية. بلغ عدد العينات في بيانات التدريب قبل الزيادة ، المنتمية إلى فصول صحية ، وأقل خللًا ، ومتوسطًا خاطئًا ، وكامل الخطأ 1056 ، و 205 ، و 74 ، و 501 على التوالي. يقتصر حجم بيانات التدريب بعد الزيادة على 6 ، 000 عينات إجمالاً ، مع 1500 عينة لكل فئة. العينات المعززة لها توزيع متساوٍ لأربعة أنواع من التحولات. نظرًا لأن تمثيل الفصل يظل متساويًا بعد الزيادة ، فإن بيانات التدريب بعد الزيادة تحتوي على أقصى عدد من العينات المعززة (1500-74 × 1426 عينة معززة) للفصل المتوسط ​​المعيب ، حيث كان لديه أقل عدد من عينات التدريب (74 عينة ) قبل الزيادة. بالتالي،

يحتوي الفصل الصحي على أقل عينات معززة (1500 × 1056 × 444 عينة مكبرة) ، والفئة المتوسطة المعيبة بها أكثر العينات زيادة (1 ، 426) في بيانات التدريب بعد الزيادة. لتقييم النتائج ، يتم استخدام كل من البيانات المعززة (البيانات الأصلية) والمعطيات اللاحقة المعززة بشكل منفصل ، ويتم تدريب المصنفات الفردية.


الجدول 3: نتائج التصنيف الثنائي لـ ANN العميق باستخدام البيانات الأصلية: (أ) ميزات GLCM و (ب) ميزات LBP.

Cistanche boost energy



5. استراتيجية التقييم والمقاييس

كما ذكرنا سابقًا في قسم زيادة البيانات ، يتم تقسيم البيانات إلى مجموعات تدريب وتحقق واختبار بنسبة 70 بالمائة و 15 بالمائة و 15 بالمائة على التوالي. بالنسبة لمصنف ANN ، يتم استخدام بيانات التدريب لتدريب النموذج ، وبيانات التحقق من الصحة لتحسينه ، واختبار البيانات لتقييم النتائج. لذلك ، يتم فقط استخدام بيانات الاختبار التي تحتوي على 15 بالمائة من العينات الأصلية غير المرئية لتقييم نتائج مصنف ANN العميق. بالنسبة لنموذج CNN ، يتم استخدام بيانات التدريب للتدريب ، ويتم استخدام بيانات الاختبار لتقييم النتائج. يتم تصنيف الخلايا الكهروضوئية بثلاثة اتجاهات: يتم تسجيل نتيجتين منفصلتين للتصنيف الثنائي والأخرى للتصنيف متعدد الفئات. يتم تحديد مهام التصنيف على النحو التالي:

(ط) التصنيف الثنائي. في مهمة التصنيف هذه ، يتم النظر في بيانات فئتين فقط: الفئة الصحية والفئة الكاملة المعيبة. لا يتم استخدام بيانات الفئتين المتبقيتين في هذه الحالة.

(2) التصنيف الثنائي مع {0}. 5 كعتبة. في مهمة التصنيف هذه ، يتم استخدام بيانات جميع الفئات ولكن يتم تمثيلها بملصقين فقط: صحي وخاطئ تمامًا. لهذا الغرض ، يتم الجمع بين عينات من الطبقة الصحية والطبقة الأقل ضررًا وتصنيفها على أنها فئة صحية. يتم الجمع بين عينات الفصول المعيبة والكاملة المعيبة وتصنيفها على أنها فئات معيبة بالكامل. بمعنى آخر ، يتم استخدام احتمال عيب قدره 0 .5 كعتبة لتحويل أربع فئات إلى فئتين ، وهذا هو سبب تعريف هذه المهمة على أنها تصنيف ثنائي مع 0.5 كحد أدنى.

Cistanche boost energy

(3) تصنيف متعدد الطبقات. في هذه المهمة ، يتم تصنيف البيانات وفقًا لتسمية الفئة الأصلية الخاصة بهم ، وهي صحية ، أو أقل معيبة ، أو متوسطة الخلل ، أو معيبة بالكامل. بشكل ملموس ، يتم النظر في جميع الفئات الأربعةتصنيف متعدد الطبقات.

يظهر الرسم التخطيطي للمنهجية الشاملة في الشكل 3. بالنسبة لكل مهمة من مهام التصنيف ، تتم مناقشة هندسة الشبكة المثلى المقدرة واختيار المعلمات الفائقة والنتائج المقابلة في القسم التالي. كما هو موضح سابقًا ، تم حساب النتائج بشكل منفصل على البيانات المعززة مسبقًا (الأصلية) بالإضافة إلى البيانات المعززة لاحقًا.
5.1 تفاصيل الجهاز. يتم إجراء التجربة على جهاز كمبيوتر محمول بمواصفات الأجهزة التالية:

وحدة معالجة مركزية Intel Core i3 بسرعة 2.4 جيجا هرتز وذاكرة وصول عشوائي 2 جيجا بايت. البرنامج المستخدم هو MATLAB 2018b في بيئة Windows 10. لتقييم النتائج ، مصفوفات الخلط معيتم عرض الإيجابيات الحقيقية والإيجابيات الكاذبة والسلبيات الحقيقية والسلبيات الكاذبة. كما يتم عرض نتائج الدقة الطبقية ودقة التصنيف الشاملة. علاوة على ذلك ، يتم تقديم منحنيات الخاصية التشغيلية للمستقبل (ROC) جنبًا إلى جنب مع المنطقة الواقعة أسفل المنحنى (AUC).









قد يعجبك ايضا