خلاصة النصوص التلقائي4 – Supervised vs Unsupervised Learning

المقال الرابع من سلسلة خلاصة النصوص التلقائي لقراءت المقال الثالث علی منصة كرسي التعليمية اضغط هنا

التعلم تحت الرقابة مقارنة مع التعلم غير الخاضع للرقابة

يعد كل من التعلم تحت الإشراف وغير الخاضع للرقابة جزءًا من التعلم الآلي.

لنحدد أولاً ما هو التعلم الآلي. يشير المصطلح إلى علم تمكين أجهزة الكمبيوتر من التعلم والتصرف مثل البشر من خلال إدخال البيانات والمعلومات دون أن تتم برمجتها بشكل صريح.

ويتم تزويد خوارزميات التعلم الآلي ببيانات التدريب. لذلك كلما وردت بيانات جديدة ، يمكن لهذه الخوارزميات بسهولة التنبؤ واتخاذ القرارات بدقة بناءً على البيانات التي تم تغذيتها سابقًا.

ما هو التعلم الخاضع للرقابة وغير الخاضعة للرقابة؟

التعلم الخاضع للإشراف وغير الخاضع للرقابة

التعلم الخاضع للإشراف وغير الخاضع للرقابة هما أسلوبان للتعلم الآلي. ولكن يتم استخدام كلتا الطريقتين في سيناريوهات مختلفة ومجموعات بيانات مختلفة.

            Supervised learning             Unsupervised learning
يتم تدريب خوارزميات التعلم الخاضعة للرقابة باستخدام البيانات المسماة. يتم تدريب خوارزميات التعلم غير الخاضعة للرقابة باستخدام البيانات غير المصنفة.
 يأخذ نموذج التعلم المُراقب ردود فعل مباشرة للتحقق مما إذا كان يتنبأ بالمخرجات الصحيحة أم لا. لا يأخذ نموذج التعلم غير الخاضع للرقابة أي ملاحظات.
يتنبأ نموذج التعلم المُشرف بالمخرجات.   يجد نموذج التعلم غير الخاضع للرقابة الأنماط المخفية في البيانات.  
في التعلم تحت الإشراف ، يتم توفير بيانات الإدخال للنموذج مع الإخراج. في التعلم غير الخاضع للرقابة ، يتم توفير بيانات الإدخال فقط للنموذج.
الهدف من التعلم تحت الإشراف هو تدريب النموذج بحيث يمكنه التنبؤ بالمخرج عندما يتم إعطاؤه بيانات جديدة. الهدف من التعلم غير الخاضع للرقابة هو العثور على الأنماط الخفية والرؤى المفيدة من مجموعة البيانات غير المعروفة.
التعلم المشروط يحتاج إلى إشراف لتدريب النموذج. لا يحتاج التعلم غير الخاضع للرقابة إلى أي إشراف لتدريب النموذج.
يمكن تصنيف التعلم الخاضع للرقابة في مشاكل التصنيف والانحدار.   يمكن تصنيف التعلم غير الخاضع للرقابة في مشاكل التكتل والارتباطات.  
يمكن استخدام التعلم المُراقب في الحالات التي نعرف فيها المدخلات والمخرجات المقابلة لها.   يمكن استخدام التعلم غير الخاضع للرقابة للحالات التي لا نمتلك فيها سوى بيانات الإدخال ولا توجد بيانات مخرجات مقابلة.  
نموذج التعلم المُراقب ينتج نتيجة دقيقة. قد يعطي نموذج التعلم غير الخاضع للرقابة نتائج أقل دقة مقارنة بالتعلم تحت الإشراف.
التعلم الخاضع للإشراف ليس قريبًا من الذكاء الاصطناعي الحقيقي كما في هذا ، نقوم أولاً بتدريب النموذج لكل بيانات ، وبعد ذلك فقط يمكنه التنبؤ بالمخرج الصحيح. التعلم غير الخاضع للرقابة أقرب إلى الذكاء الاصطناعي الحقيقي لأنه يتعلم بالمثل عندما يتعلم الطفل الأشياء الروتينية اليومية من خلال تجاربه.

مثال الأول:

التعلم تحت الإشراف – هل تتذكر الوقت الذي اعتدت فيه على الذهاب إلى المدرسة؟ متى علمت لأول مرة كيف تبدو التفاحة؟ ربما عرض المعلم صورة تفاحة وقال لك ما هي ، أليس كذلك؟ ويمكنك التعرف على الفاكهة المعينة منذ ذلك الحين. هذه هي الطريقة التي يعمل بها التعلم تحت الإشراف. كما ترى في الصورة أدناه

التعلم تحت الإشراف

الخطوة 1 –تقوم بتزويد النظام بالبيانات التي تحتوي على صور التفاح ودعه يعلم أن هذه هي التفاح. هذا يسمى البيانات المصنفة.

الخطوة 2 – يتعلم النموذج من البيانات المصنفة وفي المرة التالية التي تطلب فيها منه تحديد تفاحة ، يمكنه القيام بذلك بسهولة.

التعلم غير الخاضع للرقابة – إذا أعطاك شخص ما سلة مليئة بالفواكه المختلفة وطلب منك فصلها ، فربما ستفعل ذلك بناءً على ألوانه وشكله وحجمه ، أليس كذلك؟ يعمل التعلم بدون إشراف بنفس الطريقة. كما ترون في الصورة

التعلم غير الخاضع للرقابة

الخطوة 1 – تزود النظام ببيانات تحتوي على صور لأنواع مختلفة من الفاكهة وتطلب منه فصلها. تذكر أنه في حالة التعلم غير الخاضع للرقابة ، لا تحتاج إلى تقديم بيانات مصنفة.

الخطوة 2-سيبحث النظام عن الأنماط في البيانات. أنماط مثل الشكل واللون والحجم وتجميع الثمار بناءً على تلك السمات.

لذا دعونا نلخص الاختلافات بين التعلم الخاضع للإشراف وغير الخاضع للرقابة ،

الاختلافات بين التعلم الخاضع للإشراف وغير الخاضع للرقابة
  1. نوع بيانات الإدخال – في حالة التعلم تحت الإشراف ، يتم تصنيف بيانات الإدخال وفي حالة التعلم غير الخاضع للرقابة ، تكون بيانات الإدخال غير مصنفة.
  2. التغذية الراجعة – في حالة التعلم تحت الإشراف ، يتعلم النظام من المخرج ويضعه في الاعتبار بينما في حالة التعلم غير الخاضع للرقابة ، لا يوجد أي تعلم من المخرج.
  3. الوظيفة – يُستخدم التعلم تحت الإشراف بشكل عام للتنبؤ بالبيانات ، بينما يُستخدم التعلم غير الخاضع للإشراف للعثور على البنية المخفية في البيانات.

مثال الثاني :

التعلم تحت الإشراف: هنا يتعلم الجهاز تحت الإشراف ، كما يوحي الاسم. وتتكون من نموذج يمكن التنبؤ به من خلال مجموعة بيانات مسماة. تعرف مجموعة البيانات المصنفة بالفعل ما هي الإجابة المستهدفة.

التعلم تحت الإشراف

في المثال أعلاه ، هناك صور وصفت بأنها ملعقة أو سكين. الآن ، يتم توفير هذه البيانات المسماة للجهاز ، والذي بدوره يحلل ويتعرف على ارتباط هذه الصور مع مراعاة ميزاتها بما في ذلك الشكل والحجم والحدة وما إلى ذلك. بمجرد توفير صورة جديدة غير مصنفة للجهاز ، يمكنها توقع بدقة إذا كانت هذه ملعقة استنادًا إلى البيانات السابقة.

يتم تصنيف التعلم تحت الإشراف مرة أخرى إلى نوعين – التصنيف والانحدار.

التصنيف: يمكن استخدام هذا النوع عندما يكون متغير الإخراج فئوي – مع فئتين أو أكثر. على سبيل المثال ، نعم أو لا ، ذكر أو أنثى ، صحيح أو خطأ ، إلخ.

الانحدار: يمكن استخدام هذا النوع عندما يكون متغير الإخراج قيمة حقيقية أو مستمرة. هنا ، هناك علاقة بين متغيرين أو أكثر – يرتبط التغيير في متغير واحد بتغيير في المتغير الآخر. على سبيل المثال ، الراتب بناءً على خبرة العمل أو الوزن بناءً على الطول ، إلخ.

يمكنك العثور على تطبيقات التعلم تحت الإشراف في تقييم المخاطر ، وتصنيف الصور ، وكشف الاحتيال ، والتعرف البصري.

دعونا الآن نلقي نظرة على التعلم غير الخاضع للرقابة.

هنا يعمل الجهاز مع بيانات غير مصنفة ويتعلم نفسه في غياب أي إشراف. يعمل الجهاز عن طريق البحث عن نمط في البيانات غير المسماة ثم يستجيب.

هنا لا نقول للجهاز ما هي الصورة المسماة. يحدد نفسه أنماطًا من المجموعة المقدمة ويجمعها بناءً على أنماطها وأوجه التشابه وما إلى ذلك.

التعلم غير الخاضع للرقابة

يتم تصنيف التعلم غير الخاضع للرقابة إلى مجموعات وترابطات.

التكتل: في التكتل ، تنقسم الكائنات إلى تجمعات متشابهة ولكنها تختلف عن الكائنات التي تنتمي إلى مجموعة أخرى. مثل معرفة العملاء الذين أجروا عمليات شراء مماثلة للمنتجات.

الاقتران: كما يوحي الاسم ، فإنه يكتشف احتمالية حدوث العناصر في مجموعة – التعلم الآلي القائم على القواعد. مثال لمعرفة المنتجات التي تم شراؤها معًا.

LexRank ما هو ؟

هو نهج غير خاضع للرقابة ” unsupervised ” لتلخيص النص استنادًا إلى مركزية الجمل القائمة على الرسم البياني ومشابه تمامًا لاستخراج عبارة أساسية غير خاضعة للرقابة” unsupervised keyphrase” و يحل  قضية بيانات التدريب المكلفة. تستند بعض أساليب التلخيص غير الخاضعة للرقابة على العثور على جملة “centroid” ، وهي عبارة عن متجه كلمة متوسط ” word vector”لجميع الجمل في الوثيقة. ثم يمكن ترتيب الجمل من حيث تشابهها مع هذه الجملة المركزية. LexRank هي خوارزمية مطابقة بشكل أساسي لـ TextRank ، ويستخدم كلاهما هذا الأسلوب لتلخيص المستندات. تم تطوير الطريقتين من قبل مجموعات مختلفة في نفس الوقت ، وركز LexRank ببساطة على التلخيص ، ولكن يمكن استخدامه بسهولة لاستخراج عبارة المفاتيح أو أي مهمة أخرى في ترتيب البرمجة اللغوية العصبية NLP.

في كل من LexRank و TextRank ، يتم إنشاء رسم بياني عن طريق إنشاء قمة لكل جملة في المستند.

TextRank تستند الحواف بين الجمل إلى شكل من أشكال التشابه الدلالي أو تداخل المحتوى. بينما يستخدم LexRank تشابه جيب ” cosine similarity”لمتجهات TF-IDF ، يستخدم TextRank مقياسًا مشابهًا جدًا استنادًا إلى عدد الكلمات التي تشترك فيها جملتان (تم تسويتها من خلال أطوال الجمل). تستكشف ورقة LexRank باستخدام حواف غير موزونه بعد تطبيق عتبة لقيم جيب ” cosine ” ، ولكن جرب أيضًا استخدام حواف ذات أوزان تساوي درجة التشابه. بينما يستخدم TextRank درجات التشابه التواصلية كأوزان.

تم استخدام TextRank لتلخيص مستند واحد ، بينما تم تطبيق LexRank على تلخيص متعدد المستندات. تظل وظيفة كما هي في كلتا الحالتين – فقط  اختلاف في عدد الجمل المختارة . ولكن عند تلخيص مستندات متعددة ، هناك احتمالية أكبر من اختيار الجمل المكررة أو الزائدة عن الحاجة لوضعها في نفس الملخص. تخيل أن لديك مجموعة من المقالات الإخبارية حول حدث معين ، وتريد إنتاج ملخص واحد. من المحتمل أن تحتوي كل مقالة على العديد من الجمل المتشابهة ، وستحتاج فقط إلى تضمين أفكار مميزة في الملخص. لمعالجة هذه المشكلة ، يطبق LexRank خطوة ما بعد المعالجة الإرشادية التي تبني ملخصًا عن طريق إضافة جمل بالترتيب ، ولكنها تتجاهل أي جمل متشابهة جدًا مع الجمل الموضوعة بالفعل في الملخص. تُسمى الطريقة المستخدمة جمع معلومات الجمل المتقاطعة (CSIS).

سوف نتحدث في المقال التالي عن دراسة أساليب تلخيص النص التلقائي

منشور ذات صلة
سلسلة دروس: خلاصةالنصوص التلقائي

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

السلة