التعلم الخاضع للإشراف: كيفية تعليم الآلات لمساعدتنا

نشرت: 2021-02-11

يمكنك التفكير في التعلم الخاضع للإشراف كمدرس يشرف على عملية التعلم بأكملها.

إنها إحدى أكثر الطرق التي تتعلم بها الآلات شيوعًا ، وهي أداة لا تقدر بثمن في مجال الذكاء الاصطناعي. يمكن مقارنة عملية التعلم هذه بالعلاقة بين الطالب والمعلم ، على الرغم من أن الآلات ليست عنيدة مثل البشر.

إذا دخلت للتو في عالم الذكاء الاصطناعي ، فقد لا يكون التعلم الخاضع للإشراف مصطلحًا صادفته سابقًا. باختصار ، إنها استراتيجية تعلم آلي تمكن أنظمة الذكاء الاصطناعي من التعلم والتقدم.

ببساطة ، تم تصميم خوارزميات التعلم الخاضع للإشراف للتعلم بالقدوة. يشار إلى هذه الأمثلة ببيانات التدريب ، وكل مثال هو زوج من كائن الإدخال وقيمة الإخراج المطلوبة. يشار إلى زوج بيانات الإدخال والإخراج التي يتم تغذيتها في النظام عمومًا بالبيانات المصنفة .

من خلال تغذية البيانات المصنفة ، فإنك تُظهر للجهاز الاتصالات بين المتغيرات المختلفة والنتائج المعروفة. من خلال التعلم الخاضع للإشراف ، يتم إخبار نظام الذكاء الاصطناعي صراحة بما يجب البحث عنه في بيانات الإدخال المحددة. يتيح ذلك للخوارزميات أن تتحسن بشكل دوري وإنشاء نماذج للتعلم الآلي يمكنها التنبؤ بالنتائج أو تصنيف البيانات بدقة عند تقديمها ببيانات غير مألوفة.

بشكل عام ، يتم استخدام ثلاث مجموعات بيانات في مراحل مختلفة من عملية إنشاء النموذج:

  • مجموعة بيانات التدريب: بيانات العينة المستخدمة لتدريب النموذج. بمعنى آخر ، إنها مجموعة من أمثلة التدريب المستخدمة لتناسب معلمات النموذج.
  • مجموعة بيانات التحقق: بيانات العينة المستخدمة لتقديم تقييم غير متحيز لنموذج مناسب لمجموعة بيانات التدريب
  • مجموعة بيانات الاختبار: بيانات العينة المستخدمة لتقديم تقييم غير متحيز لنموذج نهائي ملائم لمجموعة بيانات التدريب

يشير النموذج المناسب إلى مقياس مدى نجاح النموذج في التعميم على البيانات المماثلة لتلك التي تم تدريبه عليها. ينتج النموذج المجهز جيدًا نتائج دقيقة ؛ يتطابق النموذج المجهز بشكل زائد مع البيانات بشكل وثيق جدًا ؛ لا يتطابق النموذج غير المناسب مع البيانات بشكل كافٍ.

كيف يعمل التعلم تحت الإشراف؟

يلعب التدريب دورًا محوريًا في التعلم الخاضع للإشراف. خلال مرحلة التدريب ، يتم تغذية نظام الذكاء الاصطناعي بكميات هائلة من بيانات التدريب المصنفة. كما ذكرنا سابقًا ، فإن بيانات التدريب ترشد النظام إلى كيفية ظهور المخرجات المرغوبة من كل قيمة إدخال مميزة.

ثم يتم إعطاء النموذج المدرب بيانات الاختبار . يسمح هذا لعلماء البيانات بتحديد فعالية التدريب ودقة النموذج. تعتمد دقة النموذج على حجم وجودة مجموعة بيانات التدريب والخوارزمية المستخدمة.

ومع ذلك ، فإن الدقة العالية ليست دائمًا أمرًا جيدًا. على سبيل المثال ، قد تعني الدقة العالية أن النموذج يعاني من فرط التجهيز - خطأ في النمذجة أو تحسين غير صحيح للنموذج عندما يتم ضبطه بشكل مفرط على مجموعة بيانات التدريب الخاصة به وقد يؤدي إلى نتائج إيجابية خاطئة.

في مثل هذه الحالة ، قد يؤدي النموذج أداءً جيدًا بشكل ملحوظ في سيناريوهات الاختبار ولكنه قد يفشل في تقديم المخرجات الصحيحة في ظروف العالم الحقيقي. للقضاء على فرص فرط التجهيز ، تأكد من أن بيانات الاختبار مختلفة تمامًا عن بيانات التدريب. تأكد أيضًا من أن النموذج لا يستمد إجابات من تجربته السابقة.

يجب أن تكون أمثلة التدريب متنوعة أيضًا. خلاف ذلك ، عند تقديم حالات لم يسبق لها مثيل ، سيفشل النموذج في العمل.

في سياق علم البيانات واستخراج البيانات (عملية تحويل البيانات الأولية إلى معلومات مفيدة) ، يمكن تقسيم التعلم الخاضع للإشراف إلى نوعين: التصنيف والانحدار .

تحاول خوارزمية التصنيف تحديد فئة أو فئة البيانات المقدمة معها. يعد تصنيف البريد الإلكتروني العشوائي ورؤية الكمبيوتر وتصنيف الأدوية من الأمثلة الشائعة لمشاكل التصنيف.

من ناحية أخرى ، تحاول خوارزميات الانحدار التنبؤ بقيمة المخرجات بناءً على ميزات إدخال البيانات المقدمة. يعد توقع معدلات النقر على الإعلانات الرقمية والتنبؤ بسعر المنزل بناءً على ميزاته بعضًا من مشكلات الانحدار الشائعة.

الإشراف مقابل التعلم غير الخاضع للإشراف مقابل التعلم شبه الخاضع للإشراف

واحدة من أفضل الطرق لفهم الفرق بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف هو النظر في كيفية تعلمك للعب لعبة لوحية - دعنا نقول الشطرنج.

التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف مقابل التعلم شبه الخاضع للإشراف

خيار واحد هو تعيين مدرس الشطرنج. سيعلمك المدرس كيفية لعب لعبة الشطرنج من خلال شرح القواعد الأساسية لك ، وما الذي تفعله كل قطعة من الشطرنج ، والمزيد. بمجرد أن تكون على دراية بقواعد اللعبة ونطاق كل قطعة ، يمكنك المضي قدمًا والتمرن باللعب ضد المعلم.

سيشرف المعلم على تحركاتك ويصحبك كلما ارتكبت أخطاء. بمجرد أن تجمع ما يكفي من المعرفة والممارسة ، يمكنك البدء في اللعب بشكل تنافسي ضد الآخرين.

عملية التعلم هذه قابلة للمقارنة مع التعلم تحت الإشراف . في التعلم الخاضع للإشراف ، يعمل عالم البيانات كمدرس ويدرب الآلة عن طريق تغذية القواعد الأساسية والاستراتيجية الشاملة.

إذا كنت لا ترغب في تعيين معلم ، فلا يزال بإمكانك تعلم لعبة الشطرنج. إحدى الطرق هي مشاهدة الآخرين وهم يلعبون اللعبة. ربما لا يمكنك طرح أي أسئلة عليهم ، ولكن يمكنك مشاهدة اللعبة وتعلم كيفية لعبها.

على الرغم من عدم معرفة أسماء كل قطعة شطرنج ، يمكنك معرفة كيفية تحرك كل قطعة من خلال مراقبة اللعبة. كلما شاهدت المزيد من الألعاب ، كلما فهمت بشكل أفضل ، وزادت معرفتك بالاستراتيجيات المختلفة التي يمكنك اعتمادها للفوز.

تشبه عملية التعلم هذه التعلم غير الخاضع للإشراف . يتيح عالم البيانات للآلة التعلم من خلال المراقبة. على الرغم من أن الجهاز لا يعرف الأسماء أو الملصقات المحددة ، إلا أنه سيكون قادرًا على العثور على الأنماط بمفرده.

ببساطة ، التعلم غير الخاضع للإشراف هو عندما يتم إعطاء خوارزمية مجموعة بيانات تدريبية تحتوي فقط على بيانات الإدخال ولا توجد بيانات إخراج مقابلة.

كما ترى ، كلتا طريقتين التعلم لهما نقاط قوة وضعف ملحوظة.

بالنسبة للتعلم الخاضع للإشراف ، فأنت بحاجة إلى مدرس مطلع يمكنه تعليم الآلة القواعد والاستراتيجيات. في مثال الشطرنج ، هذا يعني أنك بحاجة إلى مدرس لتعلم اللعبة. إذا لم يكن الأمر كذلك ، فقد ينتهي بك الأمر بتعلم اللعبة بشكل خاطئ.

في حالة التعلم غير الخاضع للإشراف ، فإنك تحتاج إلى كميات هائلة من البيانات حتى تتمكن الآلة من المراقبة والتعلم. على الرغم من أن البيانات غير المصنفة رخيصة (ووفرة) ويسهل جمعها وتخزينها ، يجب أن تكون خالية من البيانات المكررة أو المهملة. يمكن أن تؤدي البيانات المعيبة أو غير المكتملة أيضًا إلى تحيز التعلم الآلي - وهي ظاهرة تنتج فيها الخوارزميات نتائج تمييزية.

في مثال الشطرنج ، إذا كنت تتعلم من خلال مراقبة لاعبين آخرين ، فهذا يعني أنك بحاجة إلى مشاهدة عشرات الألعاب قبل أن تفهمها. أيضًا ، إذا كنت تشاهد لاعبين يلعبون اللعبة بشكل غير صحيح ، فقد ينتهي بك الأمر بفعل نفس الشيء.

ثم هناك التعلم شبه الخاضع للإشراف .

كما قد تكون خمنت ، فإن التعلم شبه الخاضع للإشراف هو مزيج من التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. في عملية التعلم هذه ، يقوم عالم البيانات بتدريب الآلة قليلاً فقط حتى تحصل على نظرة عامة عالية المستوى. ثم تتعلم الآلة القواعد والاستراتيجيات من خلال مراقبة الأنماط. سيتم تسمية نسبة صغيرة من بيانات التدريب ، وسيتم إلغاء تسمية الباقي.

في مثال تعلم الشطرنج ، سيكون التعلم شبه الخاضع للإشراف مشابهًا لمعلم يشرح لك الأساسيات فقط ويسمح لك بالتعلم من خلال اللعب بشكل تنافسي.

عملية التعلم الأخرى هي التعلم المعزز (RL) . إنها إستراتيجية تعلم آلي يواجه فيها نظام الذكاء الاصطناعي موقفًا شبيهًا باللعبة. لتعليم الذكاء الاصطناعي ، يستخدم المبرمج أسلوب مكافأة-جزاء ، حيث يجب أن يركز النظام على اتخاذ الإجراءات المناسبة لزيادة المكافأة وتجنب العقوبات.

خوارزميات التعلم تحت الإشراف

يتم استخدام العديد من تقنيات وخوارزميات الحساب في عملية التعلم تحت الإشراف.

عند اختيار خوارزمية التعلم الآلي الخاضعة للإشراف ، تؤخذ العوامل التالية في الاعتبار بشكل عام:

  • تعقيد النموذج الذي يحاول النظام تعلمه
  • التحيز والتباين الموجود داخل الخوارزمية
  • حجم بيانات التدريب
  • الدقة وعدم التجانس والتكرار والخطية للبيانات
  • الوقت المتاح للتدريب

فيما يلي بعض خوارزميات التعلم الآلي الشائعة الخاضعة للإشراف التي ستصادفك.

الانحدارالخطي

الانحدار الخطي هو خوارزمية إحصائية بالإضافة إلى خوارزمية تعلم الآلة. إنها خوارزمية تحاول نمذجة العلاقة بين متغيرين من خلال إرفاق معادلة خطية بالبيانات المرصودة. من بين المتغيرين ، يعتبر أحدهما متغيرًا توضيحيًا والآخر متغيرًا تابعًا.

يمكن أيضًا استخدام الانحدار الخطي لتحديد العلاقة بين متغير تابع ومتغير واحد أو أكثر من المتغيرات المستقلة. في مجال التعلم الآلي ، يُستخدم الانحدار الخطي لعمل تنبؤات.

الانحدار اللوجستي

الانحدار اللوجستي هو نموذج رياضي يستخدم لتقدير احتمالية حدث بناءً على البيانات السابقة المقدمة. يعد تسجيل الائتمان والكشف عن عمليات الاحتيال عبر الإنترنت من بعض التطبيقات الواقعية لهذه الخوارزمية. بمعنى آخر ، إنها خوارزمية تحليل تنبؤي تعتمد على مفاهيم الاحتمالية المستخدمة لحل مشاكل التصنيف الثنائي.

تمامًا مثل الانحدار اللوجستي ، تم استعارة الانحدار الخطي أيضًا من مجال الإحصاء. ومع ذلك ، على عكس الانحدار الخطي الذي يعمل مع المتغيرات التابعة المستمرة ، يعمل الانحدار اللوجستي مع البيانات الثنائية ، مثل "صواب" أو "خطأ".

الشبكات العصبية

تُستخدم الشبكات العصبية الاصطناعية (ANN) بشكل أساسي بواسطة خوارزميات التعلم العميق. إنها سلسلة من الخوارزميات التي تحاكي وظائف الدماغ البشري للتعرف على العلاقات بين كميات هائلة من البيانات. كما قد تكون خمنت ، تعد شبكات ANN ضرورية لأنظمة الذكاء الاصطناعي.

تتكون الشبكات العصبية من طبقات متعددة العقد. تتكون كل عقدة من مدخلات وأوزان وتحيز ومخرجات. يتم تدريب ANN من خلال ضبط أوزان الإدخال بناءً على أداء الشبكة. على سبيل المثال ، إذا صنفت الشبكة العصبية صورة بشكل صحيح ، فإن الأوزان التي تساهم في الإجابة الصحيحة تزداد بينما يتم تقليل الأوزان الأخرى.

ساذج بايز

Naive Bayes هي طريقة تصنيف تعتمد على مبدأ الاستقلال الشرطي الطبقي لنظرية بايز. بعبارات أبسط ، يفترض نهج مصنف Naive Bayes أن وجود ميزة معينة في فئة لا يؤثر على وجود أي ميزة أخرى.

على سبيل المثال ، يمكن اعتبار الفاكهة على أنها تفاحة إذا كانت حمراء اللون ودائرية وقطرها حوالي ثلاث بوصات. حتى لو كانت هذه الميزات تعتمد على بعضها البعض ، فإن كل هذه الخصائص تساهم بشكل فردي في احتمال أن تكون الفاكهة ذاتها تفاحة.

يعتبر نموذج Naive Bayes مفيدًا عند التعامل مع مجموعات البيانات الكبيرة. إنه سهل البناء وسريع ومعروف بأداء أفضل من طرق التصنيف المتقدمة.

آلة ناقلات الدعم (SVM)

آلة المتجه الداعمة (SVM) هي خوارزمية تعلم آلي خاضعة للإشراف معروفة طورها فلاديمير فابنيك. على الرغم من استخدامها في الغالب لمشاكل التصنيف ، يمكن استخدام SVMs للانحدار أيضًا.

تم بناء SVMs على فكرة العثور على الطائرة الفائقة التي تقسم مجموعة بيانات معينة بشكل أفضل إلى فئتين. يشار إلى هذا المستوى الفائق على أنه حدود القرار ويفصل بين نقاط البيانات في أي من الجانبين. يعد اكتشاف الوجه وتصنيف النص وتصنيف الصور بعضًا من العديد من تطبيقات العالم الحقيقي لـ SVM.

K- أقرب جيران (KNN)

خوارزمية K- الأقرب للجيران (KNN) هي خوارزمية تعلم آلي خاضعة للإشراف تُستخدم لحل مشاكل الانحدار والتصنيف. إنها خوارزمية تجمع نقاط البيانات بناءً على قربها من البيانات الأخرى وعلاقتها بها.

من السهل فهمها وتنفيذها ووقت حسابها منخفضًا. ومع ذلك ، تصبح الخوارزمية بطيئة بشكل ملحوظ مع زيادة حجم البيانات المستخدمة. يستخدم KNN بشكل عام للتعرف على الصور وأنظمة التوصية.

غابة عشوائية

Random Forest هي طريقة تعلم تتكون من عدد كبير من أشجار القرار التي تعمل كمجموعة (استخدام خوارزميات تعليمية متعددة للحصول على أداء تنبؤي أفضل). تقدم كل شجرة قرار تنبؤًا للفئة ، ويصبح الفصل الذي يحصل على أعلى الأصوات هو توقع النموذج.

تُستخدم خوارزمية الغابة العشوائية على نطاق واسع في سوق الأوراق المالية ، والخدمات المصرفية ، والمجال الطبي. على سبيل المثال ، يمكن استخدامه لتحديد العملاء الذين من المرجح أن يسددوا ديونهم في الوقت المحدد.

أمثلة التعلم تحت الإشراف

كما ذكرنا سابقًا ، فإن التنبؤ بأسعار المنازل ومعدلات النقر على الإعلانات عبر الإنترنت وحتى استعداد العميل للدفع مقابل منتج معين هي بعض الأمثلة البارزة لنماذج التعلم الخاضعة للإشراف.

فيما يلي بعض الأمثلة الأخرى التي قد تصادفها في الحياة اليومية.

  • تحليل المشاعر : تقنية معالجة بلغة طبيعية تُستخدم لتحديد شعور المنتج وفهم احتياجات العملاء
  • التعرف على الصور: تقنية تستخدم لتحديد وتحديد وتصنيف الكائنات في مقاطع الفيديو والصور
  • اكتشاف البريد العشوائي: طريقة تصنيف المحتوى غير المرغوب فيه والمحتوى غير العشوائي من خلال التعرف على الأنماط والشذوذ في البيانات

تعليم الآلات على التفكير

من خلال الاستفادة من البيانات المصنفة ، يمكن لخوارزميات التعلم الخاضع للإشراف إنشاء نماذج يمكنها تصنيف البيانات الضخمة بسهولة وحتى إجراء تنبؤات بشأن النتائج المستقبلية. إنها تقنية تعليمية رائعة تقدم الآلات للعالم البشري.

بالحديث عن تقنيات التعلم لجعل الآلات ذكية ، هل تساءلت يومًا عن أنظمة الذكاء الاصطناعي التي لدينا اليوم قادرة حقًا على ذلك؟ إذا كان الأمر كذلك ، فغذي فضولك بقراءة المزيد عن الذكاء الاصطناعي الضيق.