المحتوى الذي ينشئه المستخدم والتعلم الآلي في Google
نشرت: 2021-02-10هل Google هو الصفحة الرئيسية الجديدة للتعلم الآلي على الويب؟
لقد كتبت مؤخرًا عن براءة اختراع من Google تصف التعلم الآلي لتحديد الآراء في المقالات الإخبارية في المنشور Opinion News Found By Machine Learning at Google
يتزايد استخدام التعلم الآلي في Google. في براءة الاختراع هذه ، قد تستخدم Google التعلم الآلي لتحديد أنواع أخرى من المحتوى بخلاف مقالات الرأي فقط. تخبرنا براءة الاختراع الجديدة هذه عن تحديد المحتوى الذي ينشئه المستخدم باستخدام التعلم الآلي.
قيل لنا صراحةً أن براءة الاختراع تدور حول "الاستفادة من التعلم الآلي للتنبؤ بالمحتوى الذي ينشئه المستخدم".
لماذا تبحث عن محتوى من إنشاء المستخدم على الويب؟ تشير براءة الاختراع إلى أن:
يمكن استخدام المحتوى الذي تم إنشاؤه بواسطة المستخدم للحصول على معلومات حول الكيانات المختلفة.
يمكن الحصول على هذا المحتوى الذي ينشئه المستخدم ، على سبيل المثال ، من خلال إشراك عدد كبير من المستخدمين في تجربة مساهمة.
يمكن أن يساعدنا التعلم الآلي في فهم تجارب المساهمة مثل نظام الأسئلة والأجوبة حيث يتم تقديم أسئلة و / أو مطالبات أخرى تتضمن كيانات مختلفة للمستخدمين. ثم يتم توجيه المستخدمين للرد على الأسئلة و / أو المطالبات.
يمكن استخدام استجابات المستخدمين هذه لعمل استنتاجات مرتبطة بسمات الكيانات المختلفة. (أحب ذكر السمات في براءة الاختراع هنا.)
قد تتطلب تجارب المساهمة هذه عددًا كبيرًا من ردود المستخدمين قبل التمكن من إجراء استنتاج دقيق بخصوص الكيان.
لذلك ، قد يُطلب من العديد من المستخدمين معرفة أن كيانًا معينًا يمتلك سمة بحيث يمكن إجراء استنتاج دقيق بشأن امتلاك السمة من قبل الكيان.
كيف يساعدنا التعلم الآلي وهذه الأسئلة والأجوبة في التعرف على الكيانات؟
تتضمن الطريقة المستمدة من براءة الاختراع تلقي بيانات الكيان الأول المرتبطة بكيان بواسطة جهاز كمبيوتر واحد أو أكثر.
يمكن أن تتضمن بيانات الكيان الأول هذه البيانات المحددة من قبل المستخدم والمرتبطة بسمة الكيان (يمكن أن تتضمن سمات الكيانات التواريخ والقيم الأخرى المرتبطة بها.)
تتضمن الطريقة بعد ذلك الإدخال ، بواسطة جهاز كمبيوتر واحد أو أكثر ، بيانات الكيان الأول في نموذج تنبؤ بالمحتوى الذي يتم تعلمه آليًا.
تتضمن الطريقة الحاصلة على براءة اختراع أيضًا الاستلام كناتج لنموذج التنبؤ بالمحتوى الذي تم تعلمه آليًا ، بواسطة جهاز واحد أو أكثر من أجهزة الحوسبة ، بيانات الكيان المستنتج التي تشتمل على بيانات وصفية مستنبطة لسمة الكيان.
يمكن العثور على براءة الاختراع هذه في USPTO على:
الاستفادة من التعلم الآلي للتنبؤ بالمحتوى الذي ينشئه المستخدم
المخترعون: آرون ماثيو وكالي سميث وبير أندرسون وإيان لانجمور
الوكيل: Google LLC
براءات الاختراع الأمريكية: 10،878،339
تم المنح: 29 ديسمبر 2020
تاريخ التقديم: 27 يناير 2017
الملخص
يتم توفير أنظمة وطرق الاستفادة من التعلم الآلي للتنبؤ بالمحتوى الذي ينشئه المستخدم.
على سبيل المثال ، يمكن استلام بيانات الكيان الأول المرتبطة بكيان ما.
يمكن أن تتضمن بيانات الكيان الأول البيانات المحددة من قبل المستخدم والمرتبطة بسمة الكيان.
يمكن إدخال بيانات الكيان الأول في نموذج التنبؤ بالمحتوى الذي يتم تعلمه آليًا.يمكن تلقي بيانات الكيان المستنتج كناتج لنموذج توقع المحتوى الذي تم تعلمه آليًا.
يمكن أن تتضمن بيانات الكيان المستنتج البيانات الوصفية المستنبطة لسمة الكيان.
يخبرنا أحد الأمثلة على مثال براءة الاختراع هذه عن استخدام التعلم الآلي بشكل أفضل لفهم المحتوى الذي ينشئه المستخدم حول كيان واحد أو أكثر.
يمكن للعملية تحديد سمات مختلفة حول كيان واحد أو أكثر.
لذلك يمكن تلقي بيانات الكيان التي يحددها المستخدم حول سمة الكيان.
يمكن أن تتضمن بيانات الكيان هذه استجابات المستخدم لمهمة جمع المعلومات المقدمة إلى مستخدم واحد أو أكثر.
قد تطلب مهمة جمع المعلومات هذه من المستخدمين الرد على أسئلة حول كيان ما.
قد يتم تقديم بيانات الكيان هذه كمدخلات لنموذج توقع المحتوى الذي تم تعلمه آليًا.
قد يتضمن نموذج التنبؤ بالمحتوى الذي يتم تعلمه آليًا انحدارًا لوجستيًا.
أمثلة للكيانات التي سُئلت عنها لمعرفة المزيد عنها
قد يكون هذا أكثر منطقية بالنسبة لقارئ براءة الاختراع إذا قدم بعض الأمثلة المحددة.
قيل لنا أن نموذج التنبؤ بالمحتوى الذي تم تعلمه آليًا يمكن أن يوفر بيانات كيان مُستدل على المخرجات مرتبطة بسمة الكيان.
قد تتضمن بيانات الكيان المستنتج معلومات مرتبطة بالنتائج المتوقعة أو المقدرة لمهمة جمع المعلومات.
وبشكل أكثر تحديدًا ، قد ترتبط مهمة جمع المعلومات بنظام أسئلة وأجوبة أو خبرة مساهمة أخرى تُستخدم لجمع المعلومات المرتبطة بكيان ما.
قد تكون مهمة جمع المعلومات هذه أي مهمة مناسبة تحث المستخدمين على تقديم استجابة إجابة مرتبطة بسمة الكيان.
يمكن أن تكون هذه الكيانات أي كيانات مناسبة ، مثل شركة ، أو مطعم ، أو فيلم ، أو أغنية ، أو كتاب ، أو فيديو ، أو منتج ، أو أي كيان آخر مناسب يمكن الحصول على معلومات وصفية عنه.
قد ترتبط مهمة جمع المعلومات هذه باستطلاع أو استبيان أو ما إلى ذلك ، مرتبطة بالكيان.
يمكن أن تكون مهمة جمع المعلومات سؤالاً يتم توفيره للمستخدمين المرتبطين بسمة الكيان.
قد تكون الأسئلة عبارة عن "سؤال منطقي" له إجابات محتملة "صواب" أو "خطأ" (أو "غير متأكد").
على سبيل المثال ، يمكن أن تتضمن مهمة المعلومات سؤالاً يسأل عما إذا كان مطعم معين يوفر جوًا رومانسيًا أو ما إذا كان المطعم يوفر جوًا ملائمًا لمجموعات كبيرة.
بهذه الطريقة ، يمكن للمستخدم تقديم استجابة صحيحة للإشارة إلى أن الكيان يمتلك السمة أو استجابة خاطئة للإشارة إلى أن الكيان لا يمتلك السمة.
لقد تم طرح أسئلة علي حول الأنشطة التجارية التي تم طرحها فيما يتعلق بأسئلة المرشد المحلي في برنامج "نشاطي التجاري على Google".
يمكن أن تتضمن بيانات الكيان التي يحددها المستخدم بيانات تشير إلى استجابة (استجابات) المستخدم لمهام جمع المعلومات المقدمة.
يمكن تقديم هذا النوع من بيانات الكيان المحددة من قبل المستخدم كمدخلات إلى نموذج توقع محتوى تعلم الآلة.
يمكن تقديم بيانات الكيان المحددة من قبل المستخدم إلى الانحدار اللوجستي لنموذج التنبؤ بالمحتوى.
ويمكن أن يتلقى الانحدار اللوجستي مزيدًا من بيانات الكيان العالمي كمدخلات.
قد تتضمن بيانات الكيان العالمي أي:
- بيانات منظمة أو غير منظمة مناسبة مرتبطة بالكيان
- واحد أو أكثر من الكيانات الإضافية
- منطقة جغرافية (على سبيل المثال ، مدينة ، مقاطعة ، رمز منطقة ، دولة ، إلخ) يقع فيها الكيان
- و / أو بيانات مناسبة أخرى.
يمكن أن تشمل البيانات العالمية ما يلي:
- تشير البيانات إلى استجابات المستخدمين لمختلف مهام جمع المعلومات الأخرى المرتبطة بالكيان و / أو الكيانات الإضافية
- السمات المختلفة للكيان و / أو الكيانات الإضافية
- الكلمات الأساسية المرتبطة بالكيان و / أو الكيانات الإضافية
- إلخ.
.
ماذا يتعلم الناس عن الكيانات؟
قد ترتبط بيانات الكيان العالمي بملف تعريف للكيانات التي تصف الجوانب المختلفة للكيانات.
يمكن الحصول على بيانات الكيان العالمي من مختلف قواعد البيانات المناسبة ، مثل قواعد البيانات المرتبطة بنظام المعلومات الجغرافية.
ويمكن الحصول على بيانات الكيان العالمي من مواقع الويب المناسبة.
يمكن تكوين هذا الانحدار اللوجستي لإخراج معدل استجابة "أفضل تخمين" متوقع أو مقدر.
يمكن أن يتنبأ معدل استجابة "أفضل تخمين" باستجابات المستخدم لمهمة جمع المعلومات حيث يقترب عدد استجابات المستخدم من اللانهاية.
يمكن أن يكون معدل الاستجابة "معدلًا حقيقيًا" يحدد النسبة المتوقعة للردود "الحقيقية" إلى المبلغ الإجمالي للردود على مهمة جمع المعلومات حيث يقترب عدد الردود من اللانهاية.

يمكن تحديد معدل الاستجابة للأسئلة بناءً على بيانات الكيان و / أو بيانات الكيان العالمي جزئيًا على الأقل.
يمكن تحديد الارتباطات ضمن بيانات الكيان العالمي. قد تشير هذه الارتباطات إلى احتمال وجود إشارات مختلفة قائمة على السمات للكيان ، على الأقل جزئيًا ، ضمن بيانات الكيان العالمي.
على سبيل المثال ، يمكن تحديد أن الكيان المصنف على أنه مصنع جعة صغير (على النحو المحدد في بيانات الكيان العالمي) يتلقى عمومًا معدلات استجابة "حقيقية" عالية لمهمة جمع المعلومات التي تسأل عما إذا كان الكيان يوفر جوًا جيدًا للمجموعات.
يمكن للانحدار اللوجستي المرتبط بمهمة جمع المعلومات التي تسأل عما إذا كان مصنع الجعة الصغير موضوعًا جيدًا للمجموعات أن يأخذ في الاعتبار مثل هذا الارتباط عند تحديد معدل الاستجابة المتوقع لمهمة جمع المعلومات.
وبهذه الطريقة ، يمكن تحديد معدل الاستجابة استنادًا على الأقل جزئيًا إلى سمات الكيان الموضوع التي يتم مشاركتها مع أو مشابهة لسمات الكيانات الأخرى المختلفة.
تخبرنا براءة الاختراع أيضًا أن نموذج التنبؤ بالمحتوى الذي يتم تعلمه آليًا يمكن أن يشتمل أيضًا على نموذج ذي الحدين بيتا مقترنًا بالانحدار اللوجستي.
على هذا النحو ، يمكن تقديم ناتج الانحدار اللوجستي (على سبيل المثال ، معدل الاستجابة المتوقع) كمدخل لنموذج بيتا ذي الحدين.
ويمكن كذلك تقديم بيانات الكيان المحددة من قبل المستخدم إلى نموذج بيتا ذي الحدين كمدخلات.
يمكن تكوين نموذج بيتا ذي الحدين لاستنتاج بيانات الكيان المرتبطة بالكيان ومهمة جمع المعلومات.
يمكن تكوين نموذج بيتا ذي الحدين لاستخدام درجة الثقة المرتبطة بمعدل الاستجابة المتوقع.
يمكن تكوين نموذج بيتا ذي الحدين لتحديد العبارات الاستنتاجية التي تستند جزئيًا على الأقل إلى معدل الاستجابة و / أو درجة الثقة.
يمكن تكوين نموذج بيتا ذي الحدين لإخراج بيان استنتاجي يشير إلى نسبة مئوية من احتمال أن يكون معدل الاستجابة "الحقيقي" للسؤال المنطقي لمهمة جمع المعلومات أكبر من حد معين.
قد ينتج نموذج بيتا ذي الحدين بيانًا استنتاجيًا يشير إلى أن معدل الاستجابة "الحقيقي" للسؤال المنطقي لمهمة جمع المعلومات سيكون أقل من حد معين.
يمكن تكوين نموذج بيتا ذي الحدين لتوليد دالة كثافة احتمالية تحدد احتمالات معدلات الاستجابة المختلفة المرتبطة بمهمة جمع المعلومات.
يمكن استخدام هذا الناتج من نموذج بيتا ذي الحدين لتحديد السمة المرتبطة بمهمة جمع المعلومات.
يمكن أن تحدد بيانات الكيان المستنتج ما إذا كان الكيان يمتلك السمة المرتبطة بمهمة جمع المعلومات.
على سبيل المثال ، قد توفر مهمة جمع المعلومات التي تسأل عن الكيان جوًا جيدًا للمجموعات التي يمكن الإجابة عليها بشكل إيجابي أو سلبي استنادًا جزئيًا على الأقل إلى إخراج بيانات الكيان المستنتج بواسطة نموذج بيتا ذي الحدين.
يمكن تحديد السمة بناءً على ما إذا كانت بيانات الكيان المستنتج تفي ببعض المعايير المناسبة.
على سبيل المثال ، يمكن أن ترتبط المعايير بإخراج البيان الاستنتاجي بنموذج بيتا ذي الحدين.
التعهيد الجماعي للمحتوى الذي ينشئه المستخدم
قد ترتبط مهمة جمع المعلومات بنظام الأسئلة والأجوبة حيث يتم توفير العديد من مهام جمع المعلومات للعديد من المستخدمين من أجل "التعهيد الجماعي" لجمع المعلومات المرتبطة بالعديد من الكيانات.
يمكن تطبيق أمثلة على الإفصاح الحالي على العديد من مهام جمع المعلومات ضمن نظام الأسئلة والأجوبة.
يمكن للأدوات المساعدة المحددة لمهام جمع المعلومات تحديد أولويات مهام جمع المعلومات و / أو ترتيبها.
يمكن توفير مهام جمع المعلومات هذه للمستخدمين اللاحقين عن طريق تحديد الأولويات.
على سبيل المثال ، يمكن تقديم مهمة جمع معلومات ذات فائدة أعلى للمستخدم قبل توفير مهمة جمع المعلومات ذات فائدة أقل.
وبهذه الطريقة ، يمكن إعطاء الأولوية لمهام جمع المعلومات التي سيكون للاستجابة الإضافية اللاحقة لها تأثير أكبر على تحديد سمة لكيان ما في توفير مهام جمع المعلومات.
الاستفادة من التعلم الآلي للتنبؤ بالمحتوى الذي ينشئه المستخدم
يمكن استخدام المحتوى الذي تم إنشاؤه بواسطة المستخدم للحصول على معلومات حول العديد من الكيانات.
يمكننا العثور على معلومات حول هذه الكيانات من خلال إشراك العديد من المستخدمين في تجربة المساهمة.
على سبيل المثال ، يمكن أن تشتمل تجارب المساهمة هذه على نظام أسئلة وأجوبة حيث يتم تقديم أسئلة و / أو محفزات أخرى تتعلق بالكيانات المختلفة للمستخدمين. يتم توجيه المستخدمين للرد على الأسئلة و / أو المطالبات.
يمكن استخدام استجابات المستخدمين هذه لعمل استنتاجات مرتبطة بسمات الكيانات المختلفة.
قد تتطلب تجارب المساهمة عددًا كبيرًا من استجابات المستخدمين قبل التمكن من إجراء استنتاج دقيق بخصوص الكيان.
قد يُطلب من العديد من المستخدمين الإشارة إلى أن كيانًا معينًا يمتلك سمة بحيث يمكن إجراء استنتاج دقيق فيما يتعلق بحيازة السمة من قبل الكيان.
على سبيل المثال ، يمكن أن يكون نظام الأسئلة والأجوبة عبارة عن استبيان أو استبيان وما إلى ذلك ، يتم توفيره للمستخدمين للحصول على معلومات من مصادر جماعية تتعلق بالكيان.
يمكن أن تكون الكيانات المعنية أي كيان مناسب ، مثل:
- الموقع الجغرافي
- نقطة الأهتمام
- اعمال
- مطعم
- معلم معروف
- أغنية
- فيلم
- فيديو
- الكتاب
- منتج
- أي جهة مناسبة أخرى يمكن الحصول على معلومات عنها عبر نظام الأسئلة والأجوبة
بالإضافة إلى جعل الأشخاص يجيبون على أسئلة حول الشركات والكيانات الأخرى ، قد تجد Google طرقًا أخرى للتعرف على الكيانات ، كما كتبت عنها في المنشور ، يمكن استخدام استعلامات محرك البحث لتحديد سمات الكيانات.
لقد غطيت أيضًا هذا الموضوع في المنشور Google Adds Entity Attributes to your Knowledge Base from Queries
من المنطقي أن تجد Google طرقًا أخرى لطرح الأسئلة والتعرف على الكيانات ، خاصةً عندما يكون لديها مجموعة كبيرة من المستخدمين المتعاونين للعمل معهم ، مثل Google Maps Local Guides.
لا ينبغي أن يكون مفاجئًا أن يستخدم محرك البحث أكبر عدد ممكن من مصادر المعلومات لمعرفة المزيد عن كيانات العالم الحقيقي التي قد يقوم بفهرستها ، مثل الكيانات.
ما نوع بيانات الكيان التي قد تجمعها Google؟
يمكن أن تشمل:
- أي بيانات منظمة أو غير منظمة مناسبة مرتبطة بالكيان
- واحد أو أكثر من الكيانات الإضافية
- منطقة جغرافية (على سبيل المثال ، مدينة ، مقاطعة ، رمز منطقة ، دولة ، إلخ) يقع فيها الكيان
- بيانات مناسبة أخرى
يمكن أن تتضمن هذه أيضًا البيانات التي تشير إلى استجابات المستخدمين للعديد من مهام جمع المعلومات الأخرى المرتبطة بالكيانات أو سمات الكيانات أو الكلمات الأساسية المرتبطة بالكيانات.
توفر براءة الاختراع العديد من التفاصيل حول جمع المعلومات المرتبطة بالكيانات ذات الصلة بموقع الويب. كما أشرت ، قد تتعرف Google على الكيانات من خلال التعرف على الاستعلامات المتعلقة بها وما قد يبحث عنه الباحث عند إنشاء استعلامات حول موقع أو كيان مرتبط به.
لقد كتبت في الماضي عن براءات اختراع Gooogle التي تغطي المحتوى الذي ينشئه المستخدم ، مثل المنشور هل يجد الباحثون قيمة في نتائج البحث عن المحتوى الذي ينشئه المستخدمون ؟. لذلك لا ينبغي أن يكون مفاجئًا أن Google ستستخدم نهج التعلم الآلي لجمع المزيد من البيانات حول الكيانات ، خاصة وأن لديها جمهورًا سيساعدها في التعرف عليها.
لقد رأينا Google يستخدم معلومات الكيانات من خلال استخدام الرسوم البيانية المعرفية أكثر وأكثر في البحث ، كما كتبت عن الكيانات المصنفة في نتائج البحث في Google
استعدادًا لمثل هذا التغيير في تحسين محركات البحث ، من المنطقي أن يتعلم شخص ما على موقع ما الكثير عن الكيانات المشاركة في هذا الموقع ومحاولة تضمين أكبر قدر ممكن من المعلومات الإيجابية حول تلك الكيانات على ذلك الموقع.
