ما هي الإجابات الجيدة على الاستفسارات التي تطرح أسئلة؟

نشرت: 2020-03-24

عناصر الاستفسارات وعناصر الإجابات

حصلت Google مؤخرًا على براءة اختراع تركز على استفسارات البحث عن إجابات وتقديم إجابات جيدة لمثل هذه الاستفسارات.

يمكن أن يساعد وجود فكرة عن عناصر استعلامات البحث عن إجابات الأشخاص على فهم ما قد يحتاجون إلى نشره لتقديم إجابات لهذه الاستفسارات.

لذلك ، قد يكون من المثير للاهتمام رؤية ما تقوله براءة الاختراع هذه حول ما قد تبحث عنه Google من حيث الإجابات الجيدة على الاستفسارات.

تركز براءة الاختراع هذه على:

كيف يمكن لنظام البحث معرفة العناصر المميزة لاستعلامات البحث عن إجابات وإجابات استعلامات البحث عن إجابات.

يبدأ وصف براءة الاختراع بإخبارنا المزيد عن الإجابات الجيدة على الاستفسارات:

بشكل عام ، يتلقى نظام البحث استعلام بحث ويحصل على نتائج البحث التي تلبي استعلام البحث. تحدد نتائج البحث الموارد ذات الصلة أو المستجيبة لاستعلام البحث ، على سبيل المثال ، الموارد التي يمكن الوصول إليها عبر الإنترنت. يمكن لنظام البحث تحديد أنواع مختلفة من نتائج البحث استجابةً لاستعلام بحث مستلم ، على سبيل المثال ، نتائج البحث التي تحدد صفحات الويب أو الصور أو مقاطع الفيديو أو الكتب أو المقالات الإخبارية ، ونتائج البحث التي تقدم اتجاهات القيادة ، بالإضافة إلى العديد من الأمور الأخرى أنواع نتائج البحث.

يمكن أن يشمل ذلك معرفة Google بالمعلومات حول الكيانات في تلك الاستعلامات واستخدام تلك المعلومات في الإجابة:

قد تستخدم أنظمة البحث أنظمة فرعية مختلفة للحصول على الموارد ذات الصلة باستعلام ما. على سبيل المثال ، يمكن أن يحتفظ نظام البحث بقاعدة المعرفة التي تخزن معلومات حول الكيانات المختلفة وتوفر معلومات حول الكيانات عندما يشير استعلام البحث إلى الاسم المستعار للكيان. يمكن للنظام تعيين واحد أو أكثر من الأسماء المستعارة لسلسلة نصية لكل كيان. على سبيل المثال ، يمكن ربط تمثال الحرية بأسماء مستعارة "تمثال الحرية" و "سيدة الحرية". لا يلزم أن تكون الأسماء المستعارة فريدة بين الكيانات. على سبيل المثال ، يمكن أن تكون كلمة "jaguar" اسمًا مستعارًا لكل من الحيوان ومصنع السيارات.

يمكن أن يشتمل أيضًا على فهم Google لأجزاء مختلفة من الكلام في الاستعلامات ، واستخدام هذه المعلومات في الإجابات أيضًا:

مثال آخر على النظام الفرعي للبحث هو أداة تمييز جزء من الكلام. يقوم برنامج تمييز جزء من الكلام بتحليل المصطلحات في الاستعلام ويصنف كل مصطلح كجزء معين من الكلام ، على سبيل المثال ، اسم أو فعل أو مفعول مباشر. مثال آخر على النظام الفرعي للبحث هو معرّف الجذر. بالنظر إلى استعلام معين ، يمكن لمعرف الخشب الجذر تصنيف مصطلح في الاستعلام باعتباره كلمة جذر ، وهي كلمة لا تعتمد على أي كلمات أخرى في الاستعلام. على سبيل المثال ، في الاستعلام "how to cook lasagna" ، يمكن لمعرّف كلمة الجذر تحديد أن "cook" هي الكلمة الجذرية للاستعلام.

قبل كل شيء ، تتعلق براءة الاختراع هذه على وجه التحديد بالعثور على إجابات موجزة للاستفسارات التي تركز على إظهار إجابات لأسئلة الباحث:

تصف هذه المواصفات التقنيات المتعلقة بتصنيف الاستعلامات كبحث عن إجابات وتوليد إجابات لاستعلامات البحث عن إجابات. استعلام البحث عن الإجابة هو استعلام صادر عن مستخدم يبحث عن إجابة مختصرة. على سبيل المثال ، سيتم تصنيف "متى ولد جورج واشنطن" بواسطة النظام على أنه استعلام يبحث عن إجابات لأن النظام يمكنه تحديد أنه من المحتمل أن يبحث المستخدم الذي يصدره عن إجابة مختصرة ، على سبيل المثال ، "فبراير. 22 ، 1732. "

مثال على إجابة طلب الاستعلام ، من رسومات براءة الاختراع:

خطوات طبخ البطاطس

تصنيف الاستعلامات على أنها تسعى للحصول على إجابات وتوليد إجابات لاستعلامات البحث عن إجابات

استعلام البحث عن الإجابة هو استعلام يبحث عنه الباحث الذي يبحث عن إجابة مختصرة.

أحد الأمثلة هو ، "متى ولد جورج واشنطن؟" يمكن تصنيف ذلك كاستعلام يبحث عن إجابات لأنه يمكن تحديد أنه من المحتمل أن يرغب الباحث في الحصول على إجابة مثل: "فبراير. 22 ، 1732. "

تخبرنا براءة الاختراع أنه ليست كل الاستفسارات تبحث عن إجابات وأن هذه الاستفسارات قد تعرض نتائج بحث فقط وليس مربعات إجابات تحتوي على إجابات.

بالنسبة لبعض الاستفسارات ، قد يبدو أن أفضل إجابة هي تزويد الباحث بقائمة مرتبة من المستندات المتعددة ذات الصلة بالاستعلام. يبحث شخص ما عن "مطاعم في نيويورك" ويرغب على الأرجح في قائمة مستندات حول أماكن مختلفة لتناول الطعام في مدينة نيويورك.

لقد أشرنا إلى الغرض من هذه البراءة ، وأخبرنا عن سبب وجودها:

تتعلق الأساليب الموضحة أدناه بكيفية قيام النظام بتصنيف استعلام على أنه استعلام يبحث عن إجابات وكيف يمكن للنظام تحديد أجزاء من المستندات سريعة الاستجابة التي من المحتمل أن تكون إجابات جيدة لاستعلام البحث عن إجابات.

هذه هي المرة الأولى التي أرى فيها أي شيء من Google يخبرنا بما يمكن أن تكون عليه "الإجابة الجيدة" على سؤال ما في مربع الإجابة.

تحديد إجابة البحث عن الاستفسارات

يخبرنا وصف براءة الاختراع بما قد تكون عليه العملية الكامنة وراء التعرف على استفسارات البحث عن إجابات.

يبدأ بملخص لجوانب براءة الاختراع ويحدد جوانب كيفية عملها ، حتى أخوض في مزيد من التفاصيل حول المزيد في هذا المنشور.

تتضمن عملية تحديد استعلام البحث عن الإجابة ما يلي:

  • تلقي استعلام متعدد المصطلحات
  • تصنيف استعلام على أنه استعلام يبحث عن إجابات لنوع سؤال معين
  • الحصول على نوع واحد أو أكثر من أنواع الإجابات المرتبطة بنوع معين من الأسئلة
  • حيث يحدد كل نوع إجابة واحدًا أو أكثر من عناصر الإجابة ذات الصلة التي تمثل خصائص إجابة مناسبة لاستعلام البحث عن الإجابة
  • الحصول على نتائج بحث مرضية للاستعلام ، حيث يقوم كل منها بتعريف المستند
  • حساب النتيجة الخاصة بكل مقطع من نص واحد أو أكثر في كل مستند تم تحديده بواسطة نتائج البحث
  • حيث تعتمد درجة كل مقطع نصي على عدد أنواع الإجابات التي تتطابق مع مرور النص
  • توفير ، ردًا على الاستعلام ، عرضًا تقديميًا يتضمن معلومات من واحد أو أكثر من مقاطع النص المحددة بناءً على الدرجة المعنية

يجيب محرك التهديف

بعض الميزات الاختيارية الأخرى المتضمنة في هذه العملية:

  • توفير المقطع الأول من النص ونتائج بحث واحدة أو أكثر تلبي طلب البحث
  • تحديد أن مقاطع النص التي لها درجات تحقق عتبة
  • اختيار فقرات النص ذات الدرجات التي تفي بعتبة التضمين في العرض التقديمي

ما هي استفسارات البحث عن الإجابة؟

يمكن أن يعني تصنيف الاستعلامات على أنها "استعلامات تبحث عن إجابات" من أنواع معينة:

  • مطابقة شروط الاستعلامات مع عدد من أنواع الأسئلة
  • حيث يحدد كل نوع من أنواع الأسئلة عددًا من عناصر السؤال التي تمثل بشكل جماعي خصائص نوع مطابق من الاستعلام
  • تحديد أن مصطلحات الاستعلامات تتطابق مع نوع السؤال الأول لعدد أنواع الأسئلة

كيف تتطابق شروط الاستعلامات مع أنواع الأسئلة؟

يعني "n-gram" سلسلة من الكلمات بطول "n" ، لذا فإن 2 غرام سيكون طول كلمتين ، و 3 غرام سيكون 3 كلمات. من خلال صياغة هذا على أنه "n-gram" ، فإن العملية في براءة الاختراع توفر المرونة لاستكشاف أطوال مختلفة.

يعني تحديد شروط الاستعلامات المطابقة لأنواع معينة من الأسئلة ما يلي:

  • تحديد أن أول n-gram في الاستعلام يمثل مثيل الكيان
  • يتضمن تحديد أنواع الأسئلة الأولى عناصر السؤال التي تمثل مثيلات الكيان

يعني تحديد شروط الاستعلامات المطابقة لأنواع معينة من الأسئلة ما يلي:

  • تحديد أن أول n-gram في استعلام يمثل مثيلاً لفئة
  • تحديد أن نوع السؤال يشتمل على عنصر سؤال يمثل الفصل

تحديد أن المقطع الأول من النص يتطابق مع نوع الإجابة الأول لنوع واحد أو أكثر من أنواع الإجابات

  • تحديد أن المقطع الأول من النص يحتوي على n-grams تطابق عنصرًا واحدًا أو أكثر من عناصر الإجابة لنوع الإجابة الأول
  • قد يمثل عنصر الإجابة الأول لعنصر الإجابة أو أكثر قياسًا رقميًا

عند تحديد أن المقطع الأول من النص يتطابق مع نوع الإجابة الأول ، يتضمن تحديد أن المقطع الأول من النص يحتوي على n-gram الذي يمثل قياسًا رقميًا.

  • يمثل عنصر الإجابة الأول لعنصر الإجابة أو أكثر فئة الفعل
  • إن تحديد أن المقطع الأول من النص يتطابق مع نوع الإجابة الأول يتضمن تحديد أن المقطع الأول من النص يحتوي على n-gram الذي يمثل مثيلاً لفئة الفعل

جمع بيانات التدريب

يمكن العثور على براءة الاختراع هذه في:

توليد عناصر من استفسارات البحث عن الإجابة وعناصر الإجابات
المخترعون: يي ليو ، برياس بوبات ، نيتين جوبتا ، وأفروز محي الدين
الوكيل: Google LLC
براءة الاختراع الأمريكية: 10592.540
تم المنح: 17 مارس 2020
تاريخ التقديم: 28 يونيو 2016

الملخص

الأساليب والأنظمة والأجهزة ، بما في ذلك برامج الكمبيوتر المشفرة على وسائط تخزين الكمبيوتر ، لتوليد إجابات على استفسارات البحث عن إجابات.

تتضمن إحدى الطرق تلقي استعلام له مصطلحات متعددة. يتم تصنيف الاستعلام كاستعلام بحث عن إجابات لنوع معين من الأسئلة ، ويتم الحصول على نوع واحد أو أكثر من أنواع الإجابات المرتبطة بنوع معين من الأسئلة.

يتم الحصول على نتائج البحث التي ترضي الاستعلام ، ويتم حساب النتيجة ذات الصلة لكل مقطع أو أكثر من مقاطع النص التي تحدث في كل مستند تم تحديده بواسطة نتائج البحث ، حيث تعتمد درجة كل مقطع من النص على عدد المقاطع أو يتطابق المزيد من أنواع الإجابات مع مرور النص.

يتم توفير عرض تقديمي يتضمن معلومات من واحد أو أكثر من مقاطع النص المحددة بناءً على الدرجة المعنية استجابةً للاستعلام.

تقديم إجابة لاستعلام البحث عن إجابة

قد تتضمن صفحة نتائج البحث نتائج بحث الويب بالإضافة إلى مربع الإجابة.

لقد كتبت المزيد عن مربعات الإجابات في المنشور ، كيف يمكن لـ Google تشغيل نتائج مربع الإجابة لطلبات البحث.

يمكن أن توفر نتائج بحث الويب روابط لمستندات من فهرس Google للويب.

إنها النتائج التي يُحتمل أن تكون ذات صلة باستعلام مطلوب وتتضمن عنوانًا ومقتطفًا ورابط عرض.

يمكن عرضها في نتائج البحث لإعطاء الباحث فكرة عن مدى صلة ارتباط معين بالاستعلام الذي أجراه. وسوف تمكن الباحث من زيارة الصفحة التي ينتمون إليها.

يمكن أن يتضمن مربع الإجابة إجابة استعلام مباشرة. من المحتمل الحصول على هذه الإجابة من نص المستند المشار إليه في نتائج بحث الويب.

لقد كتبت عن هذه الإجابات في المنشور ، المقتطفات المميزة - نتائج البحث باللغة الطبيعية لطلبات البحث عن النوايا. من المحتمل أن تكون هذه من مستندات موثوقة من الصفحة الأولى لمجموعة من نتائج البحث.

كانت Google تعرض نتائج مربع الإجابات هذه أعلى النتائج العضوية ردًا على استعلام وعرض تلك الصفحة مرة ثانية في SERPs ، لكنهم قرروا التعامل مع هذه الإجابات على أنها نتائج فردية مؤخرًا ، كما هو موضح في مجلة محرك البحث في Google: صفحات الويب مع لن تظهر المقتطفات المميزة مرتين في الصفحة 1

تخبرنا براءة الاختراع هذه أن Google قد "توفر مربع الإجابة عندما يقرر النظام أن الاستعلام هو استعلام البحث عن إجابات".

هناك عدة طرق مختلفة يمكن أن تعتبرها Google أن الاستعلام هو استعلام البحث عن إجابات ، بناءً على ما إذا كان يستخدم مصطلحات تتطابق مع نوع معين من الأسئلة.

قد تؤدي هذه الأسئلة إلى تشغيل مربع إجابة عن طريق تضمين مصطلحات أسئلة مثل ، "كيف" ، "لماذا" ، إلخ.

تخبرنا براءة الاختراع هذه أن مصطلحات السؤال هذه ليست ضرورية طوال الوقت ، ويمكن عرض مربع الإجابة حتى في حالة عدم صياغة الاستعلام كسؤال ولا يتضمن كلمة سؤال.

ولكن ، عندما يكون طلب البحث شيئًا مثل "كيف تطبخ بطاطس؟" أو "كيف تصنع البطاطس المقلية؟" أو "كيف تصنع البطاطس المهروسة؟" من المحتمل أن تبحث عن مربع الإجابة.

لكن لا يلزم وجود مصطلحات الأسئلة والأسئلة الفعلية هذه لبدء تشغيل مربع الإجابة. قد تنظر Google في الاستفسارات وتقرر ما إذا كانت الإجابة الأفضل هي نوع الإجابة:

بدلاً من ذلك ، يتم تحديد الإجابة في مربع الإجابة على أنها إجابة جيدة لأن نظام البحث قد حدد أن نوع السؤال المطابق للاستعلام غالبًا ما يرتبط بنوع إجابة يطابق نص المستند المشار إليه في نتيجة البحث.

محرك لتسجيل الإجابة

إجابة البحث عن مخطط انسيابي للاستعلام

عندما يقوم شخص ما بالبحث. ينتج عن استعلامهم إعادة المستندات ردًا على هذا الاستعلام.

يتلقى محرك نقاط الإجابة معرفات المستندات وقد يُنشئ إجابات يمكن تضمينها في صفحة نتائج البحث.

ستحدد معرفات المستندات هذه مجموعة فرعية من المستندات المشار إليها بواسطة نتائج البحث.

قد ينتج عن محرك تسجيل الإجابة إجابة باستخدام أزواج نوع السؤال / نوع الإجابة المستلمة من محرك التدريب. (يمكن أن يكون هذا هو السؤال والإجابة الموضحان في مربع الإجابة.)

يمكن لمحرك تقييم الإجابات أن يحدد للاستعلام نوعًا أو أكثر من أنواع الأسئلة المطابقة لشروط الاستعلام ، ولكل نوع سؤال ، نوع واحد أو أكثر من أنواع الإجابات المرتبطة بعنصر السؤال.

يحدد كل نوع سؤال عنصرًا واحدًا أو أكثر من عناصر الأسئلة المميزة لاستعلام البحث عن إجابات.

وبالمثل ، يحدد كل نوع إجابة مناظر عنصرًا واحدًا أو أكثر من عناصر الإجابة التي تميز إجابة استعلام البحث عن إجابات.

سيتم وصف أنواع الأسئلة وأنواع الإجابات بمزيد من التفصيل أدناه فيما يتعلق بـ FIG. 3.

يحدد محرك التدريب أزواج من أنواع الأسئلة وأنواع الإجابات.

يعالج محرك التدريب أمثلة تدريبية في مجموعة من بيانات التدريب ، والتي يمكن أن تتضمن أزواجًا من الأسئلة والأجوبة على الأسئلة.

يمكن اختيار سؤال وإجابة للرد على الاستعلام ، مثل ما يلي في استعلام حول كيفية تغيير إطار:

كيفية تغيير الاطارات

تقدم Google معلومات حول أنواع معينة من الأسئلة مثل أسئلة الكيفية التي كتبت عنها بمزيد من التفصيل مؤخرًا في المنشور ، كيف يمكن لـ Google اختيار إجابات على استعلامات How-to.

ركزت براءة الاختراع التي كتبتها في هذا المنشور على محاولة العثور على الثقة في الخطوات التي قد تجيب على مثل هذا الاستعلام ، بدلاً من تلك التي تدور حول تحديد ما إذا كان الاستعلام هو استعلام يبحث عن إجابات وما إذا كانت الإجابة توفر استجابة جيدة لهذا الاستعلام.

توليد أزواج عنصر السؤال / الإجابة

سيعالج نظام البحث أزواج الأسئلة / الإجابات في بيانات التدريب لتحديد أنواع الأسئلة وأنواع الإجابات المقابلة.

سيحسب الإحصائيات التي تمثل نوع السؤال / نوع الإجابة التي من المرجح أن تولد إجابات جيدة لاستعلامات البحث عن الإجابة.

يتم هذا التحديد على نظام كمبيوتر يشار إليه باسم محرك التدريب.

يبدأ بتحديد بيانات التدريب.

بيانات التدريب هي البيانات التي تربط الأسئلة بالإجابات ، مثل أزواج الأسئلة والأجوبة.

يمكن أن تتضمن بيانات التدريب استعلامات تم تحديدها للبحث عن إجابات ومقتطفات من نتائج البحث المحددة بواسطة الباحثين ، إما بشكل عام أو تحديدها بشكل متكرر أكثر من نتائج البحث الأخرى.

في بيانات التدريب هذه ، قد يقوم النظام بتصفية أنواع معينة من الكلمات والعبارات من الأسئلة ، مثل كلمات التوقف.

لذلك ، يمكن تصفية "كيفية طهي اللازانيا" لتوليد "كيف يتم طهي اللازانيا".

يمكن إزالة بعض الأجزاء من السؤال ، مثل إزالة الصفات وعبارات الجر من الاستعلام.

لذلك يمكن تصفية استعلام مثل "أين يقع المريء في جسم الإنسان" لتوليد "مكان وجود المريء".

يمكن للنظام أيضًا تحويل المصطلحات في الأسئلة والأجوبة إلى أشكال أساسية.

وهذا يعني أن الأشكال المنحرفة لمصطلح "طباخ" ، على سبيل المثال ، "طبخ" و "مطبوخ" و "طهاة" وما إلى ذلك ، ربما تحولت إلى الشكل المتعارف عليه "طباخ".

يمكن تحديد أنواع الأسئلة من عناصر السؤال في بيانات التدريب.

نوع السؤال هو مجموعة من عناصر الأسئلة التي تمثل معًا خصائص استعلام البحث عن إجابات.

يحدد نوع السؤال (كيف ، كوك) عنصري سؤال ، "كيف" و "كوك".

يتطابق الاستعلام مع هذا النوع من الأسئلة عندما يحتوي على مصطلحات تطابق جميع عناصر السؤال في نوع السؤال.

يطابق الاستعلام "how to cook pizza" نوع السؤال (how، cook) لأن الاستعلام يتضمن جميع عناصر السؤال من نوع السؤال.

تخبرنا براءة الاختراع أنه يمكن طلب أنواع الأسئلة أو عدم ترتيبها. (يبدو أن هذا يشير إلى ما إذا كان الاستعلام عبارة عن استعلام "كيف" يعرض خطوات معينة يجب اتباعها بترتيب معين.)

تستخدم براءة الاختراع قوسًا مجعدًا لتحديد ما إذا كان الاستعلام يستخدم بنية مرتبة.

لذلك ، سيطابق الاستعلام نوع السؤال {how، cook} إذا وفقط إذا كان المصطلح "how" يحدث في الاستعلام قبل المصطلح "cook".

يتطابق زوج السؤال والإجابة من خلال النظر في ، لكل سؤال ، شروط السؤال التي تتطابق مع أي مجموعة من أنواع عناصر الأسئلة.

يمثل كل نوع عنصر سؤال خاصية n-gram التي تحدث في السؤال.

أنواع عناصر الأسئلة الشائعة

توفر براءة الاختراع بعض أنواع عناصر الأسئلة الشائعة والتي تشمل:

مثيل الكيان - يتطابق نوع مثيل الكيان مع n-grams التي تمثل مثيلات الكيان. على سبيل المثال ، يطابق n-gram “Abraham Lincoln” نوع عنصر السؤال لأن هذا n-gram هو مثيل لكيان. عندما يطابق n-gram نوع عنصر السؤال هذا ، يشتمل نوع السؤال الناتج على عنصر سؤال يمثل مثيل الكيان لـ n-gram ، على سبيل المثال ، (الكيان / Abraham_Lincoln). ستتطابق أيضًا n-grams الأخرى التي تطابق أي أسماء مستعارة للكيان نفسه مع عنصر السؤال هذا ، على سبيل المثال ، "Abe Lincoln" و "President Lincoln" و "Honest Abe".

فئة الكيان - يتطابق نوع فئة الكيان مع n-grams التي تمثل مثيلات لفئات الكيان. على سبيل المثال ، تطابق n-gram “lasagna” نوع عنصر السؤال هذا لأنها مثيل لفئة الكيان التي تمثل أطباق الطعام. عندما يطابق n-gram نوع عنصر السؤال هذا ، يشتمل نوع السؤال الناتج على عنصر سؤال يمثل فئة الكيان ، على سبيل المثال ، (الكيان / الأطباق)

جزء من فئة الكلام - يتطابق نوع فئة جزء من الكلام مع n-grams التي تمثل حالات من فئات جزء من الكلام. على سبيل المثال ، n-gram "run" يطابق نوع عنصر السؤال هذا لأنه مثيل لفئة جزء من الكلام "verbs". عندما يطابق n-gram نوع عنصر السؤال هذا ، يشتمل نوع السؤال الناتج على عنصر سؤال يمثل فئة الجزء المطابق من الكلام ، على سبيل المثال ، (جزء من الكلام / فعل).

كلمة الجذر - يتطابق نوع الكلمة الجذري مع n-grams التي يحددها النظام على أنها الكلمة الجذرية للسؤال. بشكل عام ، كلمة الجذر هي مصطلح لا يعتمد على المصطلحات الأخرى في السؤال. على سبيل المثال ، في "كيفية طهي اللازانيا" ، كلمة "طبخ" هي كلمة الجذر. وبالتالي ، سيتطابق "cook" مع نوع عنصر السؤال هذا عند ظهور "cook" في طلب البحث "how to cook lasagna." يتضمن نوع السؤال الناتج المطابقة n-gram ، على سبيل المثال ، (cook).

N-gram –النوع n-gram يطابق أي n-gram. ومع ذلك ، تخبرنا براءة الاختراع أنه لتجنب التوليد الضخم لأنواع الأسئلة من بيانات التدريب ، يمكن للنظام تقييد عناصر السؤال n-gram على مجموعة محددة مسبقًا من n-grams.

قد يحدد نظام البحث مسبقًا عناصر سؤال n-gram لتشمل كلمات وعبارات الأسئلة ، مثل "كيف" و "كيف" و "متى" و "متى كان" و "لماذا" و "أين" و "ماذا" "من" و "من".

قد يظهر أكثر من نوع عنصر السؤال.

لذا ، فإن n-gram “George Washington” يطابق كلا من نوع مثيل الكيان ، مما ينتج عنه كيانات عنصر السؤال / George_Washington ، بالإضافة إلى نوع فئة الكيان ، مما يؤدي إلى كيانات عنصر السؤال / us_presidents.
قد يتطابق n-gram “George Washington” أيضًا مع النوع n-gram اعتمادًا على كيفية قيام النظام بتحديد عدد أنواع n-gram.

أيضًا ، يتطابق المصطلح "cook" مع نوع الكلمة الجذر ونوع مثيل الكيان ونوع فئة الكيان.

مثال لتوسيع الأسئلة وأنواع الإجابات

بعد أن يحدد هذا النظام أنواع عناصر الأسئلة المطابقة ، يمكنه بعد ذلك إنشاء أنواع أسئلة عن طريق إنشاء مجموعات مختلفة من عناصر السؤال بأطوال متفاوتة ومستويات متعددة من العمومية.

يمكن أن يسمح هذا باكتشاف أنواع الأسئلة التي توفر توازنًا جيدًا بين العمومية والخصوصية.

على سبيل المثال ، "كيفية طهي اللازانيا".

المصطلح الأول "how" يطابق نوع عنصر n-gram فقط.

ولكن ، "cook" يطابق نوع العنصر n-gram ، ونوع عنصر كلمة الجذر ، ونوع عنصر فئة الكيان للفئة "الهوايات".

وبالتالي ، يمكن للنظام إنشاء أنواع الأسئلة التالية المكونة من عنصرين عن طريق تحديد مجموعات مختلفة من عناصر الأسئلة المطابقة:

(كيف طبخ)

(كيف ، كيان / هوايات)

يتطابق المصطلح "lasagna" مع نوع عنصر n-gram ونوع عنصر فئة الكيان "dish". وبالتالي ، يمكن للنظام إنشاء أنواع الأسئلة التالية المكونة من ثلاثة عناصر عن طريق تحديد مجموعات مختلفة من عناصر الأسئلة المطابقة:

(كيف ، طبخ ، لازانيا)

(كيف ، طبخ ، كيان / أطباق)

(كيف ، كيان / هوايات ، كيان / أطباق)

(كيف ، كيان / هوايات ، لازانيا)

اختيار أنواع عناصر الإجابة

تحدد براءة الاختراع "نوع الإجابة" على أنه مجموعة من عناصر الإجابة التي تمثل مجتمعة خصائص الإجابة الصحيحة على استعلام البحث عن إجابات.

قد يُنشئ نهج استعلامات البحث عن الإجابات أنواعًا من الإجابات عن طريق معالجة تلك الإجابات في بيانات التدريب وتحديد ، لكل إجابة ، شروط الإجابة التي تتطابق مع أي مجموعة من أنواع عناصر الإجابة.

قد يُنشئ نظام البحث أنواع الإجابات من خلال البحث عن عناصر الإجابة التي تتناسب مع أنواع عناصر الإجابة.

تتضمن بعض أنواع عناصر الإجابات الشائعة وعناصر الإجابة المقابلة لها ما يلي:

القياس - قد يتطابق نوع المقياس مع المصطلحات التي تمثل القياسات الرقمية. يمكن أن تشمل:

  • التواريخ ، على سبيل المثال ، "1997" ، "فبراير. 2 ، 1997 "أو" 19/2/1997 "
  • القياسات الفيزيائية ، على سبيل المثال ، "1.85 سم" ، "12 بوصة"
  • المدد الزمنية ، "10 دقائق" ، "ساعة واحدة"
  • أي قياس رقمي مناسب آخر

N-gram –النوع n-gram يطابق أي n-gram في الإجابة. لتجنب التوليد الضخم لأنواع الإجابات ، قد يقيد النظام عناصر الإجابة بـ n-gram إلى n-grams أقل من قيمة معينة لـ n وهذا غير شائع. على سبيل المثال ، يمكن للنظام تقييد عناصر الإجابة بـ n-gram إلى 1 جرام و 2 جرام مع وجود درجة تكرار معكوس للوثيقة تفي بالحد الأدنى.

الفعل - نوع الفعل يطابق أي مصطلحات يحددها النظام على أنها أفعال.

حرف الجر -The أنواع حرف الجر يطابق أي حيث أن النظام يحدد أن تكون حروف الجر.

قيل لنا أن النظام يمكنه تحديد أنواع عناصر الإجابة لأي جزء من الكلام.

ولكن ، في بعض التطبيقات ، قد يستخدم النظام أنواع الفعل وحروف الجر فقط.

Entity_instance - نوع مثيل الكيان يطابق n-grams التي تمثل مثيلات الكيان.

قد يشتمل نوع الإجابة على عنصر إجابة يمثل مثيل كيان ، على سبيل المثال ، (الكيان / Abraham_Lincoln).

N-gram بالقرب من الكيان - يستخدم نوع n-gram-near-ken كلا من نوع عنصر الإجابة n-gram ونوع عنصر إجابة مثيل الكيان ويفرض أيضًا تقييدًا بأن n-gram يحدث بالقرب من مثيل الكيان في الإجابة. يمكن للنظام اعتبار n-gram بالقرب من مثيل الكيان عندما يكون n-gram:

  • يحدث في الإجابة ضمن الحد الأدنى لعدد مصطلحات مثيل الكيان
  • يحدث في نفس الجملة مثل مثيل الكيان
  • يحدث في نفس المقطع مثل مثيل الكيان

على سبيل المثال ، في الإجابة "لقد ولد أوباما في هونولولو" ، تحدث كلمة n-gram غير المألوفة "Honolulu" ضمن خمسة مصطلحات لمثال الكيان "أوباما. يتضمن نوع الإجابة الناتج n-gram ومثيل الكيان ، على سبيل المثال (الكيان / أوباما بالقرب من هونولولو)

الفعل القريب من الكيان - يستخدم نوع الفعل القريب من الكيان كلاً من نوع عنصر إجابة الفعل ونوع عنصر إجابة مثيل الكيان ويفرض بالمثل قيدًا على أن الفعل يحدث بالقرب من مثيل الكيان في الإجابة. على سبيل المثال ، بالنسبة إلى "وُلد أوباما في هونولولو" ، يمكن أن يشتمل نوع الإجابة الناتج على عنصر الإجابة (الكيان / أوباما قريب من الولادة).

حرف الجر بالقرب كيان يفرض نوع الاستخدامات حرف الجر شبه كيان كل من نوع عنصر -The حرف الجر الجواب والمقام كيان نوع عنصر الجواب وبالمثل تقييد أن حرف الجر تحدث بالقرب من سبيل المثال كيان في الجواب. على سبيل المثال ، بالنسبة إلى "وُلد أوباما في هونولولو" ، يمكن أن يشتمل نوع الإجابة الناتج على عنصر الإجابة (الكيان / أوباما قريب في)

فئة الفعل - يطابق نوع فئة الفعل n-grams التي تمثل مثيلات لفئات الفعل. على سبيل المثال ، يمكن للنظام تحديد جميع الأفعال التالية على أنها مثيلات فعل الفئة / مزيج: add، blend، combingle، connect، cream، fuse، Join، link، merge، mingle، mix، network، pool. يتضمن نوع الإجابة الناتج عنصر سؤال يمثل فئة الفعل ، على سبيل المثال ، (فعل / مزيج).

Skip grams –يحدد نوع skip-gram أن bigram ، بالإضافة إلى عدد من المصطلحات ، تحدث بين مصطلحات bigram. على سبيل المثال ، إذا كانت قيمة التخطي 1 ، فإن قيمة التخطي "where * the" تتطابق مع جميع n-grams التالية: "where is the" و "where was the" و "where does the" و "where has ال." يشتمل نوع الإجابة الناتج على عنصر إجابة يمثل bigram وقيمة التخطي ، على سبيل المثال ، (حيث * the) ، حيث تمثل علامة النجمة المفردة قيمة تخطي قدرها 1.

يحسب النظام أزواج نوع السؤال / نوع الإجابة.

زوج من الأسئلة والأجوبة الدرجات

تخبرنا براءة الاختراع أن النظام سيحسب درجة لكل زوج من أنواع الأسئلة / الإجابات.

تعتمد هذه النتيجة على "الجودة التنبؤية لزوج من نوع السؤال / نوع الإجابة المحدد كما تنعكس في بيانات التدريب."

من المحتمل أن يكون لزوج نوع السؤال / نوع الإجابة بدرجة جيدة نوع إجابة به عنصر أو أكثر من عناصر الإجابة التي تمثل بشكل جماعي خصائص إجابة مناسبة لاستعلام البحث عن الإجابة الذي يمثله نوع السؤال.

سينتظر النظام عادةً حتى يتم حساب جميع الأعداد قبل حساب الدرجة لنوع سؤال / نوع إجابة معين.

في بعض التطبيقات ، يحسب النظام درجة المعلومات المتبادلة (PMI) لكل زوج. تشير درجة مؤشر PMI إلى أن السؤال والجواب مستقلان وليس لهما علاقة. من ناحية أخرى ، تمثل الدرجة العالية احتمالية أعلى للعثور على نوع الإجابة المطابق للإجابات للأسئلة المطابقة لنوع السؤال المقابل.

يقوم النظام بتحديد أزواج نوع السؤال / الإجابة التي حصلت على أفضل الدرجات. قد يتم ترتيب هذه الأزواج ويمكن اختيار الأزواج التي لديها درجة تفي بالحد الأدنى.

من المحتمل أن تمثل أنواع الإجابات الخاصة بالأزواج المحددة إجابات مناسبة على استعلامات البحث عن إجابات ممثلة بأنواع الأسئلة المقابلة.

قد يقوم نظام استعلام البحث عن إجابات بعد ذلك بفهرسة أزواج نوع السؤال / نوع الإجابة المحدد حسب نوع السؤال بحيث يمكن للنظام الحصول بكفاءة على جميع أنواع الإجابات المرتبطة بنوع معين من الأسئلة أثناء التسجيل عبر الإنترنت.

قد يقوم بفرز فهرس نوع السؤال حسب الدرجات لاتخاذ قرارات في الوقت الفعلي حول عدد أنواع الإجابات التي يجب تجربتها.

قد يقوم هذا النظام بفرز كل نوع إجابة مرتبط بنوع السؤال حسب الدرجة بحيث يمكن بعد ذلك معالجة أنواع الإجابات التي لها أعلى الدرجات أولاً في وقت الاستعلام.

عملية إنشاء إجابات لطلبات البحث عن الإجابة

ذكّرتني براءة الاختراع هذه ببراءة اختراع أخرى كتبت عنها في الماضي تتضمن الإجابة على الأسئلة. كانت براءة الاختراع تلك واحدة كتبتها في المنشور ، هل تستخدم Google المخطط لكتابة ممرات الإجابة للمقتطفات المميزة؟

يخبرنا هذا المنشور عن كيفية اختيار Google بين الإجابات النصية المكتوبة جيدًا للأسئلة التي تحتوي أيضًا على بيانات منظمة مرتبطة بها لتقديم حقائق إضافية لتلك الإجابات ، ولكنها لم تقدم التحليل الذي تقوم به براءة الاختراع هذه من خلال النظر في عناصر الإجابة- البحث عن استفسارات وعناصر من تلك الإجابات.

ينتهي الوصف في براءة الاختراع هذه بتقديم مزيد من التفاصيل حول كيفية إنشاء الإجابات على وجه التحديد لاستفسارات البحث عن إجابات.

يبدأ بتلقي استعلام والحصول على نتائج البحث عنه

ثم تحديد نوع السؤال المطابق للاستعلام.

إذا لم يتطابق الاستعلام مع أي من أنواع الأسئلة التي تم إنشاؤها ، فيمكن للنظام تحديد أن الاستعلام ليس استعلامًا يبحث عن إجابات.

إذا كان الأمر كذلك ، فإنه يستجيب بدون مربع إجابة ، ويعرض صفحة نتائج البحث بدون إجابة.

يتم تحديد نوع استعلام البحث عن الإجابة بواسطة عناصر نوع السؤال المطابق. قد يقرر نظام البحث بعد ذلك فقرات النص التي من المحتمل أن تكون إجابات جيدة لاستعلام البحث عن الإجابة.

للقيام بذلك ، قد يصل إلى فهرس نوع السؤال الذي يربط كل نوع سؤال مطابق بواحد أو أكثر من أنواع الإجابات.

قد يحسب نظام البحث درجات الإجابات وفقًا لأنواع الإجابات التي تم الحصول عليها من البحث.

قد يحدد نظام البحث ما إذا كانت درجة أعلى إجابة تفي بحد أدنى. إذا كانت النتيجة لا تفي بحد أدنى ، يمكن للنظام أن يقرر أن الإجابة ليست إجابة جيدة على الاستعلام ويمكن أن يرفض إظهار هذه الإجابة على صفحة نتائج البحث.

إذا كانت النتيجة تفي بالحد الأدنى ، فقد يتضمن نظام البحث أعلى إجابة في صفحة نتائج البحث ويقدم صفحة نتائج البحث ردًا على الاستعلام.

الوجبات الجاهزة النهائية عند الإجابة عن الاستفسارات

توفر براءة الاختراع هذه بعض الجوانب الإضافية لكيفية عمل العملية الموضحة في براءة الاختراع هذه وتنص على أنها قد تتضمن أيضًا خطوات أخرى لم يتم تغطيتها بالضرورة.

لقد أشرت إلى براءة اختراع أخرى واحدة على الأقل (تلك المتعلقة باستفسارات الكيفية) ، والتي تصف المزيد من الجوانب لكيفية اختيار الإجابة التي لم يتم تفصيلها في براءة الاختراع هذه أيضًا.

لذلك ، من المنطقي النظر إلى براءات الاختراع الأخرى التي تغطي جوانب إضافية للرد على الاستفسارات التي تركز بشكل خاص على البحث عن إجابات ، مثل تلك التي ربطتها أعلاه حول إجابات اللغة الطبيعية والرد على الاستفسارات باستخدام فقرات الإجابة.

لقد كتبت أيضًا عن كيفية قيام Google بإنشاء الرسوم البيانية المعرفية ردًا على الاستفسارات ، والنظر في درجات الارتباط بين الكيانات وتصنيفات وسمات تلك الكيانات للإجابة على الأسئلة في المنشور "الإجابة على الأسئلة باستخدام الرسوم البيانية المعرفية".

ليس لدينا إرشادات واضحة حول كيفية توافق الأساليب المتبعة في براءات الاختراع المختلفة التي تدور حولها تلك المنشورات معًا ، ولكن كن على دراية بوجودها ، وربما يجب أخذها في الاعتبار عند تحديد مدى ملاءمة كل شيء معًا عندما يمكن أن تستجيب Google لاستفسارات البحث عن إجابات. نافع.