كيف يمكن لـ Google تفسير استعلام غامض باستخدام تفسير دلالي
نشرت: 2019-08-15استفسارات غامضة وتفسيرات دلالية
عندما يسأل شخص ما استعلامًا غامضًا في Google ، كيف يتم الرد على هذا الاستعلام؟ قد يبدأ بمحاولة فهم القصد من وراء الاستعلام. هم لتفسير ما قد يكون قصده الشخص الذي أدخل هذا الاستعلام الغامض والعثور على الكلمات الصحيحة. قد يكون هذا نموذج استعلام أساسي ، يستخدم لمحاولة الكشف عن إجابة قد ترضي الباحث. كانت هذه ثاني براءة اختراع رأيتها مؤخرًا تستخدم نفس نموذج الاستعلام ، "ما هي مدة هاري بوتر؟"
لقد ذكرت هذا المثال على Twitter وتلقيت العديد من الأفكار حول كيفية الرد على ذلك:
كيف تجيب Google على طلب البحث "ما هي مدة هاري بوتر؟" إنها المرة الثانية التي أرى فيها هذا كمثال في براءة اختراع Google ، وهذه المرة الثانية لها تفسير مختلف عن براءة الاختراع الأولى. كيف تجيب عليه؟
- بيل سلاوسكي (Bill_slawski) 8 أغسطس 2019
لقد كتبت مؤخرًا منشورًا حول كيف تجيب Google على الأسئلة الغامضة في الاستعلامات؟ التي استخدمت أيضًا نموذج الاستعلام هذا. حصلت Google على براءة اختراع تغطي بعض المناطق نفسها في براءة اختراع تم منحها بعد أسبوع وتوفر إجابة أكثر ثراءً وتفصيلاً.
إن براءة الاختراع التي أكتب عنها في هذا المنشور تتعلق تحديدًا بتقييم التفسيرات الدلالية المختلفة لاستعلام البحث. فيما يلي الخطوات التي قد يستغرقها تقديم إجابة على طلب بحث غامض مثل "ما هي مدة هاري بوتر:"
- قد تتضمن التقنية تحديد تفسير دلالي واحد أو أكثر لاستعلام بحث معين. يرتبط كل من هذه التفسيرات الدلالية باستعلام أساسي واحد على الأقل. لكل تفسير دلالي ، يتم إنشاء استعلام بحث معدل بناءً على استعلام البحث الأصلي والاستعلام الأساسي المرتبط به
- يتم الحصول على نتائج البحث بعد ذلك لاستعلام البحث المحدد واستعلامات البحث المعدلة
- تتم مقارنة نتائج البحث لكل استعلام بحث معدل ونتائج البحث لاستعلام البحث الأصلي لتقييم التفسير الدلالي المرتبط بكل استعلام بحث معدل
- على سبيل المثال ، يمكن تصنيف كل تفسير دلالي أو التحقق من صحته
- يمكن مقارنة التفسيرات الدلالية المختلفة للاستعلام الأصلي الغامض ، ويمكن تحديد تفسير دلالي لاستعلام البحث الأصلي بناءً على المقارنة.
يمكن مقارنة الإصدارات المختلفة من الاستعلام الغامض مع بعضها البعض
للحصول على إصدارات مختلفة يمكن إعادة كتابتها ، يتم إجراء بحث على الاستعلام الأصلي.
يمكن النظر إلى هذه لمعرفة ما إذا كان من الممكن تحديد التفسير الدلالي ، الذي يمثل نية المرشح المرتبطة به.
يمكن مقارنة درجة التشابه بين النتائج
يمكن العثور على براءة الاختراع هذه التي تتناول الاستفسارات الغامضة على:
تقييم التفسيرات الدلالية لاستعلام البحث
المخترعون: آشيش فينوغوبال ، جاكوب دي أوسكوريت ، جون بليتسر ، وإدوارد إيفريت أندرسون
الوكيل: Google LLC
براءات الاختراع الأمريكية: 10353964
تم المنح: 16 يوليو 2019
تاريخ التقديم: 11 مارس 2015
الملخص
يتعلق الكشف الحالي بتقييم التفسيرات الدلالية المختلفة لاستعلام البحث. تتضمن إحدى طرق الأمثلة الحصول على مجموعة من نتائج البحث لاستعلام بحث معين مقدم إلى محرك بحث ؛ الحصول على مجموعة من التفسيرات الدلالية لاستعلام البحث المحدد ؛ الحصول على استعلام بحث أساسي لكل تفسير دلالي للمجموعة ؛ إنشاء استعلام بحث معدل يعتمد جزئيًا على استعلام البحث المحدد واستعلام البحث الأساسي للتفسير الدلالي ؛ الحصول على مجموعة من نتائج البحث لاستعلام البحث المعدل للتفسير الدلالي ؛ وتحديد ، لكل تفسير دلالي للمجموعة ، درجة من التشابه بين (1) مجموعة نتائج البحث لاستعلام البحث المعدل للتفسير الدلالي ، و (2) مجموعة نتائج البحث لاستعلام البحث المحدد.
تحديد النية وراء استعلام غامض
قيل لنا أنه "من أجل تحسين جودة نتائج البحث ، قد يفسر محرك البحث طلبات البحث المستلمة لتمييز النية المحتملة المرتبطة بكل طلب بحث". هذا يعني ما الذي يبحث عنه الباحث غالبًا عندما يكتب شيئًا مثل "ما هي مدة هاري بوتر؟" في مربع البحث.
صعوبات في تحديد النية مع الاستعلامات الغامضة
تم ذكر مثال آخر تم تضمينه أيضًا في براءة الاختراع التي كتبتها حول تضمين استفسارات غامضة في براءة الاختراع هذه أيضًا:
على سبيل المثال ، يمكن أن يشير طلب البحث الذي يذكر "عمر واشنطن" ، على سبيل المثال ، إلى الرئيس جورج واشنطن ، أو الممثل دينزل واشنطن ، أو ولاية واشنطن ، أو واشنطن العاصمة ، وقد يكون تحديد نية المستخدم المرتبطة بمثل هذه الاستعلامات الغامضة أمرًا صعبًا.

قررت Google أنني مهتم على الأرجح بجورج واشنطن.
تخبرنا براءة الاختراع أن الأمر يتعلق بتوفير "تقنيات لتقييم التفسيرات المختلفة لاستعلام بحث معين".
التفسيرات الدلالية لاستعلام غامض

تبدأ العملية الكامنة وراء براءة الاختراع هذه بتفسير دلالي مقترن باستعلام أساسي واحد على الأقل.
1. لكل من هذه التفسيرات الدلالية ، يتم إنشاء استعلام بحث معدل بناءً على استعلام البحث الأصلي والاستعلام الأساسي المرتبط به.
في مثال الاستعلام "ما هي مدة هاري بوتر" ، فإن المصطلحات "هاري بوتر" غامضة ، وقد تشير إلى موضوع معين أو أكثر مثل:
- أي من الكتب السبعة في سلسلة هاري بوتر
- أي فيلم من التعديلات على الكتب
- ركوب
- متنزه، مدينة ترفيهية
- كتاب مسموع
- كارتون
- إلخ.
يمكن أن يشير هذا الاستعلام أيضًا إلى شخصية هاري بوتر نفسها.
اعتمادًا على الموضوع الذي يقصد الباحث الإشارة إليه في الاستعلام ، يمكن تطبيق تفسير مختلف ، أو حتى عدة تفسيرات مختلفة.
- كتاب - ربما يريد الباحث معرفة عدد الكلمات أو الصفحات في الكتاب
- أفلام - ربما يريد البحث معرفة وقت تشغيل الفيلم
- الشخصية الخيالية - قد يرغب الباحث في معرفة طوله
الاستعلام الأصلي الغامض: ما هي مدة هاري بوتر؟
التفسير الدلالي: ما هي مدة كتاب هاري بوتر؟
التفسير الدلالي: ما هي مدة فيلم هاري بوتر؟
التفسير الدلالي: ما هو ارتفاع شخصية هاري بوتر؟
التفسير الدلالي: كم عمر شخصية هاري بوتر؟
2. يتم الحصول بعد ذلك على نتائج البحث لكل من استعلام البحث الأصلي الغامض واستعلامات البحث المعدلة (التفسير).
3. تتم مقارنة نتائج البحث لكل استعلام بحث معدل ونتائج البحث لاستعلام البحث الأصلي لتقييم التفسير الدلالي المرتبط بكل استعلام بحث معدل.
4. على سبيل المثال ، يمكن تصنيف كل تفسير دلالي أو التحقق من صحته. بهذه الطريقة ، يمكن مقارنة التفسيرات الدلالية المختلفة لاستعلام البحث الأصلي مع بعضها البعض. في بعض الحالات ، يمكن تحديد تفسير دلالي لاستعلام البحث الأصلي بناءً على المقارنة.

مزايا اتباع العملية من البراءة
1. باستخدام نتائج البحث لتقييم التفسيرات الدلالية المختلفة ، يمكن النظر إلى مصادر البيانات الأخرى مثل:
- بيانات النقر
- البيانات الخاصة بالمستخدم
- الآخرين التي يتم استخدامها عند إنتاج نتائج البحث
2. من خلال تقييم التفسيرات الدلالية المختلفة لاستعلام ما ، يمكن توقع نية المستخدم للاستعلام ، وبالتالي تقليل تأثير أي غموض في الاستعلام على جودة نتائج البحث المحددة.
3. تم تحديد درجة الثقة لكل من التفسيرات الدلالية ، والتي تمثل "احتمال أن يتطابق التفسير المرتبط مع نية المستخدم للاستعلام المعين".
يمكن أيضًا تحديد حد الثقة للإشارة إلى الحد الأدنى من درجة الثقة اللازمة لأخذ التفسير الدلالي في الاعتبار عند إعادة نتائج البحث إلى المستخدم. نظرًا لأن Google مهتم بإعادة نتائج عالية الجودة للباحثين ، حتى عندما يكتبون استعلامًا قد يبدو غامضًا في مربع البحث ، والإجابة التي تبدو معقولة ليست سيئة. تخبرنا براءة الاختراع أنه قد يتم تعيين درجة الثقة هذه عند عتبة عالية:
على سبيل المثال ، قد يحدد حد الثقة أن التفسير الدلالي مع درجات الثقة التي تزيد عن 90 لاستعلام بحث معين يجب أن يؤخذ في الاعتبار عند عرض نتائج البحث.
يمكن استخدام درجة الثقة في التفسيرات الدلالية لتحديد أي من التفسيرات الدلالية قد تتناسب مع استعلام معين. على سبيل المثال ، قد يتم تسجيل "ما هي مدة هاري باتر" لإخبارنا بأن النسخة التي تسأل عن المدة التي قضاها أحد كتب هاري بوتر في الصفحات ، أو كم كان أحد أفلام هاري بوتر ، بدلاً من طوله أو كم كان عمر هاري بوتر في أحد تلك الكتب.
الاستعلامات المتعارف عليها والاستعلامات الغامضة
هذه هي المرة الثانية التي أتذكر فيها رؤية مستند من Google يشير إلى الاستعلامات الأساسية. كانت المرة الأولى في مقالة Biperpedia: An Ontology for Search Applications ، حيث يبدو أنها تخبرنا أنها قد تحفظ التنسيق الذي شاهدته مصطلحات استعلام مختلفة في سجلات الاستعلام (جنبًا إلى جنب مع الأخطاء الإملائية الشائعة). الاستعلامات الكنسية المذكورة في براءة الاختراع هذه مختلفة قليلاً. أعجبني هذا التفسير لما هو الاستعلام الأساسي:
قد يكون الاستعلام الأساسي استعلامًا ينقل نية المستخدم المرتبطة بتفسير دلالي معين
يمكن أن يكون "هيكلًا أو نموذجًا مستخدمًا لإنشاء استعلام بحث معدل من الاستعلام الأصلي المحدد" ويمكن أيضًا "دمجه مع المعلومات في الاستعلام المحدد لإنشاء استعلام بحث معدل"
نقدم بعض الأمثلة على الاستعلامات الكنسية المستخدمة لتقديم استعلامات معدلة في براءة الاختراع:
على سبيل المثال ، قد يكون الاستعلام الأساسي عبارة عن استعلام غير كامل مثل "كم عدد صفحات الكتاب
. "
بالنظر إلى هذا النموذج من الاستعلام الأساسي ، نرى كيف يمكن إنشاء استعلام معدل:
قد يتم إنشاء استعلام بحث معدل من الاستعلام الأساسي باستخدام أجزاء من الاستعلام المحدد. على سبيل المثال ، بالنظر إلى الاستعلام الكنسي السابق والاستعلام الخاص "كم مدة هاري بوتر" ، يمكن إنشاء استعلام البحث المعدل "كم عدد صفحات كتاب هاري بوتر".
قد يتضمن التعديل إعادة كتابة الاستعلام الأصلي لمطابقة الاستعلام الأساسي:
على سبيل المثال ، يمكن إعادة تنسيق طلب بحث معين "ما هي مدة كتاب هاري بوتر" إلى "ما هي مدة كتاب هاري بوتر" لمطابقة طلب بحث أساسي "ما هي مدة الكتاب؟
. "
الكيانات وإعادة كتابة استعلام غامض
في بعض عمليات التنفيذ ، يتضمن إنشاء استعلام بحث معدل للتفسير الدلالي استبدال سلسلة فرعية مضمنة في استعلام البحث المعين الذي يحدد كيانًا معينًا بسلسلة فرعية بديلة تحدد الكيان المعين المتضمن في استعلام البحث الأساسي للتفسير الدلالي.
على سبيل المثال ، قد يكون للاستعلام المعين "كم مدة هاري بوتر" تفسير دلالي للمطالبة بعدد الصفحات في الكتاب.
يبدو أن تضمين كيان في طلب بحث طريقة للتأكد من وجود قدر أكبر من اليقين في الاستعلام. تخبرنا براءة الاختراع أن استخدام كيان من الاستعلام الأصلي هو بالتأكيد جزء من هذه العملية:
يمكن أن يكون الاستعلام الكنسي المرتبط بهذا التفسير الدلالي هو "كم طول ملف
الكتاب." وبالتالي ، مع تحديد "هاري بوتر" ككيان معين ، يمكن إنشاء استعلام بحث معدل عن طريق استبدال السلسلة الفرعية "هاري بوتر" في استعلام البحث المحدد بالسلسلة الفرعية "كتاب هاري بوتر" المشتقة من استعلام البحث الكنسي.
استخدام التشابه لتقرير ما إذا كان استعلام معدل يتناسب جيدًا مع استعلام غامض
قد يعتمد التشابه المستخدم في اتخاذ هذا القرار على مقارنة نتائج البحث للاستعلام الغامض والاستعلام المعدل لمعرفة:
1. تكرار حدوث كلمات رئيسية معينة مرتبطة باستعلام بحث معين في نتائج استعلام البحث المعدلة والتكرار داخل نتائج البحث لاستعلام البحث المحدد.
2. تعتمد درجة التشابه على مقارنة ترتيب نتائج استعلام البحث المعدلة بترتيب نتائج البحث لاستعلام بحث معين.
3. يمكن اعتبار البيانات الأخرى مثل
- معدل نقر المستخدم
- بيانات حركة الموقع
- بيانات أخرى
الوجبات الجاهزة
قد تقدم Google إجابات مختلفة لاستعلام غامض مثل "ما هي مدة هاري بوتر؟" لمعرفة النتائج التي يفضلها الناس على الآخرين. يبدو أن قرارات إظهار بعض النتائج على الآخرين قد تستند إلى تقييم أولي للاستعلامات المعدلة ودرجة الثقة المرتبطة بها. ولكن عندما يقوم شخص ما بإجراء استعلام من نوع "ما هي مدة هاري بوتر" ، فقد يكون من الأرجح أنهم يطلبون طول الفيلم أو عدد الصفحات الموجودة في أحد كتب هاري بوتر ، بدلاً من طول هاري بوتر بوتر هو أو كم عمر هاري بوتر.
يمكننا أن نرى كيف تحاول Google فهم القصد من وراء استعلام غامض. هل من الممكن أن تحاول Google أيضًا فهم القصد من الاستعلامات التي قد لا ندركها على أنها غامضة ، مثل البحث عن "بيتزا" في وقت الغداء. يبدو أن Google تدرك أن هذا استعلام عن مكان قريب للعثور على شريحة ، بدلاً من سجل بيتزا.

يمكنك تفسير ذلك على أنه نية للحصول على بعض الغداء من جانبي بدرجة عالية من الثقة.
