رسالتي الخامسة حول السياق في Google: إضافة حقائق السياق إلى إجابات الأسئلة (محدث)

نشرت: 2018-04-03

حقائق السياق تخبرنا كيف ترتبط الكيانات

أطول رؤساء الولايات المتحدة

تقدم Google مثالاً على كيفية استخدام موقع لمعلومات السياق في براءة اختراع جديدة تخبرنا عن حقائق السياق.

يتعلق هذا المنشور بوضع الحقائق في السياق ، وأشعر أنني بحاجة إلى الإشارة إلى المنشورات الأخرى التي كتبتها حول السياق في Google عندما أبدأ هذا المنشور. فهم السياق مهم. إن معرفة أن هناك براءات اختراع أخرى من Google تعتبر السياق مهمًا حقًا يضيف معنى إلى هذا المنشور. تتضمن بعض المنشورات السابقة التي كتبتها عن السياق ما يلي:

  • متجهات سياق براءات الاختراع من Google لتحسين البحث
  • السياق هو الملك: عمليات البحث بدون معاملات من Google
  • كيف يمكن أن تستخدم Google سياق الروابط لتحديد الروابط غير المرغوب فيها
  • نتائج البحث الموضوعي في Google؟

يخبرنا أحد تطبيقات براءات الاختراع الحديثة من Google أن الناس كثيرًا ما يسألون "كم يبلغ طول باراك أوباما؟" يشيرون إلى أن إضافة حقائق السياق إلى إجابة لهذا السؤال يمكن أن تجعل الإجابة أكثر فائدة:

في جوانب معينة ، يمكن أن تتضمن المعلومات السياقية المتعلقة بحقيقة معينة ترتيب الحقيقة بين الحقائق الأخرى المماثلة. على سبيل المثال ، قد يكون من المفيد معرفة أن باراك أوباما يبلغ طوله ستة أقدام وبوصة واحدة ، ومع ذلك ، قد يكون من المفيد معرفة أن باراك أوباما هو تاسع أطول رئيس للولايات المتحدة. على هذا النحو ، يمكن تقديم ذروة باراك أوباما بالإضافة إلى سياق كيفية مقارنة ذروة باراك أوباما برؤساء الولايات المتحدة الآخرين.

يخبروننا أنهم قد يختارون حقائق السياق بناءً على تسجيل تلك الحقائق ، وكيف يمكنهم عمل قوائم بأشياء مثل أطول الرؤساء.

قد يعتمد جزء من الدرجات الخاصة بحقائق السياق هذه جزئيًا على أشياء مثل عدد المرات التي قد تشير فيها استعلامات البحث الحديثة إلى الكيان المحدد. يمكن أن يتضمن إنشاء نص بلغة طبيعية يتوافق مع البيانات حول هذا الكيان.

يمكن التعرف على الاهتمام بحقائق السياق والكيانات ذات الصلة من سجلات الاستعلام

يستكشف المثال الذي يقدمونه في براءة الاختراع ، "كيف يتم ترتيب الحقيقة المنظمة داخل مجموعة أوسع."

تتمثل إحدى قيم هذا الأسلوب في أنه عند تسجيل الحقائق السياقية من استخدام المعلومات التي تظهر في استعلامات البحث ، فإنه يتطلب "تعقيدًا حسابيًا" أقل من مجرد "البحث الشامل في قاعدة معرفية للمعلومات المرتبطة بعمليات البحث عن طلبات البحث". وهذا يعني أن هذا الأسلوب "يمكنه تصفية البيانات" غير الشائعة "التي لا تظهر بشكل متكرر في استعلامات البحث الأخيرة لتحديد حقائق السياق بكفاءة ودقة."

لذلك قد تكون حقائق السياق التي قد تظهرها النتائج مرتبطة بما يبحث عنه الأشخاص حول كيان ما ، وحول الكيانات ذات الصلة. طلب البراءة هو:

تقديم حقائق السياق
حانة. الرقم: WO / 2018/052685
رقم الطلب الدولي: PCT / US2017 / 048459
تاريخ النشر: 22.03.2018
تاريخ الإيداع الدولي: 24.08.2017
المخترعون: أكاش نانافاتي وأندرو هيوز هيلمر

الملخص:

في أحد الجوانب ، تتضمن الطريقة تلقي قوائم الكيانات ، كل قائمة (1) لها درجة مرتبطة ، (2) مرتبطة بحقيقة سياق ذات صلة ، و (3) ترتيب مجموعة فرعية من الكيانات ، ولكل من القوائم للكيانات ، مما ينشئ ، لكل كيان في القائمة ، بنية بيانات تشير إلى (1) الكيان ، (2) حقيقة السياق المرتبطة بالقائمة ، (3) رتبة الكيان بالنسبة لحقيقة السياق ، و (4) ) نتيجة القائمة. يمكن أن تتضمن الطريقة أيضًا تلقي البيانات التي تحدد كيانًا معينًا ، واختيار بنية بيانات معينة تشير إلى كيان معين ، وتوفير بيانات للإخراج تشير إلى (1) حقيقة السياق المرتبطة بهيكل البيانات المعين الذي يشير إلى كيان معين ، و (2) رتبة الكيان بالنسبة لحقيقة السياق المرتبطة بهيكل البيانات المعين الذي يشير إلى الكيان المعين.

سجلات الاستعلام وحقائق السياق سريعة

يذكرني هذا النهج لتسجيل الحقائق ذات الصلة استنادًا إلى الاستفسارات بكيفية قيام Google ببناء الأنطولوجيا حول الموضوعات من خلال النظر في سجلات الاستعلام المتعلقة بتلك الموضوعات ، والتي كتبت عنها في عمليات الانتقال من الكلمات الرئيسية إلى الأنطولوجيا وأنماط الاستعلام عن تحسين محركات البحث. لقد كتبت عن أسئلة في أنماط الاستعلام التي تم العثور عليها في ذلك المنشور ، مثل "كم كان طول باراك أوباما؟" في براءة الاختراع التي أكتب عنها اليوم ، علمنا أن الرئيس أوباما كان تاسع أطول رئيس. لذا يبدو أن عملية استخدام سجلات الاستعلام لبناء الأنطولوجيا حول موضوع ما تتضمن أيضًا تصنيف الحقائق التي قد تكون مرتبطة بهذه الموضوعات أيضًا ، ربما لتضمين هذه المعلومات في الإجابات ، أو التكوينات الأخرى المحتملة ، مثل دائري مثل هذا:

أطول رؤساء الولايات المتحدة في دائرة

تشير براءة الاختراع إلى كيفية دمج حقائق السياق هذه مع الكيانات ذات الصلة ، مثل تلك التي قد نراها في الرف الدائري:

يمكن لكل من الكيانات ذات الصلة تضمين حقيقة ذات صلة. يمكن تقديم القائمة المقابلة لحقيقة السياق جنبًا إلى جنب مع الكيانات ذات الصلة والحقائق ذات الصلة المقابلة لكل من الكيانات ذات الصلة في القائمة المعنية. في بعض الجوانب ، قد يتم توفير عدد محدد مسبقًا من الكيانات ذات الصلة في منطقة الكيان ذات الصلة 14 من واجهة المتصفح لعرض حقائق السياق. يمكن أن يستند عدد الكيانات ذات الصلة التي يتم توفيرها إلى القائمة المرتبطة بحقيقة السياق أو حقيقة السياق أو العدد الإجمالي للكيانات ذات الصلة أو أي مجموعة منها. على سبيل المثال ، إذا كانت منطقة القائمة 11 من حقيقة السياق تتضمن "أطول رؤساء الولايات المتحدة" ، فيمكن أن تتضمن منطقة الكيان ذات الصلة 14 14 أطول أربعة رؤساء للولايات المتحدة: أبراهام لينكولن وليندون جونسون وتوماس جيفرسون وفرانكلين د. روزفلت والحقيقة ذات الصلة على التوالي ، أو الارتفاع في هذه الحالة ، لكل منهما.

لقد كتبت عن الكيانات ذات الصلة في نتائج البحث في المنشور درجات الكيانات ذات الصلة في عمليات البحث القائمة على المعرفة. تحدثت براءة الاختراع التي كتبتها في هذا المنشور عن نتائج الكيانات ذات الصلة وهذا يتحدث عن نتائج الحقائق ودرجات الكيانات ذات الصلة. يقودني ذلك إلى الاعتقاد بأنه قد يتعين علي البدء في التعرف على الكيانات ذات الصلة والحقائق ذات الصلة عندما أكتب عن كيان ما في المستقبل. وأن Google ستحاول على الأرجح فهم العلاقات بين الكيانات والحقائق وأنماط الاستعلام التي قد ترتبط بها.

تمت إضافة: تم منح براءة الاختراع هذه حول حقائق السياق في 14 مايو 2019 ، تحت اسم توفير حقائق السياق. أتذكر براءة اختراع Google التي كتبتها عنها في المنشور Google Shows Us How It Uses Entity Extracts for Knowledge Graphs ، والذي يتحدث عن فهم سياقات الكيانات (الحقائق المتعلقة بها) وتسجيل درجات أولئك الذين لديهم ثقة لإخبارنا بمدى صحة ذلك. قد تكون الحقائق.

تاريخ التحديث الأخير: 14 مايو 2019