نتائج الكيانات ذات الصلة في عمليات البحث القائمة على المعرفة
نشرت: 2018-02-12"محرك البحث المثالي سيفهم بالضبط ما تقصده ويعطيك ما تعنيه بالضبط
انت تريد." لاري بيدج ، كيف يعمل البحث
استخدام قواعد المعرفة للإجابة على الاستفسارات حول الكيانات
قبل ثلاث سنوات ، كتبت كيف يمكن استخدام كيانات قاعدة المعرفة في عمليات البحث حول كيفية البحث باستخدام استعلام مثل ، "ما هو الفيلم الذي يلعب فيه روبرت دوفال شخصية تقول كم يحب رائحة نابالم في الصباح . " هذا البحث عن فيلم يقول فيه ممثل مشهور أن سطرًا مشهورًا هو مثال على استخدام Google للحقائق التي قد يتعلمها من قواعد المعرفة حتى يمكنه الإجابة على الاستفسارات. لا يجيب مع مقتطف مميز. بدلاً من ذلك ، يعرض مقطع فيديو متبوعًا بمستندات أخرى تجيب أيضًا على هذا السؤال.
تنظر براءة الاختراع الممنوحة لـ Google الشهر الماضي أيضًا في المعلومات من الرسم البياني المعرفي التي ربما تكون قد تعلمتها من قواعد المعرفة للرد على الاستفسارات. ليس كمقتطفات مميزة ، بل نتائج بحث تتعرف على الكيانات في الاستعلام والخصائص ذات الصلة. هذا بحث دلالي يتجاوز مجرد فهم المرادفات والكلمات ذات الصلة الدلالية ، إلى معرفة بعض الخصائص المتعلقة بالأشياء المتضمنة في البحث (تذكر أن الرسم البياني للمعرفة من Google يدور حول "الأشياء وليس السلاسل" ، لذلك فهو يتجاوز مجرد مطابقة الكلمات الرئيسية من استعلام إلى نفس الكلمات الرئيسية (أو ذات الصلة) في المستند. كما يقدم مفهوم درجات الكيانات ذات الصلة أيضًا.
يجمع الرسم البياني المعرفي معلومات الكيان للإجابة على الاستفسارات
نعم ، الرسم البياني المعرفي يشبه الموسوعة ، لكن هذا ليس سبب وجوده. يحاول التعرف على الكيانات ، حتى يتمكن من المساعدة في الإجابة على الاستفسارات المتعلقة بها ، في نتائج البحث
تخبرنا براءة الاختراع الجديدة هذه كيف يمكنها استخدام المعلومات حول كيانات معينة للإجابة على الاستفسارات:
في بعض عمليات التنفيذ ، تشتمل الطريقة التي يتم تنفيذها بواسطة الكمبيوتر على التحديد في الرسم البياني للمعرفة ، باستخدام معالج واحد على الأقل ، وكيان واحد على الأقل والكيانات ذات الصلة المتعلقة بكيان واحد على الأقل من خلال الخصائص المعنية. تشتمل الطريقة التي يتم تنفيذها بواسطة الكمبيوتر ، لكل كيان من الكيانات ذات الصلة ، على تحديد ، باستخدام معالج واحد على الأقل ، درجة الكيان ذات الصلة المرتبطة بالممتلكات المعنية التي تتعلق بكيان واحد على الأقل والكيان المعني من الكيانات ذات الصلة. تشتمل الطريقة التي يتم تنفيذها بواسطة الكمبيوتر ، لكل خاصية معينة ، على إنشاء درجة خاصية ، باستخدام معالج واحد على الأقل ، بناءً على درجات الكيانات ذات الصلة المرتبطة بتلك الخاصية المعنية. تشتمل الطريقة التي يتم تنفيذها بواسطة الكمبيوتر على إنشاء ، باستخدام معالج واحد على الأقل ، والتسبب في تخزين بنية بيانات لخصائص قابلة للفرز بناءً على درجات الخصائص التي تم إنشاؤها ، حيث يتم استخدام بنية البيانات لتوفير نتائج بحث مرتبة استجابةً لاستعلام.
إذا سألت Google سؤالاً مثل "أين كان جورج واشنطن مساحًا؟" يوفر محرك البحث نتائج بحث توضح بالتفصيل المكان الذي عمل فيه مساح مراهق قبل دخوله الجيش.

مدينة تسمى واشنطن فيرجينيا (التي تطلق على نفسها اسم واشنطن الأولى) تخلد ذكرى الطفل البالغ من العمر 17 عامًا الذي قام بمسح المنطقة المحيطة خلال أيام شبابه.

عشرات الكيانات ذات الصلة
كيف تعمل عملية براءة الاختراع هذه؟ هذه هي الطريقة التي يعمل بها الرسم البياني المعرفي للمساعدة في إرجاع نتائج البحث ، باستخدام درجات الكيانات ذات الصلة:
في بعض التطبيقات ، يشتمل النظام على بنية بيانات تشتمل على رسم بياني للمعرفة ومعالج واحد أو أكثر. يتم تكوين واحد أو أكثر من المعالجات لأداء عمليات تشتمل على تحديد كيان واحد على الأقل والكيانات ذات الصلة في الرسم البياني للمعرفة في الرسم البياني للمعرفة ، والتي تتعلق بكيان واحد على الأقل من خلال الخصائص المعنية. يتم تكوين واحد أو أكثر من المعالجات لأداء العمليات التي تشمل ، لكل واحد من الكيانات ذات الصلة ، تحديد درجة الكيان ذات الصلة المرتبطة بالممتلكات المعنية التي تربط كيانًا واحدًا على الأقل والكيان المعني من الكيانات ذات الصلة. يتم تكوين واحد أو أكثر من المعالجات لأداء العمليات التي تشمل ، لكل خاصية معنية ، إنشاء درجة خاصية بناءً على درجات الكيانات ذات الصلة المرتبطة بتلك الخاصية المعنية. يتم تكوين واحد أو أكثر من المعالجات لأداء عمليات تشتمل على إنشاء بنية بيانات للخصائص القابلة للفرز والتسبب في تخزينها بناءً على درجات الخصائص التي تم إنشاؤها ، حيث يتم استخدام بنية البيانات لتوفير نتائج بحث تم فرزها استجابةً لاستعلام.
البراءة الممنوحة حديثًا هي
توفير نتائج البحث على أساس الخصائص التي تم فرزها
المخترعون: Yiming Li و Zhenyu Gu
الوكيل: Google LLC
براءات الاختراع الأمريكية 9875320
تم المنح: 23 يناير 2018
تاريخ التقديم: 8 فبراير 2016
الملخص
قد يكون الكيان مرتبطًا بالعديد من الكيانات ذات الصلة من خلال خاصية واحدة أو أكثر ، وقد يرتبط الكيان أيضًا بواحد أو أكثر من أنواع الكيانات. قد يتضمن نظام توفير النتائج التي تم فرزها تحديد الكيان والكيانات ذات الصلة والأنواع. قد يحدد النظام أيضًا درجات الكيانات ذات الصلة لكل كيان ذي صلة ، بالنسبة للكيان. بالنسبة لكل خاصية ، يتم تجميع درجات الكيانات ذات الصلة للكيانات ذات الصلة بالكيان من خلال تلك الخاصية لإنشاء درجة خاصية. ثم يتم فرز الخصائص بناءً على درجات ممتلكاتهم. قد يحدث الفرز للخصائص المرتبطة بنوع الكيان ، ويمكن تقديم نتائج البحث المصنفة كناتج لنوع واحد أو أكثر من أنواع الكيانات ذات الأهمية.
نتائج البحث والمقتطفات المميزة
لقد رأينا إجابات لبعض الاستعلامات التي توفر مزيجًا من نتائج البحث والمقتطفات المميزة كما كتبت عن ذلك في المنشور هل ستتزوج Google قاعدة معارفهم بمحرك البحث الخاص بهم؟ لم تعرض Google الكثير من التفضيلات للإجابة على استعلام بنتيجة بحث أو مقتطف مميز أو مقتطف منظم.
في بعض الأحيان قد تبدو الإجابة على استفسار حول فيلم ما مناسبة للغاية. يعجبني عند سؤال عن الجغرافيا مثل ما هي عاصمة XXXX؟ يظهر خريطة في مقتطف مميز ، لأن موقع العاصمة يمكن أن يكون معلومات مفيدة.
لا توجد قواعد معرفية محددة حول كيفية استخدام Google للرسم البياني المعرفي للإجابة على الأسئلة المتعلقة بالكيانات
لا توجد قواعد معرفية حتى الآن ، تخبرنا كيف تستخدم Google الرسم البياني للمعرفة. أقرب ما لدينا هو براءات الاختراع مثل هذه ، والتي تحتوي على قدر كبير من المعلومات الواردة فيها. كان هذا القسم غنيًا بالمفاهيم والتلميحات حول كيفية تعامل Google مع المعلومات المتعلقة بالخصائص:

قد يرتبط كيان معين بعدة أنواع ، وقد يكون مرتبطًا أيضًا بالعديد من الكيانات الأخرى بواسطة خاصية واحدة أو أكثر. كما هو مستخدم هنا ، الكيان هو شيء أو مفهوم فريد ، فريد ، محدد جيدًا ويمكن تمييزه. على سبيل المثال ، قد يكون الكيان شخصًا ، أو مكانًا ، أو عنصرًا ، أو فكرة ، أو موضوعًا ، أو مفهومًا مجردًا ، أو عنصرًا ملموسًا ، أو شيءًا آخر مناسبًا ، أو أي مزيج منها. في بعض عمليات التنفيذ ، تتضمن نتائج البحث نتائج في تحديد مراجع الكيانات. كما هو مستخدم هنا ، مرجع الكيان هو معرف ، على سبيل المثال ، نص أو معلومات أخرى تشير إلى كيان. على سبيل المثال ، قد يكون الكيان هو التجسيد المادي لجورج واشنطن ، بينما مرجع الكيان هو مفهوم مجرد يشير إلى جورج واشنطن. حيثما كان ذلك مناسبًا ، استنادًا إلى السياق ، سيتم فهم أن مصطلح الكيان كما هو مستخدم هنا قد يتوافق مع مرجع كيان ، وقد يتوافق مصطلح مرجع الكيان كما هو مستخدم هنا مع كيان. في بعض عمليات التنفيذ ، قد يحدد نظام البحث نوع الكيان المرتبط بمرجع الكيان. قد يكون نوع الكيان تصنيفًا أو تصنيفًا يستخدم لتحديد مراجع الكيان في بنية البيانات. على سبيل المثال ، قد يرتبط مرجع الكيان "جورج واشنطن" بأنواع الكيانات "رئيس الولايات المتحدة" و "شخص" و "ضابط عسكري". تصف الخصائص العلاقات بين الكيانات ، وبعبارة أخرى ، كيف يرتبط أحد الكيانات بكيان آخر. قد تعتمد أهم الخصائص المرتبطة بكيان ما على أنواعها ذات الأهمية. على سبيل المثال ، بالنسبة للكيان "Tom Hanks" ، قد يرغب المستخدم في أن تتضمن نتائج البحث أفلامه أو معلومات أخرى حول تمثيله. ومع ذلك ، بالنسبة للكيان "ألبرت أينشتاين" ، قد يرغب المستخدمون في أن تتضمن نتائج البحث نظرياته وأوراقه الفنية ومعلومات أخرى تتعلق بإسهاماته في الفيزياء. يمكن استخدام الأساليب التي تم الكشف عنها لتحديد السمات المهمة ، وبالتالي تقديم نتائج البحث التي من المحتمل أن يريدها المستخدم.
هل تريد معرفة المزيد من الأفكار حول كيفية استخدام قاعدة المعرفة في البحث الدلالي؟ قد يكون من المفيد لك قراءة هذه البراءة. ضع في اعتبارك أن Google تعتبر العديد من المواقع قواعد معرفية مفيدة تتجاوز ويكيبيديا وويكي بيانات. قد ينظر إلى مصادر مثل IMDB و Yahoo Finance كمعلومات مفيدة حول الحقائق.
لتوضيح هذه البراءة ، قررت أن أظهر جورج واشنطن كمساح. لا يعرف الكثير من الناس أنه فعل ذلك عندما كان مراهقًا! من المحتمل أيضًا أن يكون هذا المنصب قد لعب دورًا مهمًا في المناصب التي شغلها لاحقًا مثل القائد العسكري والسياسي. أثر المقطع التالي من براءة الاختراع حول أنواع الكيانات وفهم المعلومات ضمن رسم بياني في توضيح خياري:
يمكن تضمين العقدة التي تمثل البيانات التنظيمية في الرسم البياني للمعرفة. قد يشار إليها هنا كعقد نوع الكيان. كما هو مستخدم هنا ، قد تشير عقدة نوع الكيان إلى عقدة في الرسم البياني للمعرفة ، بينما قد يشير نوع الكيان إلى المفهوم الذي تمثله عقدة نوع الكيان. قد يكون نوع الكيان سمة مميزة للكيان. على سبيل المثال ، قد يتم توصيل عقدة نوع الكيان Y بعقدة كيان X بواسطة حافة أو رابط "Is A" ، تمت مناقشته بمزيد من التفصيل أدناه ، بحيث يمثل الرسم البياني المعلومات "الكيان X هو النوع Y." على سبيل المثال ، قد تكون عقدة الكيان "جورج واشنطن" متصلة بعقدة نوع الكيان "الرئيس". قد تكون عقدة الكيان متصلة بالعقد متعددة من نوع الكيان ، على سبيل المثال ، قد يتم أيضًا توصيل "جورج واشنطن" بعقدة نوع الكيان "الشخص" وبعقدة نوع الكيان "القائد العسكري".
أوصي بقراءة براءة الاختراع هذه ومحاولة فهمها. قد يكون من المفيد ربط كيفية قيام محرك البحث بالتقاط وإرجاع استعلامات حول الخصائص وجوانبها المختلفة. هذا بحث قائم على الدلالات أكثر بكثير ، مع الأخذ في الاعتبار المعلومات حول الأشياء وكيف يمكن أن تكون مرتبطة ببعضها البعض. لا يتعلق الأمر بمطابقة سلاسل النص من الاستعلامات إلى المستندات. بدلاً من ذلك ، التركيز على معرفة الكيانات وأنواعها وخصائصها ومدى ارتباطها بالكيانات الأخرى.
أود أن أشاهد فيلمًا عن شاب من واشنطن يقوم بمسح تلال فيرجينيا. سألت في جوجل ، "هل هناك فيلم عن جورج واشنطن كمساح؟" يبدو أن فيلمًا متحركًا بدأ بتغطية تلك الأيام: الجنرال جورج واشنطن
هل سنستخدم نتائج الكيانات ذات الصلة ونتائج الممتلكات عندما نقوم بإنشاء محتوى في المستقبل؟
هل ستكون نتائج الكيانات ذات الصلة ونتائج الممتلكات من الأمور المهمة التي يجب مراعاتها في المستقبل؟ توفر براءة الاختراع تلميحات حول كيفية استخدام محركات البحث لها على النحو التالي:
تتضمن الخطوة 606 معالجًا واحدًا أو أكثر يقوم بإنشاء درجة خاصية لكل خاصية بناءً على درجات الكيان ذات الصلة المرتبطة بالممتلكات. قد يتم دمج نتائج الكيانات ذات الصلة المرتبطة بكل خاصية معينة في هذا العقار. على سبيل المثال ، الرجوع إلى FIG. في الشكل 4 ، يمكن جمع نتائج الكيانات ذات الصلة للكيانات ذات الصلة "Forrest Gump" و "Big" و "Saving Private Ryan" لإعطاء مبلغ للخاصية "الأفلام التي تم تمثيلها" ، على سبيل المثال ، 0.8 + 0.8 + 0.8 = 2.4. في مثال آخر ، يمكن دمج درجات الكيان ذي الصلة كمجموع مرجح. يمكن استخدام أي مجموعة مناسبة من نتائج الكيانات ذات الصلة لإنشاء درجة الملكية. في بعض عمليات التنفيذ ، قد يكون نوع واحد أو أكثر نوعًا فرعيًا من نوع كيان آخر. على سبيل المثال ، الرجوع إلى هيكل البيانات 550 من FIG. 5 ، قد يكون النوع "الفاعل" نوعًا فرعيًا من نوع الكيان "الشخص" ، والذي يمكن الإشارة إليه على أنه نوع أصلي متعلق بالنوع الفرعي. في بعض هذه التطبيقات ، بالنسبة للنوع الأصل ، يمكن جمع درجة الخاصية لكل خاصية من كل نوع فرعي بنفس خاصية النوع الأصلي. على سبيل المثال ، الرجوع إلى هيكل البيانات 550 من FIG. 5 ، يتم تضمين الخاصية "الأفلام التي تم تمثيلها في" في النوعين "الممثل" و "الشخص" ، وبناءً على ذلك ، يمكن تجميع درجة الخاصية 9.0 لنوع الكيان "الفاعل" إلى درجة الخاصية 1.0 لنوع الكيان "الشخص". " قد يقوم واحد أو أكثر من المعالجات بإعادة تسوية النتائج أو قياسها أو وزنها أو تغييرها بطريقة أخرى داخل النوع الأصلي بعد دمج النوع الفرعي.
قد يكون ذلك أكثر منطقية بعد قراءة هذا. تستخدم Google الرسم البياني المعرفي للإجابة على استفسارات البحث مع نتائج البحث لمدة 3 سنوات على الأقل. لقد أصبحوا أكثر تعقيدًا حيال ذلك أيضًا. من المحتمل أن تستمر في التطور بينما تحاول Google القيام بأشياء جديدة ، وتجري تجارب أكثر في كيفية عرض نتائج البحث.
