إعادة تصنيف المحتوى بناءً على درجة المؤلف (ممنوحة!)

نشرت: 2018-12-11

أجري استطلاع رأي على Twitter حول ترتيب المحتوى

أجريت استطلاعًا على Twitter ، وسألت عما إذا كان المؤلف الأصلي قد نشر منشور مدونة على موقعه الخاص ، ثم نشر نفس المنشور على مجلة عبر الإنترنت ، فما هو الإصدار الذي سينتهي به الأمر في مرتبة أعلى؟ قدمت اختيارات من موقع المؤلف الأصلي ، والمجلة الإلكترونية ، ونتائج "الأمر يعتمد" ، وطلبت تعليقات تشرح ذلك. تلقيت بعض التعليقات الرائعة التي تغطي الكثير من الأرضية.

حصل الاستطلاع على 556 صوتا على النحو التالي:

كان هناك الكثير من الآراء حول ما قد يجعل منشور المؤلف أو منشور المجلة الإلكترونية أعلى مرتبة. ، مثل هذا من جون ألكساندر:

اقترح العديد من الأشخاص أنه يجب استخدام تحديد عنوان URL عبر المجال بشكل مثالي أيضًا ، مثل جونا شتاين:

بصفتك مؤلفًا قد يتحكم في موقعه الخاص ، ولكنه لا يتحكم في مثل هذا الموقع لمجلة عبر الإنترنت ، فقد يكون من الصعب جعل المجلة عبر الإنترنت تشير إلى عنصر ارتباط أساسي إلى موقعك.

لقد قدمت لي Vikki Fraser مثالاً على مقالتها التي تفوقت على مجلة على الإنترنت لمحتوى مشابه جدًا:

سألني Cyrus Shepard أيضًا عما إذا كان سيتم تطبيق انعكاس الرابط أم لا:

كان إجابتي أنه على حد علمي ، فإن Google لا تطبق عكس الارتباط. لقد قمت باستكشاف Link Inversion عندما كتبت عن محاولة Google تحديد الإصدار الأساسي من الصفحات المكررة.

شعر بعض الأشخاص ، مثل Martin McGarry ، أن الأمر يعتمد على مدى ملاءمة المحتوى الموضوعي لكل من الأماكن المنشورة:

أو كما أشار Joshua Levenson أنه قد يعتمد على النسخة التي تم نشرها أولاً:

يبدو أن إجابة Peter McCarthy تتطابق مع تجربتي الخاصة ، وتطبيق براءة اختراع Google المنشور مؤخرًا ، والذي أدرج معلومات عنه في هذا المنشور:

إعادة تصنيف النتائج لكيان بناءً على درجة المؤلف

صدر مؤخرًا طلب براءة اختراع يخبرنا عن طريقة إعادة التصنيف لنتائج البحث عندما تتضمن نتائج ذات محتوى متشابه جدًا أو نفس المحتوى إلى حد كبير. إنه يميز تلك النتائج بالقول إن إحداها من كيان لا يُعرف عنه إنتاج محتوى أصلي (إما أن ينسخ أو يعيد توزيع المحتوى الأصلي الذي ألفته كيانات أخرى. ويرتبط الجزء الآخر من المحتوى بكيان ثانٍ معروف بإنتاجه المحتوى الأصلي.

هناك إشارة إلى براءة اختراع مؤقتة في طلب البراءة هذا والتي لها عنوان مثير للاهتمام للغاية ، ووفقًا لهذه البراءة تم دمجها في مجملها. هذه البراءة هي طلب براءات الاختراع الأمريكية المؤقتة رقم 61 / 648.562 المودع في 17 مايو 2012 ، بعنوان "أنظمة وأساليب تحديد احتمال أن يكون الكيان مؤلفًا لمحتوى أصلي" (هذا الرابط هو إيداع الويبو لبراءة الاختراع. )

تصنيفات أعلى للمؤلف الأصلي بغض النظر عن درجات الصلة

لذلك ، يخبرنا طلب براءة الاختراع هذا المؤلف أن:

... في بعض الأحيان يكون من المرغوب فيه ترتيب نتائج البحث التي تتوافق مع المستندات المرتبطة بالكيانات التي تكون مؤلفي المحتوى الأصلي أعلى من نتائج البحث المقابلة للمستندات المرتبطة بالكيانات التي ليست مؤلفي المحتوى الأصلي على الرغم من أن المستندات المرتبطة بالكيانات أولئك الذين ليسوا مؤلفي المحتوى الأصلي لديهم درجات صلة أعلى.

تتضمن الخوارزمية الكامنة وراء براءة اختراع المؤلف الأصلية ما يلي:

  • (ط) المحتوى المقدم ، حيث يتم تحديد المحتوى المقدم على أنه تم نشره بواسطة جهة ما
  • (2) رابط إلى الموقع الموجود على مورد يستضيف المحتوى المقدم ؛ تقييم ما إذا كان المحتوى المقدم ممثلًا في فهرس للمحتوى المعروف لتحديد ما إذا كان المحتوى المقدم جديدًا بالنسبة إلى المحتوى المعروف
  • استجابة للتقييم ، إصدار طلب إلى محرك بحث للزحف إلى المحتوى المقدم الذي يستضيفه المورد المرتبط بالرابط وفهرسته عندما يكون المحتوى المقدم جديدًا بالنسبة إلى المحتوى المعروف ، حيث يكون الطلب إلى محرك البحث للزحف و فهرس المحتوى المقدم الذي يستضيفه المورد المرتبط بالرابط يتم إصداره استجابة لتحديد أن المحتوى المقدم يعتبر غير ممثل في فهرس المحتوى المعروف

تخبرنا براءة الاختراع أن طلب الزحف إلى المحتوى الجديد سيذهب إلى برنامج تتبع الارتباطات ذي الأولوية العالية لمحرك البحث ، وهي المرة الأولى التي أسمع فيها أحد هؤلاء الذين تم ذكرهم في براءة اختراع Google.

تشير براءة الاختراع أيضًا إلى استخدام "القوباء المنطقية" لتحديد محتوى مشابه أو متماثل إلى حد كبير. المزيد حول القوباء المنطقية في هذه الورقة: تحديد المستندات شبه المكررة وتصفيتها

يبدو أن براءة الاختراع الأصلية للمؤلف ستنظر في المحتوى الآخر الذي ألفه الكيان والذي قد يكون مرتبطًا بأحد إصدارات هذا المحتوى:

في بعض النماذج ، قبل إصدار الطلب إلى محرك البحث لتتبع ارتباطات وفهرسة المحتوى المقدم الذي يستضيفه المورد المرتبط بالرابط ، تتضمن الطريقة تحديد أن الكيان هو مؤلف المحتوى الأصلي بناءً على تقييم المحتوى المقدم الآخر المحدد كما تم نشره بواسطة الكيان ، حيث يتم تضمين المحتوى المقدم الآخر المحدد على أنه تم نشره بواسطة الكيان في المحتوى المعروف ؛ والطلب الموجه إلى محرك البحث للزحف إلى المحتوى المقدم الذي يستضيفه المورد المرتبط بالرابط وفهرسته يتم إصداره استجابةً لتحديد أن المحتوى المقدم يعتبر غير ممثل في فهرس المحتوى المعروف وتحديد أن الكيان هو مؤلف المحتوى الأصلي.

يجعل طلب براءة الاختراع هذا يبدو وكأن Google تتعقب الكيانات التي هي مؤلفين من خلال جمع القوباء المنطقية للأشياء التي كتبها.

تصف براءة الاختراع أيضًا عملية التحقق والتسجيل التي يمكن للمؤلف استخدامها للتحقق من أنه مؤلف المحتوى وللتسجيل كمؤلف.

يخبرنا أيضًا أنه قد يبدأ في وضع طابع زمني للمحتوى بمعرف للكيان المرتبط بالمحتوى ، بما في ذلك مؤلف واحد على الأقل للمحتوى أو ناشر واحد للمحتوى ، أو موقع ويب واحد على الأقل.

تخبرنا براءة الاختراع أيضًا أنها قد تحدد ما إذا كانت أجزاء المحتوى متشابهة من خلال تحديد درجات المؤلف لكل جزء من أجزاء المحتوى. قد تتضمن درجة المؤلف أيضًا درجة الاقتباس للكيان المعني الذي ينظر في معدل تكرار الاقتباس من هذا الكيان.

كيف تعمل إعادة التصنيف على أساس كون الكيان مؤلفًا أصليًا

… نتيجة البحث الأولى مرتبة أعلى من نتيجة البحث الثانية ؛ تحديد أن الوثيقة الأولى والوثيقة الثانية تستوفي معيار التشابه ؛ تحديد أن الكيان الثاني يفي بفارق التأليف المحدد مسبقًا فيما يتعلق بالكيان الأول ؛ ويستجيب لتحديد أن الكيان الثاني يفي بفارق التأليف المحدد مسبقًا فيما يتعلق بالكيان الأول ، وقم بتبديل نتيجة البحث الثانية وأول نتيجة بحث في نتائج البحث المصنفة لإنتاج نتائج بحث مُعاد تصنيفها.

يمكن العثور على طلب براءة اختراع المؤلف في:

(US20180341656) أنظمة وطرق إعادة ترتيب نتائج البحث المصنفة
المخترعون: Chung Tin Kwok و Lei Zhong و Zhihuan Qiu
رقم المنشور: 20180341656
تاريخ النشر: 29 نوفمبر 2018
المتقدمون: GOOGLE LLC

الملخص:

يتم تقديم نظام ووسيط تخزين يمكن قراءته بواسطة الكمبيوتر يخزن برنامجًا واحدًا على الأقل وطريقة يتم تنفيذها بواسطة الكمبيوتر لإعادة ترتيب نتائج البحث المصنفة. يتم الحصول على نتائج البحث المصنفة التي ترضي استعلام البحث ، حيث تتضمن نتائج البحث المرتبة نتيجة البحث الأولى المقابلة للمستند الأول المرتبط بالكيان الأول ونتيجة البحث الثانية المقابلة للمستند الثاني المرتبط بكيان ثانٍ ، وحيث تكون الأولى يتم ترتيب نتيجة البحث أعلى من نتيجة البحث الثانية. تم تحديد المستند الأول والوثيقة الثانية لاستيفاء معيار التشابه. تم تحديد الكيان الثاني لتلبية فارق التأليف المحدد مسبقًا فيما يتعلق بالكيان الأول. استجابةً لتحديد أن الكيان الثاني يفي باختلاف التأليف المحدد مسبقًا فيما يتعلق بالكيان الأول ، يتم تبديل نتيجة البحث الثانية ونتائج البحث الأولى في نتائج البحث المرتبة لإنتاج نتائج بحث مُعاد تصنيفها.

بعض الاستنتاجات حول درجة المؤلف

توفر براءة الاختراع العديد من التفاصيل التي تستحق قضاء الوقت في البحث عنها إذا كنت تريد معرفة المزيد. على سبيل المثال ، يتم توضيح مؤلف المحتوى بالتفصيل الدقيق على النحو التالي:

على سبيل المثال ، قد يشمل الكيان المعني مؤلفًا فرديًا أو واحدًا من مجموعة من المؤلفين المشاركين (أو المساهمين في) المحتوى. في بعض النماذج ، الكيان عبارة عن منظمة أعمال تنتج محتوى أصليًا أو جزئيًا. في بعض النماذج ، يعتبر الكيان مؤسسة إخبارية. في بعض عمليات التنفيذ ، يتضمن الكيان ناشرًا واحدًا على الأقل للمحتوى. على سبيل المثال ، قد يكون الكيان المعني ناشرًا للكتب أو ناشرًا للدوريات أو ناشرًا للمحتوى عبر الإنترنت! و / أو ما شابه. في بعض عمليات التنفيذ ، يكون الكيان المعني هو مؤلف المحتوى الموجود على موقع ويب واحد على الأقل. على سبيل المثال ، قد يساهم الكيان المعني بمحتوى أصلي إلى موقع ويب خاص بالتدوين أو موقع ويب للناشر (على سبيل المثال ، الأخبار والمجلات وما إلى ذلك) و / أو ما شابه ذلك. لاحظ أن مثل هذا الموقع قد يتضمن مجموعة فرعية من المحتوى داخل مجال معين. على سبيل المثال ، قد يتضمن موقع الويب محتوى في مجال معين (على سبيل المثال ، نطاق المستوى الأعلى example.com). في مثال آخر ، يتضمن موقع الويب محتوى في مجال فرعي لمجال معين (على سبيل المثال ، مجال فرعي biogs.example.com). في مثال آخر ، يتضمن موقع الويب محتوى في دليل المجال (على سبيل المثال ، www.example.com/johndoe/). في بعض النماذج ، يشتمل موقع الويب على محتوى في مجموعة متعددة من المجالات (على سبيل المثال ، شبكة من مواقع الويب التابعة) ، ومجموعة من المجالات الفرعية لنطاق واحد على الأقل ، و / أو مجموعة من الأدلة الفرعية لنطاق واحد على الأقل. في بعض النماذج ، يكون المحتوى الذي تم تأليفه بواسطة أحد الكيانات عبارة عن منشور مدونة أو منشور على شبكة اجتماعية أو منشور في سلسلة مناقشة عبر الإنترنت. في بعض النماذج ، يكون المحتوى الذي تم تأليفه بواسطة الكيان هو أي محتوى تم نشره في موقع يمكن الوصول إليه على الإنترنت بحيث يمكن التأكد بسهولة من أن الكيان قد قام بنشر المحتوى.

ذكّرتني براءة الاختراع ببرنامج التأليف من Google ضمن Google+ ، حيث ربطت بالمكان الذي نشرته كمؤلف مع rel = ”me” في رابطك إلى ذلك الموقع.

يعد إنشاء درجة مؤلف تتضمن درجة اقتباس تحدد عدد المرات التي يمكن فيها الاستشهاد بمؤلف في مكان آخر على الويب أمرًا مثيرًا للاهتمام. تذكرني فكرة استخدام الاقتباسات كطريقة لحساب المؤلفين باستخدام الاقتباسات في PageRank كما هو موضح في تصنيف PageRank Citation Ranking: Bringing Order to the Web. كما يخبرنا الملخص من تلك الورقة:

تصف هذه الورقة نظام PageRank ، وهو طريقة لتصنيف صفحات الويب بشكل موضوعي وآلي ، وقياس اهتمام الإنسان والاهتمام الموجه لها بشكل فعال.

تمت الإضافة في 10 ديسمبر 2019 - تم منح براءة الاختراع هذه اليوم في أنظمة وطرق إعادة ترتيب نتائج البحث المرتبة. وهي تعمل على التبديل بين أعلى نتيجتين في مجموعة من نتائج البحث بناءً على درجة المؤلف الأصلي لمؤلف المقالة الأولى ودرجة أعلى للمؤلف لمؤلف المقالة الثانية.