การจัดลำดับเนื้อหาใหม่ตามคะแนนผู้เขียน (ได้รับ!)
เผยแพร่แล้ว: 2018-12-11โพลที่ฉันวิ่งบน Twitter เกี่ยวกับการจัดอันดับเนื้อหา
ฉันทำการสำรวจความคิดเห็นบน Twitter โดยถามว่าผู้เขียนต้นฉบับโพสต์บล็อกโพสต์ในไซต์ของตนเองแล้วโพสต์โพสต์เดียวกันในนิตยสารออนไลน์หรือไม่ เวอร์ชันใดจะมีอันดับสูงกว่า ฉันให้ตัวเลือกเว็บไซต์ของผู้เขียนต้นฉบับ นิตยสารออนไลน์ และผลลัพธ์ "ขึ้นอยู่กับ" โดยขอความคิดเห็นที่อธิบายสิ่งเหล่านั้น ฉันได้รับความคิดเห็นดีๆ เกี่ยวกับประเด็นต่างๆ มากมาย
โพลให้กลับมา 556 โหวตดังนี้:
ผู้เขียนเขียนโพสต์ในบล็อกของตนเอง และเผยแพร่ในนิตยสารออนไลน์ ซึ่ง Google จะจัดอันดับให้สูงขึ้น:
– Bill Slawski (@bill_slawski) วันที่ 6 ธันวาคม 2018
มีความคิดเห็นมากมายเกี่ยวกับสิ่งที่อาจทำให้โพสต์ของผู้เขียนหรือโพสต์ของนิตยสารออนไลน์มีอันดับสูงขึ้น เช่นเดียวกับความคิดเห็นนี้จาก John Alexander:
ขึ้นอยู่กับว่าไซต์ใดมีเนื้อหามากกว่า/ดีกว่า ในฐานะผู้อ่าน ฉันต้องการดูบทความนั้น แต่ยังค้นพบเนื้อหาที่เกี่ยวข้อง ดังนั้นหากผู้เขียนไม่ค่อยโพสต์หรือเพียงแค่โพสต์เนื้อหาสั้น ๆ ที่ไม่ละเอียดมาก ฉันอยากจะดูนิตยสาร Converse เป็นจริงหากผู้เขียนมีเนื้อหาที่ดีมากมาย
– จอห์นอเล็กซานเดอร์ (@CallMeLouzander) วันที่ 7 ธันวาคม 2018
หลายคนแนะนำว่าควรใช้ Canonicalization แบบข้ามโดเมนในอุดมคติเช่นกัน เช่น Jonah Stein:
ตามทฤษฎีแล้ว Google ควรจัดอันดับตัวอย่างแรก ในทางทฤษฎี ผู้เขียนควรใช้ rel=canonical เพื่อชี้ไปที่ตัวอย่างแรก ในทางปฏิบัติ หากนิตยสารออนไลน์เป็นหัวข้อและมีอำนาจมากกว่า นิตยสารนั้นก็จะอยู่ในอันดับนั้น เว้นแต่ลิงก์/สัญญาณโซเชียลชี้ไปที่บล็อกของผู้เขียน
– โจนาห์สไตน์ (@Jonahstein) วันที่ 6 ธันวาคม 2018
ในฐานะผู้เขียนที่อาจควบคุมไซต์ของตนเอง แต่ไม่ได้ควบคุมไซต์นิตยสารออนไลน์ดังกล่าว อาจเป็นเรื่องยากที่จะให้นิตยสารออนไลน์ชี้องค์ประกอบลิงก์ตามรูปแบบบัญญัติไปยังไซต์ของคุณ
ฉันให้ Vikki Fraser ยกตัวอย่างบทความของเธอที่มีเนื้อหาคล้ายกันมากในนิตยสารออนไลน์:
ตัวอย่างการใช้ moi: pic.twitter.com/D8LOiuDhPc
– Vikki Fraser (@vikkiorlando) วันที่ 7 ธันวาคม 2018
ฉันยังถูกถามโดย Cyrus Shepard ว่าจะใช้การเชื่อมโยงผกผันหรือไม่:
นอกเหนือจากข้อควรพิจารณา SEO อื่น ๆ (rel canonical, meta robots, ฯลฯ ) ฉันคิดว่าจะอธิบาย @dejanseo ของ Percolator/Link Inversion ดูเหมือนว่าจะเกิดขึ้นบ่อยครั้งกับบทความระดับกลาง https://t.co/4BNur4edRJ
– ไซรัส (@CyrusShepard) วันที่ 6 ธันวาคม 2018
คำตอบของฉันคือเท่าที่ฉันรู้ Google ไม่ใช้การผกผันของลิงก์ ฉันสำรวจการผกผันของลิงก์เมื่อฉันเขียนเกี่ยวกับ Google ที่พยายามระบุเวอร์ชันหลักของหน้าที่ซ้ำกัน
บางคน เช่น Martin McGarry รู้สึกว่าเนื้อหาที่เกี่ยวข้องเฉพาะที่อาจเกี่ยวข้องกับสถานที่แต่ละแห่งที่เผยแพร่นั้นขึ้นอยู่กับว่า:
มีตัวแปรมากเกินไป ฉันจะขอยกตัวอย่างตัวแปรหนึ่งตัวอย่าง คุณบล็อกเกี่ยวกับหัวข้อที่คุณไม่ได้ดำเนินการ แต่นิตยสารอุตสาหกรรมหยิบขึ้นมา ในบล็อกของคุณมีความเกี่ยวข้องเพียงเล็กน้อยหรือไม่มีเลย แต่ในนิตยสารอุตสาหกรรม เนื้อหาดังกล่าวอาจถือได้ว่าเป็นเนื้อหาที่เชื่อถือได้แม้ว่าจะซ้ำกันก็ตาม
– Martin McGarry (@seomcgarry) วันที่ 6 ธันวาคม 2018
หรือตามที่ Joshua Levenson ตั้งข้อสังเกตว่าอาจขึ้นอยู่กับเวอร์ชันที่เผยแพร่ก่อน:
ขึ้นอยู่กับสิ่งที่ได้รับการรวบรวมข้อมูลก่อน
— roghan josh levenson (@josh_levenson) วันที่ 6 ธันวาคม 2018
คำตอบจาก Peter McCarthy ดูเหมือนจะตรงกับประสบการณ์ของฉันเอง และการยื่นขอจดสิทธิบัตรของ Google ที่เพิ่งเผยแพร่ ซึ่งฉันได้รวมข้อมูลเกี่ยวกับในโพสต์นี้:
ฉันทำสิ่งนี้สักครู่แล้วดู เรื่องเล็ก ๆ น้อย ๆ แม้ว่า ในตอนแรกมันเปลี่ยนไปตามการจัดอันดับของนิตยสาร (อำนาจในระดับสูง) แต่เดิมของฉันมีอันดับเหนือกว่านิตยสารเมื่อเวลาผ่านไป ดูเหมือนว่าจะขึ้นอยู่กับว่าข้อความค้นหาเป็น "หัวข้อ" มากกว่า "ฉัน + หัวข้อ" หรือไม่
– Peter McCarthy (@petermccarthy) วันที่ 6 ธันวาคม 2018
การจัดลำดับผลลัพธ์สำหรับเอนทิตีตามคะแนนของผู้แต่ง
คำขอรับสิทธิบัตรเพิ่งออกมาเมื่อเร็ว ๆ นี้ซึ่งบอกเราเกี่ยวกับวิธีการจัดลำดับผลการค้นหาใหม่เมื่อเกี่ยวข้องกับผลลัพธ์ที่มีเนื้อหาคล้ายกันมากหรือเหมือนกันมาก แยกแยะผลลัพธ์เหล่านั้นโดยบอกว่าหนึ่งในนั้นมาจากเอนทิตีที่ไม่เป็นที่รู้จักในการผลิตเนื้อหาต้นฉบับ (ไม่ว่าจะคัดลอกหรือแจกจ่ายเนื้อหาต้นฉบับที่เขียนโดยหน่วยงานอื่น ๆ เนื้อหาอื่น ๆ เกี่ยวข้องกับเอนทิตีที่สองซึ่งเป็นที่รู้จักในการผลิต เนื้อหาต้นฉบับ
มีการอ้างอิงถึงสิทธิบัตรชั่วคราวในคำขอรับสิทธิบัตรนี้มีชื่อที่น่าสนใจมาก และตามสิทธิบัตรนี้ได้ถูกรวมเข้าไว้ในสิทธิบัตรอย่างครบถ้วนแล้ว สิทธิบัตรนั้นเป็นคำขอรับสิทธิบัตรชั่วคราวของสหรัฐอเมริกาหมายเลข 61/648,562 ที่ยื่นเมื่อวันที่ 17 พฤษภาคม 2555 ในหัวข้อ “ระบบและวิธีการกำหนดความเป็นไปได้ที่นิติบุคคลจะเป็นผู้เขียนเนื้อหาต้นฉบับ” (ลิงก์นี้เป็นการยื่นสิทธิบัตรของ WIPO )
การจัดอันดับที่สูงขึ้นสำหรับผู้แต่งต้นฉบับโดยไม่คำนึงถึงคะแนนความเกี่ยวข้อง
ดังนั้น คำขอจดสิทธิบัตรคะแนนผู้เขียนคนนี้บอกเราว่า:
…บางครั้งควรจัดอันดับผลการค้นหาที่สอดคล้องกับเอกสารที่เกี่ยวข้องกับหน่วยงานที่เป็นผู้เขียนเนื้อหาต้นฉบับที่สูงกว่าผลการค้นหาที่สอดคล้องกับเอกสารที่เกี่ยวข้องกับหน่วยงานที่ไม่ใช่ผู้เขียนเนื้อหาต้นฉบับแม้ว่าเอกสารที่เกี่ยวข้องกับหน่วยงาน ที่ไม่ใช่ผู้เขียนเนื้อหาต้นฉบับมีคะแนนความเกี่ยวข้องสูงกว่า
อัลกอริทึมที่อยู่เบื้องหลังสิทธิบัตรผู้แต่งฉบับแรกนี้เกี่ยวข้องกับ:
- (i) เนื้อหาที่ส่งโดยที่เนื้อหาที่ส่งถูกระบุว่าเผยแพร่โดยนิติบุคคล
- (ii) ลิงค์ไปยังตำแหน่งบนทรัพยากรที่โฮสต์เนื้อหาที่ส่งมา; การประเมินว่าเนื้อหาที่ส่งมานั้นถูกแสดงในดัชนีของเนื้อหาที่รู้จักหรือไม่ เพื่อพิจารณาว่าเนื้อหาที่ส่งนั้นเป็นเนื้อหาใหม่ที่สัมพันธ์กับเนื้อหาที่รู้จักหรือไม่
- เพื่อตอบสนองต่อการประเมิน ออกคำขอให้เครื่องมือค้นหารวบรวมข้อมูลและจัดทำดัชนีเนื้อหาที่ส่งซึ่งโฮสต์โดยทรัพยากรที่เกี่ยวข้องกับลิงก์เมื่อเนื้อหาที่ส่งเป็นเนื้อหาใหม่ที่สัมพันธ์กับเนื้อหาที่รู้จัก โดยที่คำขอไปยังเครื่องมือค้นหาเพื่อรวบรวมข้อมูลและ จัดทำดัชนีเนื้อหาที่ส่งซึ่งโฮสต์โดยทรัพยากรที่เกี่ยวข้องกับลิงก์นั้นออกให้ตอบสนองต่อการพิจารณาว่าเนื้อหาที่ส่งนั้นถือว่าไม่แสดงในดัชนีของเนื้อหาที่รู้จัก
สิทธิบัตรบอกเราว่าคำขอให้รวบรวมข้อมูลเนื้อหาใหม่จะส่งไปยังโปรแกรมรวบรวมข้อมูลที่มีลำดับความสำคัญสูงของเครื่องมือค้นหา ซึ่งเป็นครั้งแรกที่ฉันได้ยินว่ามีเนื้อหาดังกล่าวถูกกล่าวถึงในสิทธิบัตรของ Google

สิทธิบัตรยังหมายถึงการใช้ "โรคงูสวัด" เพื่อระบุเนื้อหาที่คล้ายคลึงหรือเหมือนกันอย่างมาก ข้อมูลเพิ่มเติมเกี่ยวกับโรคงูสวัดในบทความนี้: การระบุและการกรองเอกสารที่ใกล้เคียงกัน
ดูเหมือนว่าสิทธิบัตรผู้แต่งดั้งเดิมจะพิจารณาเนื้อหาอื่น ๆ ที่เขียนโดยนิติบุคคลที่อาจเกี่ยวข้องกับเนื้อหาเวอร์ชันใดเวอร์ชันหนึ่งนี้:
ในบางรูปลักษณ์ ก่อนที่จะออกคำขอไปยังเครื่องมือค้นหาเพื่อรวบรวมข้อมูลและจัดทำดัชนีเนื้อหาที่ส่งซึ่งโฮสต์โดยทรัพยากรที่เกี่ยวข้องกับลิงก์ วิธีการนี้รวมถึงการพิจารณาว่าเอนทิตีเป็นผู้เขียนเนื้อหาต้นฉบับตามการประเมินเนื้อหาที่ส่งมาอื่นที่ระบุ ตามที่เผยแพร่โดยนิติบุคคล โดยที่เนื้อหาอื่นที่ส่งมาซึ่งระบุว่าถูกเผยแพร่โดยนิติบุคคลนั้นรวมอยู่ในเนื้อหาที่ทราบ และคำขอให้เสิร์ชเอ็นจิ้นรวบรวมข้อมูลและจัดทำดัชนีเนื้อหาที่ส่งซึ่งโฮสต์โดยทรัพยากรที่เกี่ยวข้องกับลิงก์นั้นออกให้ตอบสนองต่อการพิจารณาว่าเนื้อหาที่ส่งนั้นถือว่าไม่แสดงในดัชนีของเนื้อหาที่รู้จักและการพิจารณาว่าเอนทิตีเป็น ผู้เขียนเนื้อหาต้นฉบับ
การขอจดสิทธิบัตรนี้ทำให้ดูเหมือนว่า Google กำลังติดตามบุคคลที่เป็นนักเขียนด้วยการรวบรวมสิ่งที่พวกเขาเขียน
สิทธิบัตรยังอธิบายถึงกระบวนการตรวจสอบและลงทะเบียนซึ่งผู้เขียนสามารถใช้เพื่อยืนยันว่าตนเองเป็นผู้เขียนเนื้อหาและเพื่อลงทะเบียนในฐานะผู้เขียน
นอกจากนี้ยังบอกเราด้วยว่าอาจเริ่มการประทับเวลาเนื้อหาด้วยตัวระบุสำหรับเอนทิตีที่เกี่ยวข้องกับเนื้อหา ซึ่งรวมถึงผู้เขียนเนื้อหาอย่างน้อยหนึ่งราย หรือผู้เผยแพร่เนื้อหาหนึ่งราย หรืออย่างน้อยหนึ่งเว็บไซต์
สิทธิบัตรยังบอกเราด้วยว่าอาจกำหนดว่าชิ้นส่วนของเนื้อหามีความคล้ายคลึงกันหรือไม่โดยการพิจารณาคะแนนของผู้แต่งสำหรับเนื้อหาแต่ละชิ้น คะแนนของผู้เขียนยังรวมถึงคะแนนการอ้างอิงสำหรับเอนทิตีที่เกี่ยวข้องซึ่งจะพิจารณาความถี่ที่เนื้อหาจากเอนทิตีนั้นถูกอ้างถึง
การจัดลำดับใหม่โดยอิงตามเอนทิตีที่เป็นผู้เขียนดั้งเดิมทำงานอย่างไร
…ผลการค้นหาแรกอยู่ในอันดับที่สูงกว่าผลการค้นหาที่สอง พิจารณาว่าเอกสารฉบับแรกและเอกสารฉบับที่สองเป็นไปตามเกณฑ์ความคล้ายคลึงกัน พิจารณาว่าเอนทิตีที่สองตรงตามความแตกต่างของการประพันธ์ที่กำหนดไว้ล่วงหน้าเกี่ยวกับเอนทิตีแรก และตอบสนองต่อการพิจารณาว่าเอนทิตีที่สองตรงตามความแตกต่างของผู้แต่งที่กำหนดไว้ล่วงหน้าเกี่ยวกับเอนทิตีแรก สลับผลการค้นหาที่สองและผลการค้นหาแรกในผลการค้นหาที่มีการจัดอันดับเพื่อสร้างผลการค้นหาที่มีการจัดอันดับใหม่
สามารถดูคำขอจดสิทธิบัตรคะแนนผู้เขียนได้ที่:
(US20180341656) ระบบและวิธีการจัดอันดับผลการค้นหาอันดับใหม่
ผู้ประดิษฐ์: Chung Tin Kwok, Lei Zhong และ Zhihuan Qiu
เลขที่ตีพิมพ์: 20180341656
วันที่ตีพิมพ์: 29 พฤศจิกายน 2018
ผู้สมัคร: GOOGLE LLC
เชิงนามธรรม:
ระบบ สื่อเก็บข้อมูลที่สามารถอ่านได้ด้วยคอมพิวเตอร์ซึ่งจัดเก็บโปรแกรมอย่างน้อยหนึ่งโปรแกรม และวิธีการที่ใช้คอมพิวเตอร์เพื่อจัดอันดับผลการค้นหาที่มีการจัดอันดับใหม่จะแสดงขึ้น ผลการค้นหาอันดับที่ตรงกับคำค้นหาจะได้รับ โดยที่ผลการค้นหาอันดับรวมผลการค้นหาแรกที่สอดคล้องกับเอกสารแรกที่เกี่ยวข้องกับเอนทิตีแรกและผลการค้นหาที่สองที่สอดคล้องกับเอกสารที่สองที่เกี่ยวข้องกับเอนทิตีที่สอง และที่แรก ผลการค้นหาอยู่ในอันดับที่สูงกว่าผลการค้นหาที่สอง เอกสารแรกและเอกสารที่สองได้รับการพิจารณาให้เป็นไปตามเกณฑ์ความคล้ายคลึงกัน เอนทิตีที่สองถูกกำหนดให้เป็นไปตามความแตกต่างของการประพันธ์ที่กำหนดไว้ล่วงหน้าเกี่ยวกับเอนทิตีแรก ตอบสนองต่อการพิจารณาว่าเอนทิตีที่สองตรงตามความแตกต่างของผู้แต่งที่กำหนดไว้ล่วงหน้าซึ่งเกี่ยวข้องกับเอนทิตีแรก ผลการค้นหาที่สอง และผลการค้นหาแรกในผลการค้นหาที่มีการจัดอันดับจะถูกสลับเพื่อสร้างผลการค้นหาที่มีการจัดอันดับใหม่
ข้อสรุปบางประการเกี่ยวกับคะแนนผู้แต่ง
สิทธิบัตรให้รายละเอียดมากมายที่คุ้มค่าที่จะใช้เวลาดูหากต้องการทราบข้อมูลเพิ่มเติม ตัวอย่างเช่น ผู้เขียนเนื้อหาได้รับการสะกดอย่างละเอียดถี่ถ้วนดังนี้:
ตัวอย่างเช่น หน่วยงานที่เกี่ยวข้องอาจรวมถึงผู้เขียนแต่ละรายหรือหนึ่งในผู้เขียนร่วมจำนวนมากสำหรับ (หรือผู้ร่วมให้ข้อมูล) เนื้อหา ในบางรูปลักษณ์ เอนทิตีคือองค์กรธุรกิจที่ผลิตเนื้อหาที่เป็นต้นฉบับหรือเป็นต้นฉบับเพียงบางส่วน ในบางรูปลักษณ์ เอนทิตีคือองค์กรข่าว ในการใช้งานบางอย่าง เอนทิตีรวมผู้เผยแพร่เนื้อหาอย่างน้อยหนึ่งราย ตัวอย่างเช่น หน่วยงานที่เกี่ยวข้องอาจเป็นผู้จัดพิมพ์หนังสือ ผู้จัดพิมพ์วารสาร ผู้จัดพิมพ์เนื้อหาออนไลน์! และ/หรือสิ่งที่คล้ายกัน ในการใช้งานบางอย่าง หน่วยงานที่เกี่ยวข้องคือผู้เขียนเนื้อหาบนเว็บไซต์อย่างน้อยหนึ่งเว็บไซต์ ตัวอย่างเช่น หน่วยงานที่เกี่ยวข้องอาจส่งเนื้อหาต้นฉบับไปยังเว็บไซต์บล็อก เว็บไซต์สำหรับผู้จัดพิมพ์ (เช่น ข่าว นิตยสาร ฯลฯ) และ/หรือสิ่งที่คล้ายกัน โปรดทราบว่าเว็บไซต์ดังกล่าวอาจมีส่วนย่อยของเนื้อหาภายในโดเมนเฉพาะ ตัวอย่างเช่น เว็บไซต์อาจมีเนื้อหาในโดเมนเฉพาะ (เช่น โดเมนระดับบนสุด example.com) ในอีกตัวอย่างหนึ่ง เว็บไซต์มีเนื้อหาในโดเมนย่อยของโดเมนเฉพาะ (เช่น โดเมนย่อย biogs.example.com) ในอีกตัวอย่างหนึ่ง เว็บไซต์มีเนื้อหาในไดเรกทอรีของโดเมน (เช่น www.example.com/johndoe/) ในบางรูปลักษณ์ เว็บไซต์มีเนื้อหาในโดเมนจำนวนมาก (เช่น เครือข่ายของเว็บไซต์ในเครือ) โดเมนย่อยหลายโดเมนอย่างน้อยหนึ่งโดเมน และ/หรือไดเรกทอรีย่อยจำนวนมากของโดเมนอย่างน้อยหนึ่งโดเมน ในบางรูปลักษณ์ เนื้อหาที่สร้างโดยเอนทิตีคือโพสต์ในบล็อก โพสต์ในโซเชียลเน็ตเวิร์ก หรือโพสต์ในเธรดการสนทนาออนไลน์ ในบางรูปลักษณ์ เนื้อหาที่สร้างโดยเอนทิตีคือเนื้อหาใดๆ ที่โพสต์ไปยังตำแหน่งที่เข้าถึงได้บนอินเทอร์เน็ต เพื่อให้แน่ใจได้โดยทันทีว่าเอนทิตีโพสต์เนื้อหานั้น
สิทธิบัตรทำให้ฉันนึกถึงโปรแกรมการประพันธ์ของ Google ภายใต้ Google+ ซึ่งคุณเชื่อมโยงกับสถานที่ที่คุณเผยแพร่ในฐานะผู้เขียนด้วย rel=”me” ในลิงก์ของคุณไปยังไซต์นั้น
การสร้างคะแนนผู้เขียนที่มีคะแนนอ้างอิงที่ระบุความถี่ที่ผู้แต่งอาจถูกอ้างถึงในที่อื่นบนเว็บเป็นสิ่งที่น่าสนใจ แนวคิดในการใช้การอ้างอิงเป็นวิธีการให้คะแนนผู้เขียนทำให้ฉันนึกถึงการใช้การอ้างอิงใน PageRank ตามที่อธิบายไว้ใน The PageRank Citation Ranking: Bringing Order to the Web ดังที่บทคัดย่อจากกระดาษเล่มนั้นบอกเราว่า:
บทความนี้อธิบาย PageRank ซึ่งเป็นวิธีการให้คะแนนหน้าเว็บอย่างเป็นกลางและเชิงกลไก โดยวัดความสนใจและความสนใจของมนุษย์ที่มีต่อหน้าเว็บเหล่านั้นอย่างมีประสิทธิภาพ
เพิ่มเมื่อวันที่ 10 ธันวาคม 2019 – สิทธิบัตรนี้ได้รับในวันนี้ที่ระบบและวิธีการจัดลำดับผลการค้นหาใหม่ โดยจะทำหน้าที่สลับระหว่างผลลัพธ์สองอันดับแรกในชุดผลการค้นหาโดยพิจารณาจากคะแนนผู้เขียนต้นฉบับสำหรับผู้เขียนบทความแรกและคะแนนผู้เขียนที่สูงขึ้นสำหรับผู้แต่งบทความที่สอง
