อัปเดตการจัดทำดัชนีตามวลีของ Google อัปเดตแล้ว

เผยแพร่แล้ว: 2018-06-06

Google ได้อัปเดตหนึ่งในสิทธิบัตรที่สำคัญที่สุดของพวกเขาในวันนี้

การจัดทำดัชนีตามวลีครอบคลุมอะไรบ้าง

เมื่อหน้าครอบคลุมหัวข้อเช่น "ประธานาธิบดีแห่งสหรัฐอเมริกา" เป็นไปได้มากที่จะรวมวลีที่มีความหมายในหน้านั้นซึ่งอาจกล่าวได้เพื่อคาดเดาว่าหน้านั้นเกี่ยวกับอะไร เช่น "ทำเนียบขาว" หรือ "สวนกุหลาบ" ” หรือ “งานแถลงข่าว” หรือ “เลขาธิการแห่งรัฐ” หากคุณเห็นวลีเช่นนั้นบนหน้าเว็บ อาจเป็นคำใบ้เกี่ยวกับหัวข้อของหน้านั้น ซึ่งอธิบายวิธีการทำงานของการจัดทำดัชนีแบบวลีของ Google เป็นแนวทางที่อาจกล่าวได้ว่าใช้ธีมเชิงความหมายเพื่อแสดงความหมายของหน้าต่างๆ ทำได้โดยการทำความเข้าใจและจัดทำดัชนีวลีที่มีความหมายซึ่งเกิดขึ้นพร้อมกันบนหน้าเว็บที่มีอันดับสูงสำหรับคำหนึ่งๆ

เพียงเพราะ Google มีสิทธิบัตร…อัปเดตการจัดทำดัชนีตามวลี

Matt Cutts เผยแพร่วิดีโอนี้เมื่อประมาณ 5 ปีที่แล้ว และเขาบอกเราว่าเพียงเพราะ Google มีสิทธิบัตรในบางสิ่ง ไม่ได้หมายความว่าพวกเขาใช้มัน

แต่เมื่อ Google ดำเนินการปรับปรุงสิทธิบัตร พวกเขาอาจใช้มัน

ฉันดูสิทธิบัตรจำนวนมากจาก Google และมีข้อโต้แย้งบางอย่างที่สามารถบอกเราได้ว่าพวกเขาอาจใช้สิทธิบัตรที่ปรับปรุงการจัดทำดัชนีแบบวลีที่ได้รับในปัจจุบัน

1. มีสิทธิบัตรที่เกี่ยวข้องมากกว่า 20 รายการซึ่งมอบให้กับ Anna Patterson และมอบหมายให้ Google เกี่ยวกับกระบวนการที่เกี่ยวข้องกับการจัดทำดัชนีแบบวลี

2. สิทธิบัตรดูเหมือนจะมีความสำคัญ และครั้งหนึ่งฉันเคยเรียกว่าหนึ่งใน 10 สิทธิบัตร SEO ที่สำคัญที่สุดตลอดกาล:

10 สิทธิบัตร SEO ที่สำคัญที่สุด ตอนที่ 5 – การสร้างดัชนีแบบวลี

3. กระบวนการเบื้องหลังสิทธิบัตรเกิดขึ้นครั้งแรกเมื่อยื่นฟ้องที่สำนักงานสิทธิบัตรเมื่อปี 2547 และพวกเขาได้เพิ่มกระบวนการด้วยสิทธิบัตรอย่างน้อย 20 ฉบับที่เพิ่มคุณสมบัติต่างๆ เช่น การต่อสู้สแปมและการสร้างตัวอย่างข้อมูล และ บอกรายละเอียดเกี่ยวกับแนวโน้มที่จะนำไปใช้กับดัชนีของ Google ครั้งแรกที่ฉันเขียนเกี่ยวกับสิทธิบัตรนั้นในปี 2549 ในโพสต์ Move over PageRank: Google กำลังมองหาวลี?

4. สิทธิบัตรต่อเนื่องคือเวอร์ชันของสิทธิบัตรที่ไม่มีการเปลี่ยนแปลงคำอธิบายของสิทธิบัตร แต่การอ้างสิทธิ์ในสิทธิบัตรได้รับการปรับปรุงแล้ว เพื่อสะท้อนถึงการเปลี่ยนแปลงในกระบวนการที่สิทธิบัตรมุ่งเป้าไปที่การปกป้อง วันที่ยื่นสิทธิบัตรยังคงเป็นวันที่ยื่นฟ้องเดิม แต่ความสามารถในการยกเว้นผู้อื่นจากการใช้กระบวนการเบื้องหลังสิทธิบัตรจะขึ้นอยู่กับการเรียกร้องใหม่ การอ้างสิทธิ์ในสิทธิบัตรมีการเปลี่ยนแปลงอย่างมีนัยสำคัญจากปี 2547 เป็นปี 2561 เหตุผลสำคัญประการหนึ่งในการเปลี่ยนแปลงการอ้างสิทธิ์เหล่านั้นคือการสะท้อนถึงกระบวนการที่เกิดขึ้นจริง (หากมีการใช้สิทธิบัตร) เบื้องหลังสิทธิบัตร

เป็นเรื่องที่ควรค่าแก่การเปรียบเทียบการอ้างสิทธิ์สามรายการแรกจากต้นฉบับกับสิทธิบัตรที่ได้รับในปัจจุบัน นี่คือการอ้างสิทธิ์สามรายการแรกจากต้นฉบับ:

1. วิธีการเลือกเอกสารในชุดเอกสารเพื่อตอบแบบสอบถาม วิธีการประกอบด้วย : รับแบบสอบถาม; การระบุวลีจำนวนมากในแบบสอบถาม โดยที่อย่างน้อยหนึ่งวลีเป็นวลีคำหลายคำ ระบุส่วนขยายวลีของวลีที่ระบุอย่างน้อยหนึ่งวลี และเลือกเอกสารจากคอลเลกชันเอกสารที่มีหนึ่งวลีจากชุด รวมถึงวลีในคิวรีและส่วนขยายวลี

2. วิธีการอ้างสิทธิ์ 1 ซึ่งในการเลือกเอกสารประกอบด้วย: รวมรายการโพสต์ของวลีที่ระบุและรายการโพสต์ของส่วนขยายวลีของวลีที่ระบุเพื่อสร้างรายการผ่านรายการแบบรวม และการเลือกเอกสารที่ปรากฏในรายการผ่านรายการแบบรวมและ รายการโพสต์ของวลีที่ระบุอื่น ๆ

3. วิธีการเลือกเอกสารในชุดเอกสารเพื่อตอบแบบสอบถาม วิธีการประกอบด้วย : รับแบบสอบถาม; ระบุวลีที่ไม่สมบูรณ์ในแบบสอบถาม แทนที่วลีที่ไม่สมบูรณ์ด้วยส่วนขยายวลี และเลือกเอกสารจากคอลเล็กชันเอกสารที่มีส่วนขยายวลี

สิ่งที่ดูเหมือนจะแตกต่างจากการอ้างสิทธิ์แบบเก่ากับคำกล่าวอ้างที่ใหม่กว่าคือพวกเขาให้ข้อมูลเพิ่มเติมว่าการจัดทำดัชนีแบบวลีสามารถจัดอันดับหน้าเว็บได้อย่างไร

สิ่งที่อ้างสิทธิ์คือ:

1. วิธีการที่ใช้คอมพิวเตอร์ประกอบด้วย: การได้รับจากดัชนีแบบวลีสำหรับเครื่องมือค้นหาทางอินเทอร์เน็ต รายการเอกสารจากชุดเอกสารที่มีอยู่ทางอินเทอร์เน็ตที่มีวลีแรก วลีแรกที่เกี่ยวข้องกับข้อความค้นหา ; สำหรับแต่ละเอกสารในรายการ: กำหนดโดยใช้ข้อมูลวลีที่เกี่ยวข้องที่เก็บไว้ในดัชนีสำหรับเอกสารแต่ละรายการในรายการเอกสารว่าเอกสารนั้นมีวลีที่เกี่ยวข้องตั้งแต่หนึ่งวลีขึ้นไปโดยที่แต่ละวลีที่เกี่ยวข้องมีการเกิดขึ้นร่วมกันจริง อัตราของวลีที่เกี่ยวข้องและวลีแรกในชุดเอกสารที่เกินอัตราการเกิดขึ้นร่วมที่คาดไว้ของวลีที่เกี่ยวข้องและวลีแรกในคอลเลกชันเอกสาร จัดอันดับเอกสารในรายการตามจำนวนวลีที่เกี่ยวข้องซึ่งกำหนดไว้สำหรับแต่ละเอกสาร เพื่อให้เอกสารที่มีวลีที่เกี่ยวข้องกันมากกว่ามีอันดับสูงกว่าเอกสารที่มีวลีที่เกี่ยวข้องน้อยกว่า และเลือกเอกสารที่มีอันดับสูงสุดอย่างน้อยบางรายการเพื่อรวมไว้ในผลลัพธ์ของแบบสอบถาม

2. วิธีการอ้างสิทธิ์ 1 ซึ่งกำหนดว่าเอกสารมีวลีที่เกี่ยวข้องตั้งแต่หนึ่งวลีขึ้นไปของวลีแรกรวมถึง: การเข้าถึงรายการโพสต์สำหรับวลีแรก รายการโพสต์ รวมถึง สำหรับแต่ละเอกสารที่ระบุในรายการโพสต์ ข้อบ่งชี้ ของจำนวนวลีที่เกี่ยวข้องที่มีอยู่ในเอกสาร

3. วิธีการอ้างสิทธิ์ 1 ซึ่งเอกสารที่มีความถี่ของข้อความค้นหาต่ำ แต่มีวลีที่เกี่ยวข้องจำนวนมากสำหรับวลีแรกมีอันดับที่สูงกว่าเอกสารที่มีความถี่ของข้อความค้นหาสูงกว่า แต่ไม่มีวลีที่เกี่ยวข้อง

สิทธิบัตรที่ปรับปรุงการจัดทำดัชนีแบบวลีสามารถดูได้ที่:

การค้นหาแบบวลีในระบบดึงข้อมูล
นักประดิษฐ์: Anna L. Patterson
ผู้รับมอบหมาย: Google LLC
สิทธิบัตรสหรัฐอเมริกา: 9,990,421
ได้รับ: มิถุนายน 5, 2018
ยื่น: 2 กุมภาพันธ์ 2017

เชิงนามธรรม

ระบบดึงข้อมูลใช้วลีเพื่อสร้างดัชนี เรียกค้น จัดระเบียบ และอธิบายเอกสาร มีการระบุวลีที่คาดเดาการมีอยู่ของวลีอื่นๆ ในเอกสาร เอกสารจะถูกจัดทำดัชนีตามวลีที่รวมไว้ นอกจากนี้ยังระบุวลีที่เกี่ยวข้องและส่วนขยายวลีอีกด้วย วลีในแบบสอบถามจะถูกระบุและใช้เพื่อดึงและจัดอันดับเอกสาร วลียังใช้เพื่อจัดกลุ่มเอกสารในผลการค้นหา สร้างคำอธิบายเอกสาร และกำจัดเอกสารที่ซ้ำกันออกจากผลการค้นหาและจากดัชนี

ฉันเขียนโพสต์เมื่อประมาณหนึ่งปีที่แล้ว โดยเน้นที่การจัดทำดัชนีแบบวลี คุณกำลังใช้ Google Phrase-Based Indexing ของ Google หรือไม่ ซึ่งครอบคลุมสิทธิบัตรที่บอกเราว่าดัชนีฤๅษีของ Google ได้รับการอัปเดตให้มีวลีอย่างไร ซึ่งจะมีราคาแพงมาก การดำเนินการ แต่จะทำให้วิธีการในสิทธิบัตรฉบับแรกที่ได้รับการปรับปรุงนี้เกี่ยวกับการจัดทำดัชนีแบบวลีทำงานได้อย่างมีประสิทธิภาพมากขึ้น

ฉันยังเขียนหนึ่งในปี 2016 ที่เรียกว่าการสร้างแบบจำลองเฉพาะเรื่องโดยใช้คำที่เกี่ยวข้องในเอกสารและข้อความยึด โดยจะบอกเราเกี่ยวกับวิธีที่หน้าเว็บอาจได้รับการส่งเสริมในผลการค้นหาโดยพิจารณาจากการใช้เนื้อหา (วลีที่เกี่ยวข้องในข้อความของหน้าเว็บ) และ Anchor Hit (วลีที่เกี่ยวข้องซึ่งใช้เป็น anchor text ที่ชี้จากหน้าที่สร้างวลีที่เกี่ยวข้อง ) ด้วยการจัดอันดับที่กำหนดไว้ในรายละเอียดเพิ่มเติมในสิทธิบัตรการจัดทำดัชนีแบบอิงเฟสแรกนี้ เราอาจเห็นการอัปเดตสิทธิบัตรอื่นๆ เกี่ยวกับการจัดทำดัชนีแบบวลีเช่นกัน

การจัดทำดัชนีแบบวลีดูน่าสนใจเพียงพอสำหรับคุณในการทดสอบและค้นคว้าเพิ่มเติมหรือไม่