Bilgi Tabanlı Aramalarda İlgili Varlık Puanları
Yayınlanan: 2018-02-12"Mükemmel arama motoru ne demek istediğinizi tam olarak anlayacak ve size tam olarak ne olduğunu geri verecektir.
İstediğiniz." Larry Page, Arama Nasıl Çalışır?
Varlıklarla İlgili Sorguları Yanıtlamak için Bilgi Tabanlarını Kullanma
Üç yıl önce, "Robert Duvall'ın sabahları Napalm kokusunu ne kadar sevdiğini söyleyen bir karakteri canlandırdığı film nedir?" gibi bir sorgu kullanarak nasıl arama yapabileceğiniz konusunda Aramalarda Bilgi Tabanı Varlıklarının Nasıl Kullanılabileceğini yazmıştım. ” Tanınmış bir oyuncunun iyi bilinen bir repliği söylediği bir film araması, Google'ın sorguları yanıtlayabilmek için bilgi tabanlarından öğrenebileceği gerçekleri kullanmasına bir örnektir. Öne çıkan bir snippet ile yanıt vermiyor. Bunun yerine, birkaç videoyu ve ardından bu soruyu yanıtlayan diğer belgeleri gösterir.
Google'a geçen ay verilen bir patent, sorgulara yanıt vermek için bilgi tabanlarından öğrenmiş olabileceği bir bilgi grafiğindeki bilgilere de bakıyor. Öne çıkan snippet'ler olarak değil, sorgudaki varlıklar ve ilgili özellikler hakkında bilgi edinen arama sonuçları. Bu, eşanlamlıları ve anlamsal olarak ilişkili kelimeleri anlamanın ötesine geçen, bir aramaya dahil olan şeyler hakkında bazı özellikleri bilmenin ötesine geçen anlamsal bir aramadır (unutmayın, Google Bilgi Grafiği "Dizeler değil, Şeyler" ile ilgilidir, bu nedenle yalnızca anahtar kelimeleri eşleştirmenin ötesine geçer. bir sorgudan bir belgedeki aynı (veya ilgili) anahtar kelimelere.İlgili varlık puanları kavramını da tanıtır.
Bilgi Grafiği, Sorguları Yanıtlamak için Varlık Bilgilerini Toplar
Evet, bilgi grafiği bir ansiklopedi gibidir, ancak var olmasının nedeni bu değildir. Varlıklar hakkında bilgi edinmeye çalışır, böylece arama sonuçlarında onlar hakkındaki sorguları yanıtlamaya yardımcı olabilir.
Bu yeni patent bize, belirli varlıklar hakkındaki bilgileri sorguları yanıtlamak için nasıl kullanabileceğini anlatıyor:
Bazı uygulamalarda, bilgisayarla uygulanan bir yöntem, ilgili özelliklere göre en az bir işlemci, en az bir varlık ve en az bir varlıkla ilgili ilgili varlıkları kullanarak bir bilgi grafiğinde tanımlamayı içerir. Bilgisayarla uygulanan yöntem, ilgili varlıkların her biri için, en az bir işlemci kullanarak, en az bir varlık ve ilgili varlıklardan birini ilişkilendiren ilgili bir özellik ile ilişkili bir ilgili varlık puanının belirlenmesini içerir. Bilgisayarla uygulanan yöntem, her bir ilgili özellik için, o ilgili özellik ile bağlantılı ilgili varlık puanlarına dayalı olarak en az bir işlemci kullanarak bir özellik puanı oluşturmayı içerir. Bilgisayarla uygulanan yöntem, en az bir işlemci kullanarak ve oluşturulan özellik puanlarına dayalı olarak sıralanabilir özelliklerden oluşan bir veri yapısının depolanmasını sağlamayı içerir, burada veri yapısı, bir sorguya yanıt olarak sıralanmış arama sonuçları sağlamak için kullanılır.
Google'a “George Washington Haritacı neredeydi?” gibi bir soru sorarsanız. arama motoru, askere gitmeden önce genç bir araştırmacı olarak nerede hareket ettiğini ayrıntılı olarak gösteren arama sonuçları sağlar.

Washington Virginia adlı bir kasaba (kendisine ilk Washington diyor), genç günlerinde çevreyi araştıran 17 yaşındaki çocuğu anıyor.

İlgili Varlık Puanları
Bu patentin süreci nasıl işliyor? Bilgi grafiği, ilgili varlık puanlarını kullanarak arama sonuçlarının döndürülmesine yardımcı olmak için şu şekilde çalışır:
Bazı uygulamalarda, bir sistem, bir bilgi grafiği ve bir veya daha fazla işlemci içeren bir veri yapısı içerir. Bir veya daha fazla işlemci, bilgi grafiğinde en az bir varlığın ve en az bir varlıkla ilgili ilgili varlıkların ilgili özelliklere göre tanımlanmasını içeren işlemleri gerçekleştirmek üzere yapılandırılır. Bir veya daha fazla işlemci, ilgili varlıkların ilgili her biri için, en az bir varlık ve ilgili varlıklardan biri ile ilgili olan ilgili bir özellik ile ilişkili bir ilgili varlık puanının belirlenmesini içeren işlemleri gerçekleştirmek üzere yapılandırılır. Bir veya daha fazla işlemci, ilgili her bir özellik için, o ilgili özellik ile ilişkili ilgili varlık puanlarına dayalı olarak bir özellik puanı oluşturmayı içeren işlemleri gerçekleştirmek üzere yapılandırılır. Bir veya daha fazla işlemci, oluşturulan özellik puanlarına dayalı olarak sıralanabilir özelliklerden oluşan bir veri yapısının oluşturulmasını ve depolanmasına neden olan işlemleri gerçekleştirmek üzere yapılandırılır; burada veri yapısı, bir sorguya yanıt olarak sıralanmış arama sonuçları sağlamak için kullanılır.
Yeni verilen patent,
Sıralanmış özelliklere dayalı arama sonuçları sağlama
Mucitler: Yiming Li ve Zhenyu Gu
Atanan: Google LLC
Amerika Birleşik Devletleri Patenti 9.875.320
Verildi: 23 Ocak 2018
Dosya: 8 Şubat 2016
Soyut
Bir varlık, bir veya daha fazla özellikle ilişkili birden fazla varlıkla ilişkili olabilir ve varlık ayrıca bir veya daha fazla varlık türüyle ilişkilendirilebilir. Sıralanmış sonuçları sağlamaya yönelik bir sistem, varlığın, ilgili varlıkların ve türlerin tanımlanmasını içerebilir. Sistem ayrıca, varlığa göre ilgili her bir ilgili kuruluş için ilgili kuruluş puanlarını da belirleyebilir. Her bir mülk için, o mülkle ilgili ilgili varlıkların ilgili varlık puanları bir özellik puanı oluşturmak üzere birleştirilir. Daha sonra mülkler, mülk puanlarına göre sıralanır. Sıralama, bir varlık türüyle ilişkili özellikler için gerçekleşebilir ve sıralanan arama sonuçları, bir veya daha fazla ilgili varlık türü için çıktı olarak sağlanabilir.
Arama Sonuçları ve Öne Çıkan Snippet'ler
Google, Bilgi Tabanlarını Arama Motorlarıyla Evlendirecek mi? Google, bir sorguyu arama sonucu, öne çıkan snippet veya yapılandırılmış snippet ile yanıtlamak için çok fazla tercih göstermedi.
Bazen bir filmle ilgili bir soruya cevap vermek çok uygun görünebilir. XXXX'in başkenti neresidir gibi coğrafya hakkında bir soru sorduğumda hoşuma gidiyor. bir haritayı öne çıkan bir snippet'te gösterir, çünkü bir başkentin konumu yararlı bilgiler olabilir.
Google'ın Varlıklarla İlgili Soruları Yanıtlamak için Bilgi Grafiği'ni Nasıl Kullandığına İlişkin Özel Bilgi Tabanı Yok
Henüz Google'ın bir bilgi grafiğini nasıl kullandığını bize anlatan hiçbir bilgi tabanı yok. Sahip olduğumuz en yakın şey, içinde önemli miktarda bilgi bulunan bunun gibi patentlerdir. Bu bölüm, Google'ın mülklerle ilgili bilgileri nasıl ele alabileceğine ilişkin kavramlar ve ipuçları açısından zengindi:
Belirli bir varlık, birkaç türle ilişkilendirilebilir ve ayrıca bir veya daha fazla özellikle birden çok başka varlıkla ilişkilendirilebilir. Burada kullanıldığı şekliyle varlık, tekil, benzersiz, iyi tanımlanmış ve ayırt edilebilir bir şey veya kavramdır. Örneğin, bir varlık bir kişi, yer, öğe, fikir, konu, soyut kavram, somut öğe, diğer uygun şey veya bunların herhangi bir kombinasyonu olabilir. Bazı uygulamalarda, arama sonuçları, varlık referanslarını tanımlayan sonuçları içerir. Burada kullanıldığı şekliyle, bir varlık referansı, bir varlığa atıfta bulunan bir tanımlayıcı, örneğin metin veya diğer bilgilerdir. Örneğin, bir varlık George Washington'un fiziksel düzenlemesi olabilirken, varlık referansı George Washington'a atıfta bulunan soyut bir kavramdır. Uygun olduğunda, bağlama dayalı olarak, burada kullanıldığı şekliyle varlık teriminin bir varlık referansına karşılık gelebileceği ve burada kullanıldığı şekliyle varlık referansı teriminin bir varlığa karşılık gelebileceği anlaşılacaktır. Bazı uygulamalarda, arama sistemi bir varlık referansıyla ilişkili bir varlık tipini tanımlayabilir. Varlık türü, veri yapısındaki varlık referanslarını tanımlamak için kullanılan bir kategorizasyon veya sınıflandırma olabilir. Örneğin, "George Washington" tüzel kişiliği referansı "ABD Başkanı", "Kişi" ve "Askeri Subay" tüzel kişilik türleriyle ilişkilendirilebilir. Özellikler, varlıklar arasındaki ilişkileri, başka bir deyişle, bir varlığın başka bir varlıkla nasıl ilişkili olduğunu tanımlar. Bir varlıkla ilişkilendirilen en önemli özellikler, onun türlerinden hangisinin ilgilendiğine bağlı olabilir. Örneğin, "Tom Hanks" varlığı için bir kullanıcı, arama sonuçlarının filmlerini veya oyunculuğuyla ilgili diğer bilgileri içermesini isteyebilir. Ancak, "Albert Einstein" varlığı için kullanıcılar, araştırma sonuçlarının teorilerini, teknik makalelerini ve fiziğe katkılarıyla ilgili diğer bilgileri içermesini isteyebilir. Açıklanan teknikler, önemli nitelikleri belirlemek için kullanılabilir ve buna göre kullanıcının muhtemelen isteyeceği arama sonuçlarını sağlar.
Anlamsal bir aramada bir bilgi tabanının nasıl kullanılabileceğine dair daha fazla bilgi edinmek ister misiniz? Bu patenti okumanızda fayda var. Google'ın birçok siteyi Wikipedia ve Wikidata'nın ötesine geçen yararlı bilgi tabanları olarak gördüğünü unutmayın. Gerçekler hakkında yararlı bilgiler olarak IMDB ve Yahoo Finance gibi kaynaklara bakabilir.
Bu patenti örneklemek için George Washington'u bir bilirkişi olarak göstermeye karar verdim. Pek çok insan bunu bir genç olarak yaptığını bilmiyor! Bu pozisyonun daha sonra ordu komutanı ve politikacı gibi pozisyonlarda önemli bir rol oynaması da mümkündür. Patentten varlık türleri ve bir grafikteki bilgileri anlama hakkındaki aşağıdaki pasaj, seçim örneğimi etkiledi:
Kurumsal verileri temsil eden bir düğüm, bir bilgi grafiğine dahil edilebilir. Bunlara burada varlık tipi düğümler olarak atıfta bulunulabilir. Burada kullanıldığı şekliyle, bir varlık türü düğümü, bir bilgi grafiğindeki bir düğüme atıfta bulunabilirken bir varlık türü, bir varlık türü düğümü tarafından temsil edilen kavrama atıfta bulunabilir. Bir varlık türü, bir varlığın tanımlayıcı bir özelliği olabilir. Örneğin, varlık türü düğüm Y, bir varlık düğümü X'e, aşağıda daha ayrıntılı tartışılan bir "A mı" kenarı veya bağlantısı ile bağlanabilir, öyle ki, grafik "X, Y Tipidir" bilgisini temsil eder. Örneğin, "George Washington" varlık düğümü, "Başkan" varlık türü düğümüne bağlanabilir. Bir varlık düğümü birden çok varlık türü düğüme bağlanabilir, örneğin "George Washington", varlık türü düğüme "Kişi" ve varlık türü düğüme "Askeri Komutan" da bağlanabilir.
Bu patenti okuyup anlamaya çalışmanızı tavsiye ederim. Bir arama motorunun, özellikler ve bunların farklı yönleri hakkında sorguları nasıl yakalayıp döndürebileceğini ilişkilendirmeye yardımcı olabilir. Bu, şeyler ve bunların birbirleriyle nasıl ilişkili olabileceği hakkındaki bilgileri göz önünde bulunduran çok daha semantik tabanlı bir aramadır. Bu, sorgulardan belgelere metin dizelerini eşleştirmekle ilgili değildir. Bunun yerine, varlıklar, türleri, özellikleri ve diğer varlıklarla ne kadar ilişkili olabilecekleri hakkında bilgi sahibi olmaya odaklanmak.
Virginia tepelerini inceleyen genç bir Washington hakkında bir film izlemek istiyorum. Google'a sordum, "George Washington'ın haritacı olarak çalıştığı bir film var mı?" Görünüşe göre o günleri kapsayan bir animasyon filmi başladı: General George Washington
Gelecekte İçerik Oluştururken İlgili Varlık Puanlarını ve Mülk Puanlarını Kullanacak mıyız?
İlgili Varlık Puanları ve mülk puanları gelecekte dikkate alınması gereken önemli şeyler olacak mı? Patent, arama motorlarının bunları nasıl kullanabileceğine dair ipuçları sağlar:
Adım 606, özellik ile ilişkili ilgili varlık puanlarına dayalı olarak her bir özellik için bir özellik puanı üreten bir veya daha fazla işlemci içerir. Her bir özel mülkle ilişkili ilgili varlık puanları, o mülk için birleştirilebilir. Örneğin, ŞEK. 4'te, ilgili kuruluşlar için ilgili varlık puanları "Forrest Gump", "Big" ve "Saving Private Ryan", "Oyunculuğundaki Filmler" özelliği için bir toplam vermek üzere toplanabilir, örneğin, 0.8+0.8+0.8=2.4. Başka bir örnekte, ilgili varlık puanları ağırlıklı bir toplam olarak birleştirilebilir. Mülkiyet puanını oluşturmak için ilgili varlık puanlarının herhangi bir uygun kombinasyonu kullanılabilir. Bazı uygulamalarda, bir veya daha fazla tür, başka bir varlık türünün alt türü olabilir. Örneğin, Şekil 2'deki referans veri yapısı 550; 5'te, "Aktör" türü, alt türe göre bir ana tür olarak adlandırılabilecek olan "Kişi" varlık türünün bir alt türü olabilir. Bu tür bazı uygulamalarda, ebeveyn türü için, her bir alt türün her özelliği için özellik puanı, üst türün aynı özelliği ile toplanabilir. Örneğin, Şekil 2'deki referans veri yapısı 550; 5'te, "Çevrimi geçirilen filmler" özelliği "Oyuncu" ve "Kişi" tipine dahil edilmiştir ve buna göre, "Oyuncu" varlık türü için 9,0 olan mülk puanı, "Kişi" varlık türü için 1.0 mülk puanı ile toplanabilir. ” Bir veya daha fazla işlemci, alt türü dahil ettikten sonra ana tür içindeki puanları yeniden normalleştirebilir, ölçeklendirebilir, ağırlıklandırabilir veya başka şekilde değiştirebilir.
Bunu okuduktan sonra bu biraz daha mantıklı olabilir. Google, en az 3 yıldır arama sorgularını arama sonuçlarıyla yanıtlamak için bilgi grafiğini kullanıyor. Onlar da bu konuda daha sofistike hale geliyorlar. Google yeni şeyler denedikçe ve arama sonuçlarını nasıl görüntülediklerini daha fazla denedikçe gelişmeye devam etmesi muhtemeldir.

