Google Sıralama Mühendisi Paul Haahr ile Soru-Cevap, SMX West 2016

Yayınlanan: 2021-10-08

Son zamanlarda SEO endüstrisi, bir Google personelinden nadir görülen bir şeffaflık ve bilgi aldı. Özellikle sıralama mühendisliği bölümünün bir üyesi: Google'ın algoritmasına doğrudan katkıda bulunan bir kişi.

Son 14 yıldır Google'da Yazılım Mühendisi olan Paul Haahr, Mart ayında SMX West'te bir Sıralama Mühendisi olarak Google'ın nasıl çalıştığı hakkında bir sunum yaptı. Birkaç parça kapsama:

Videonun tamamı burada.
Kapsamım ve düşüncelerim burada.
Rae Hoffman'ın kapsamı burada (yorumları kaçırmayın!).
Richard Baxter'ın sunumun tam metni.

Bu gönderi, Google'da Web Yöneticisi Eğilimler Analisti Gary Iylles'in katıldığı sunumundan sonra Paul ile birlikte yürütülen Soru-Cevap Danny Sullivan'ı kapsayacaktır. Videonun tamamı aşağıda:

Soru-Cevap bölümünde 16 soru soruldu. Onları birer birer alalım.

Not: Kendi anlayışıma dayanarak cevapları başka sözcüklerle ifade edeceğim. Cevabın tamamını izlemek istiyorsanız videoyu izlemenizi öneririm. Her soru, Danny'nin soruyu sorduğu noktaya gömülü bir videoya sahiptir.

1. Parçalar, çeşitli yerlerde genel dizinin parçaları mı?

İndeks, tüm parçaların toplamıdır.

Google, çok büyük makinelerden oluşan geniş bir ağa sahiptir ve bu çok büyük makineleri doldurmak için parça boyutlarını seçerler. Parçalar, Google'ın ölçek sorunuyla başa çıkma yolu gibi görünüyor ve bu da dizinin boyutunu yönetilebilir hale getiriyor.

2. RankBrain tüm bunlara nasıl uyuyor?

RankBrain'e algoritmada belirli sinyal alt kümeleri sağlanır (hangi sinyaller belli değil).
RankBrain, sinyalleri birleştirme ve belgeleri anlama konusunda kendi fikirleri olan bir makine öğrenimi (derin öğrenme? Paul kendini derin öğrenmeye göre düzeltir) sistemidir.
Google, RankBrain'in nasıl çalıştığını anlıyor (uzun çabalardan sonra), ancak tam olarak ne yaptığını anlamıyorlar.
RankBrain, Google'ın derin öğrenme hakkında yayınladıklarının çoğunu kullanır.
RankBrain'in yaptığının bir katmanı word2vec ve word yerleştirmeleridir.
RankBrain, bir sorgunun yaşamındaki geç alma sonrası aşamadan sonra başlar. (Paul buna "kutu" der).

3. RankBrain bir sayfanın otoritesini nasıl biliyor? Kaliteyi nereden biliyor?

RankBrain, bu işlevselliği geliştirmeye yönelik sağlam eğitim verilerine sahiptir. Sorgulara ve web sayfalarına ek olarak sinyalleri de görür.

Bana göre, RankBrain'in bir sayfanın otoritesini veya kalitesini belirlemesine gerek yokmuş gibi geliyor. Bu bilgiyi zaten besliyor.

4. Google, sıralama algoritması iyileştirmelerini test ederken hangi dönüşüm hedeflerine sahiptir? Tüm güncellemelerin ölçüldüğü tutarlı hedefler var mı?

Google, temel olarak insanların ikinci sonuç sayfasını ne sıklıkta tıkladığını ölçen "Sonraki Sayfa Oranı" adlı bir metriğe sahipti. İlk sayfa olma konsepti harika sonuçlar değildi. Ancak, bu kolayca oynanabilir/manipüle edilebilir.

Beyaz boşluk, özellikle, insanların aramanın ikinci sayfasına tıklama olasılığını azaltacaktır.

[videodaki sahneyi kes]

Not: Daha sonra 8:50'de benzer bir soru sorulur. Videoyu ve yanıtı görmek için 8. soruya ilerleyin.

5. Yaptığınız ilk şeylerden biri, sorgunun bir varlık içerip içermediğini belirlemektir. Bu, beş yıl önce yaptığın bir şey miydi?

Bu, Bilgi Grafiği ve Bilgi Panelleri ile aynı zamanda başladı. Bu süreçlerin anahtarıdır.

2011'de Bilgi Grafiği'ni başlatmadan önce Google'ın yaptığı bir şey değildi.

6. Birisi herhangi bir Google uygulamasına giriş yaptıysa, topladığınız bilgilere göre farklılaşıyor musunuz? Google Asistan'da olmak, Google Chrome'a karşı aramayı etkileyebilir mi?

Asıl soru, giriş yapıp yapmadığınızdır.

Giriş yaptıysanız, Google arama kişiselleştirmeyi getirir. Google, ilgi alanlarınıza ve Google Asistan kartlarında gösterilenlere dayalı olarak kullanıcılar için tutarlı bir arama deneyimi sağlamak istiyor.

Giriş yaptığınız ve arama kişiselleştirmeyi kapatmadığınız sürece, arama deneyimlerinizde kişiselleştirmeye sahip olacaksınız.

Aramanın, cihazlarınızda sizi yer imlerinden daha fazla takip etmesi daha olasıdır.

7. Google, gün içinde farklı zamanlarda aynı sorgu için farklı sonuçlar mı veriyor? Yerel haritalar çalışma saatleri ile değişiyor gibi görünüyor.

Ne Paul ne de Gary emindi, ancak ikisi de çalışma saatlerinin bir sorguyu etkilemeyeceğini düşünüyor gibiydi.

Google, işletme kapalıysa kapanış saatlerini (ve çalışma saatlerini) göstermek için bir noktaya değinecekti, ancak ikisi de saatlerin arama sonuçlarında bir haritanın bulunup bulunmadığını etkileyeceğini düşünmüyordu.

Bir işletmenin kapalı (veya kapanmaya yakın) olması, arama yapan kişinin fiziksel konumuyla ilgilenmediği anlamına gelmez.

8. Google, insan değerlendiricilerle yapılan deneylerde olumlu veya olumsuz değişiklikleri nasıl belirler? Sorgulara göre kazananlar/kaybedenler raporu var mı?

Google'ın her denemeyle ilgili bir özet raporu vardır ve bunların tümü, ilgili her sorguyu içeren bir dizi farklı metriğe göre (bunlar denemeye bağlı olarak değişir) denemenin nasıl performans gösterdiğini gösterir.

Galibiyetler ve mağlubiyetlere göre sınıflandırmalar var. Daha önce bahsedilen örnekte—bir haritayı görüntüleyen gübre sorgusu—bir kazanç olarak kategorize edildi. İnsanlar metrikleri ve sonuçları gözden geçirir. Bununla birlikte, bu durumda Paul, kendisine bir kazanç olarak bildirilen kötü sonuçları yakalamak olarak atıfta bulundu.

Paul, insan değerlendiricilerin genel olarak harika olduğunu, ancak hata yaptıklarını söylemek için bir noktaya değiniyor. Spesifik olarak, insan değerlendiriciler, özellikler değer katmasa bile belirli özellikler hakkında heyecanlanır.

9. Panda ve Penguen'e neler oluyor?

Paul'ün bir cevabı yok. Panda ve Penguen'in hem puanlama hem de geri alma "kutusu"nda hesaba katıldığını söylemek için bir noktaya değiniyor.

Danny, odağı, son altı ayda tekrar tekrar Penguin'in piyasaya sürülmek üzere olduğunu söylemekle ün salmış Gary'ye yönlendiriyor. Aslında Gary, Penguin'in yeni yıldan önce piyasaya sürüleceğini söyledi (Ocak 2016).

Açıkçası, Gary'nin tahminleri gerçekleşmedi.

Gary, Penguin'in ne zaman başlayacağını bildirmekten vazgeçtiğini bildirdi. Mühendislerin özellikle bunun üzerinde çalıştığını biliyor, ancak üç kez yanıldıktan sonra bir tarih veya zaman dilimi söylemek istemiyor.

Paul, yeni sıralama sinyalleri ve algoritmaları başlatmanın uzun yineleme döngüsünden tekrar bahseder.

10: İki yıl süren bir fırlatmadan bahsettiniz. Penguen miydi?

Paul'ün tartıştığı iki yıllık lansman Penguen değildi.

Lansman, yarı rütbeli yarı özellikli bir lansmandı. SERP'lerin yarısından fazlasını alan ve "bunu mu demek istediniz" işlevi yerine yazım hatası sonuçlarını gösteren ilk yazım düzeltme denemeleriydi.

Bu özelliğin ilk başlatılan yinelemesi, önemli ölçüde yeniden yazma gerektiriyordu (muhtemelen algoritmaya sığdırmak için).

11: Belirli bir yazarın uzmanlığından bahsediyorsunuz. Konular için yazar yetkisini nasıl belirliyor ve izliyorsunuz?

Paul burada hiçbir ayrıntıya giremez. Ancak, deneylerdeki insan değerlendiriciler, gördükleri sayfalar için bunu manuel olarak yapmakla görevlendirilir . Google, kendi metriklerini insan değerlendiricilerin bulduklarıyla karşılaştırır, böylece kendi metriklerini doğrular (veya geçersiz kılar).

12: Yazar yetkisi doğrudan mı yoksa dolaylı bir sıralama faktörü olarak mı kullanılıyor?

Basit bir cevap yok: Paul evet ya da hayır diyemez. Sorunun ima ettiğinden daha karmaşık.

13: rel=author ile uğraşmaya devam etmeli miyiz?

Gary, rel=author etiketini kullanmaya devam eden en az bir takım olduğunu söylüyor.

Gary, yeni sayfalar için etiket oluşturmayı önermez, ancak eski sayfalardan rel=author etiketinin çekilmesini de önermez. Etiket hiçbir şeye zarar vermez ve gelecekte bir şey için kullanılabilir.

14: Kalite değerlendiricilerinin markaya aşinalık önyargısına sahip olmasını nasıl önlersiniz?

İnsan değerlendiricilerden deneylerden önce araştırma yapmaları isteniyor, ancak Paul onların genellikle bir önyargıları olduğunu kabul ediyor.

Paul, bu önyargıyı ortadan kaldırmayı amaçlayan metrikler olduğunu ve bu metriklerin özellikle kalite sinyalinde olmadığını söylüyor.

İlginç bir şekilde, Paul kayıtsızca şöyle diyor: "Aslında baktığımız tüm ölçütleri incelemeye başlamadım."

Sonuç olarak, deneylerde incelenen alaka düzeyi ve kalitenin ötesinde birçok metrik olduğu anlamına gelir.

Paul, kalite puanı alan pek çok küçük site olduğunu söyleyerek bir noktaya değiniyor, "çünkü değerlendiriciler tam bir iş çıkarıyorlar. Bunu anlamakta iyi görünüyorlar."

15: Tıklama Oranı (TO) bir sıralama sinyali midir?

Paul, TO'nun deneylerde ve kişiselleştirmede kullanıldığını onaylıyor.

Metrik olsa da, her koşulda kullanmak zordur.

Gary, kontrollü gruplarla bile etkileşimi doğru yorumlamanın zor olduğunu söyleyerek araya giriyor.

Paul, yapılan birçok deneyin yanıltıcı canlı ölçümlere sahip olduğunu kabul ediyor. Alıntı yaptığı örnek, snippet'lerin yanı sıra 4. soruda atıfta bulunulan "Sonraki Sayfa Oranı"dır.

Paul ayrıca, arama sonuçlarında 2. ve 4. sonuçları değiştiren uzun süredir devam eden bir canlı deneyden de bahsediyor. Rastgele ve yalnızca kullanıcıların %0,02'si için yapılmıştır. Sonuç? Çok daha fazla kişi 1 numaralı sonuca tıkladı. Paul bunu şöyle açıklıyor:

"1'i görüyorlar - sevip sevmediklerini bilmiyorlar - ikiye bakıyorlar, bu gerçekten 2'den çok daha kötü, pes ediyorlar çünkü sonuç 4.'de olmalıydı ve oldu. aslında 2 numara o kadar kötüydü ki 1 numaraya tıklıyorlar."
— Paul Haahr, SMX West 2016'da, alışılmadık tıklama metriklerine yol açan bir Google canlı denemesini açıklıyor.

Paul'un değindiği bir başka ilginç önyargı, 10. konumun, 8 ve 9. konumların birlikte olduğundan "çok daha fazla tıklama" almasıdır. Niye ya? Çünkü bir sonraki sayfadan önceki son sonuçtur ve kimse bir sonraki sayfaya tıklamak istemez.

Yine de #10, #7 konumundan daha kötü performans gösteriyor.

Bütün bunların amacı? TO, kullanımı son derece zor bir sinyaldir ve genellikle garip önyargıların ve öngörülemeyen insan davranışlarının sonucudur .

16: Şu anda ne okuyorsun?

Paul "çok fazla gazetecilik ve çok az kitap" okur. Ayrıca San Francisco ve Mountain View arasında gidip gelirken birçok sesli kitap dinliyor.

Pavlus'un bahsettiği kitaplar:

Garth Risk Hallberg'in Şehri Yanıyor
ve Sinclair Lewis' Bu Burada Olmaz .

...ve bu bir paket!

sorular? Yorumlar? Düşünceler? Onları aşağıda bırakın!