Pazar günü, 5 Mayıs'ta, Google'ın Arama bölümü içerisinden büyük bir API dokümantasyonu sızıntısına erişimi olduğunu iddia eden bir kişiden e-posta aldım. E-postada bu sızdırılan belgelerin eski Google çalışanları tarafından doğrulandığı ve bu eski çalışanlar ve diğerlerinin Google'ın arama operasyonları hakkında ek, özel bilgiler paylaştığı iddia edildi.
Birçok iddia, yıllar boyunca Googler'lar tarafından yapılan kamuya açık açıklamalarla doğrudan çelişiyordu, özellikle tıklama-merkezli kullanıcı sinyallerinin kullanılmadığına dair tekrarlanan reddetmeler, alt alan adlarının sıralamada ayrı ayrı değerlendirildiğine dair reddetmeler, yeni web siteleri için bir kum havuzunun var olduğu reddi, bir alan adının yaşının toplandığı veya dikkate alındığı reddi ve daha fazlası.
Doğal olarak, şüpheliydim. Bu kaynağın (anonim kalmasını isteyen) yaptığı iddialar olağanüstü görünüyordu–şu gibi iddialar:
Google’ın arama ekibi, ilk yıllarında, arama motorunun sonuç kalitesini artırmak için büyük bir yüzdeyle web kullanıcılarının tam tıklama verilerine (tarayıcı tarafından ziyaret edilen her URL) ihtiyaç duyduğunu fark etti. “NavBoost” adlı bir sistem (Google Arama Başkan Yardımcısı Pandu Nayak tarafından DOJ dava ifadesinde bahsedildi) başlangıçta Google’ın Araç Çubuğu PageRank’tan veri topladı ve daha fazla tıklama verisi isteği, 2008’de başlatılan Chrome tarayıcısının oluşturulmasının ana motivasyonu olarak hizmet etti. NavBoost, belirli bir anahtar kelime için yapılan arama sayısını, bir arama sonucuna yapılan tıklama sayısını (2013-2015 yılları arasında bu konuda birkaç deney yaptım) ve uzun tıklamalar ile kısa tıklamaları (2015 yılında bu videoda teorilerini sundum) kullanarak trend arama taleplerini belirler. Google, manuel ve otomatik tıklama spam’ini önlemek için çerez geçmişi, oturum açmış Chrome verileri ve desen algılama (sızdırılan belgelerde “unsquashed” tıklamalar ve “squashed” tıklamalar olarak adlandırılır) kullanır. NavBoost ayrıca kullanıcı niyetini değerlendirmek için sorguları puanlar. Örneğin, belirli dikkat ve tıklama eşikleri videolar veya resimler üzerinde belirli bir sorgu ve ilgili, NavBoost ile ilişkilendirilmiş sorgular için video veya resim özelliklerini tetikler. Google, ana sorgu sırasında ve sonrasında yapılan aramalar ve etkileşimlere bakar (bir “NavBoost sorgusu” olarak adlandırılır). Örneğin, birçok kullanıcı “Rand Fishkin” araması yaparsa, SparkToro’yu bulamazsa ve hemen “SparkToro” aramasına geçip arama sonucunda SparkToro.com’a tıklarsa, SparkToro.com (ve “SparkToro”yu anan web siteleri), “Rand Fishkin” anahtar kelimesi için arama sonuçlarında bir artış alır. NavBoost’un verileri, bir sitenin genel kalitesini değerlendirmek için ana düzeyde kullanılır (anonim kaynağım, bunun Google ve SEO'lar tarafından “Panda” olarak adlandırılan şey olabileceğini speküle etti). Bu değerlendirme, bir artış veya düşüşle sonuçlanabilir. Diğer küçük faktörler arasında markasız arama sorgularına tam olarak uyan alan adları için cezalar (örneğin, mens-luxury-watches.com veya milwaukee-homes-for-sale.net), daha yeni bir “BabyPanda” puanı ve spam sinyalleri de kalite değerlendirme sürecinde dikkate alınır. NavBoost tıklama verilerini coğrafi olarak sınırlar, ülke ve eyalet/derece seviyelerini ve mobil ile masaüstü kullanımlarını dikkate alır. Ancak, Google belirli bölgeler veya kullanıcı ajanları için veri eksikliğine sahipse, bu süreci evrensel olarak sorgu sonuçlarına uygulayabilir. Covid-19 pandemisi sırasında, Google, Covid ile ilgili aramalarda yüksek sıralarda yer alabilecek web siteleri için beyaz liste kullanmıştır. Benzer şekilde, demokratik seçimler sırasında, seçimle ilgili bilgiler için gösterilmesi (veya düşürülmesi) gereken siteler için beyaz liste kullanmıştır. Ve bunlar sadece buzdağının görünen kısmı.
Olağanüstü iddialar, olağanüstü kanıtlar gerektirir. Ve bunların bazıları Google/DOJ davası sırasında ortaya çıkan bilgilerle örtüşse de (bu 2020 konusundan bazılarını okuyabilirsiniz), birçoğu yenidir ve içeriden bilgiye işaret eder.
Bu nedenle, geçtiğimiz Cuma, 24 Mayıs’ta (birkaç e-posta sonrası), anonim kaynakla bir video görüşmesi yaptım.
https://www.youtube.com/watch?v=AEb8_rbfFVw
E-posta ve görüşmeden önce, Erfan’ı ne tanıyordum ne de duymuştum. Kimliğinin gizli kalmasını istedi ve sadece aşağıdaki alıntıyı eklememi rica etti:
Bir kartal, fırtınayı kullanarak hayal edilemez yüksekliklere ulaşır. – Matshona Dhliwayo
Görüşmeden sonra, Erfan’ın iş geçmişi, pazarlama dünyasından ortak tanıdıklarımız ve sektördeki içerdekilerle (Google çalışanları dahil) belirli etkinliklerde bulunma iddialarının bazılarını doğrulayabildim, ancak toplantıların ayrıntılarını veya iddia ettikleri konuşmaların içeriğini doğrulayamam.
Görüşmemiz sırasında, Erfan bana sızıntının kendisini gösterdi: Google’ın iç “Content API Warehouse”undan geldiği görünen 14.014 nitelik (API özellikleri) içeren 2.500’den fazla sayfalık API dokümantasyonu. Belgenin commit geçmişine göre, bu kod 27 Mart 2024'te GitHub’a yüklendi ve 7 Mayıs 2024'e kadar kaldırılmadı. (Not: Bu parça, Erfan’ın kimliğini yansıtacak şekilde yayınlandıktan sonra düzenlendiği için, aşağıda “anonim kaynak” olarak anılmaktadır).
Bu dokümantasyon, arama sıralama algoritmasındaki belirli öğelerin ağırlığını veya hangi öğelerin sıralama sistemlerinde kullanıldığını kanıtlamaz. Ancak, Google’ın topladığı veriler hakkında inanılmaz detaylar gösterir. İşte belgenin formatına bir örnek:
Beni bu API modüllerinden birkaç tanesiyle tanıştırdıktan sonra, kaynak, motivasyonlarını (şeffaflık, Google'ı hesap vermeye zorlamak, vb.) ve umutlarını açıkladı: Bu sızıntıyı paylaşan bir makale yayınlamamı, içerdiği birçok ilginç veri parçasını ortaya çıkarmamı ve Googler'ların "yıllardır yaydığı bazı yalanları" çürütmemi istiyordu.
Bu API Sızıntısı Gerçek mi? Güvenebilir miyiz?
Sürecin kritik bir sonraki adımı, API Content Warehouse belgelerinin doğruluğunu doğrulamaktı. Bu yüzden bazı eski Google çalışanı arkadaşlarıma ulaştım, sızdırılan belgeleri paylaştım ve düşüncelerini sordum. Üç eski Google çalışanı geri döndü: biri bu belgeleri incelemekte veya yorum yapmakta rahat hissetmediğini söyledi. Diğer ikisi şu görüşleri (resmi olmayan ve anonim olarak) paylaştı:
“Ben çalışırken bu koda erişimim yoktu. Ama bu kesinlikle gerçek görünüyor.” “Bu, bir iç Google API'sinin tüm özelliklerine sahip.” “Bu, Java tabanlı bir API. Ve biri Google’ın kendi iç standartlarına göre dokümantasyon ve adlandırma konularında çok zaman harcamış.” “Emin olmak için daha fazla zamana ihtiyacım var, ancak bu, tanıdık olduğum iç dokümantasyonla eşleşiyor.” “Kısa bir incelemede gördüğüm hiçbir şey bunun gerçek olmadığını düşündürmüyor.”
Sonraki adımda, adlandırma konvansiyonlarını ve dokümantasyonun daha teknik yönlerini analiz etmek ve çözmek için yardıma ihtiyacım vardı. API'lerle biraz çalıştım, ancak kod yazmamın üzerinden 20 yıl geçti ve profesyonel olarak SEO yapmamın üzerinden 6 yıl geçti. Bu yüzden, dünyanın en önde gelen teknik SEO'larından biri olan iPullRank'in kurucusu Mike King’e ulaştım.
Cuma öğleden sonra yaptığımız 40 dakikalık bir telefon görüşmesi sırasında Mike, sızıntıyı inceledi ve şüphelerimi doğruladı: Bu, Google’ın Arama bölümünden gelen meşru bir belge seti gibi görünüyor ve Google’ın iç işleyişi hakkında daha önce doğrulanmamış olağanüstü miktarda bilgi içeriyor.
2.500 teknik dokümanı tek bir adamın (bir baba, eş ve girişimci) bir hafta sonunda incelemesi makul bir beklenti değil. Ancak, bu Mike’ın elinden gelenin en iyisini yapmasını engellemedi. Google API sızıntısının son derece ayrıntılı bir ilk incelemesini burada bir araya getirdi ve bulgularımda daha fazla referans vereceğim. Ayrıca, 8 Ekim'de Seattle, WA'da düzenlenecek SparkTogether 2024'e katılmayı ve bu sızıntının tamamen şeffaf hikayesini, birkaç aylık analizlerin faydasıyla çok daha ayrıntılı bir şekilde sunmayı kabul etti.
Bu Gönderi İçin Yeterlilikler ve Motivasyonlar İleri gitmeden önce, birkaç açıklama: Artık SEO alanında çalışmıyorum. SEO hakkındaki bilgim ve deneyimim 6+ yıl önceye dayanıyor. Bir API dokümantasyon sızıntısını analiz etmek ve kesin olarak doğruluğunu onaylamak için teknik uzmanlığa veya Google’ın iç operasyonlarına dair bilgiye sahip değilim (bu yüzden Mike’ın yardımı ve eski Google çalışanlarının görüşlerini aldım).
Peki neden bu konu hakkında yazıyorum?
Çünkü bana bu bilgiyi gönderen kişiyle konuştuğumda, onları güvenilir, düşünceli ve derinlemesine bilgili buldum. Konuşmaya oldukça şüpheci girmeme rağmen, hiçbir uyarı işareti veya kötü niyetli bir motivasyon göremedim. Bu kişinin tek amacı, benimkine oldukça uyumlu görünüyordu: Google’ı kamuya açık açıklamalarının özel konuşmalar ve sızdırılan dokümantasyonla çelişmesi konusunda hesap vermeye zorlamak ve arama pazarlaması alanına daha fazla şeffaflık getirmek. Ve yıllar önce SEO'dan uzaklaşmış olmama rağmen, bunu halka açık bir şekilde paylaşacak en iyi kişi olduğuma inanıyorlardı.
Bu, neredeyse yirmi yıl boyunca derinden önemsediğim hedeflerdi. Profesyonel hayatım ilerlemiş olsa da (şu anda iki şirket yönetiyorum: Audience research yazılımı yapan SparkToro ve bağımsız bir video oyunu geliştiricisi Snackbar Studio), Arama Motoru Optimizasyonu dünyasına olan ilgim ve bağlantılarım güçlü kalmaya devam ediyor. Dünyanın en baskın arama motorunun nasıl çalıştığı hakkında bilgi paylaşma konusunda derin bir sorumluluk hissediyorum, özellikle Google’ın sessiz kalmayı tercih edeceği bilgiler hakkında. Ve ne yazık ki, bu potansiyel olarak çığır açıcı şeyi gönderebileceğim başka bir yer olduğundan emin değilim.
Yıllar önce, gazetecilikten ayrılıp Google’ın Arama İletişim Temsilcisi olmadan önce Danny Sullivan, bu büyüklükte bir sızıntı için başvuracağım kişi olurdu. Bu tür bir iddiayı incelemek ve kamuoyunda adil bir şekilde sunmak için ciddiyete, özgeçmişe, bilgiye ve deneyime sahipti. Son birkaç yılda, Google'ın tanık kürsüsündeki ifadeleri gibi (örneğin, organik anahtar kelime verileri hakkında savunulamaz gizlilik iddiaları üzerine yazdığı zarif yazılar) haberlere konu olan parçalar için Danny'nin sakin, dengeli, Google’a karşı sert ama adil yaklaşımını çok kez özledim.
Google ona ne kadar ödeme yapıyorsa, yetmez.
Üzgünüm ki, sevgili okur, Danny yerine bende takılı kaldınız. Ancak madem öyle, geçmişim veya yeterliliklerimle ilgili bilgi sahibi olmayabileceğinizi varsayıyorum ve bunları kısaca paylaşmak istiyorum.
2001 yılında Seattle bölgesindeki küçük işletmeler için SEO yapmaya başladım ve 2003 yılında SEOmoz adını alacak SEO danışmanlık şirketini kurdum. Sonraki 15 yıl boyunca arama pazarlama sektöründe çalıştım ve bu alanda etkili bir lider olarak sıkça tanındım. Lost and Founder: A Painfully Honest Field Guide to the Startup World, The Art of SEO ve Inbound Marketing and SEO adlı kitapların yazarı/ortak yazarıyım. WSJ, Inc, Forbes ve yüzlerce diğer yayın, SEO ve Google aramaları hakkında yazılar yazdı ve beni alıntıladı, bunların birçoğu 10 yıl boyunca sunduğum popüler haftalık video serisi Whiteboard Friday’e atıfta bulundu. Moz, 35.000'den fazla ödeme yapan müşteriye, 50 milyon dolardan fazla gelire ve yaklaşık 200 kişilik bir ekibe sahipti ve 2021'de bir özel sermaye alıcısına satıldı. 2018’de ayrıldım ve SparkToro’yu, 2023’te ise Snackbar Studio’yu kurdum. 2001 yılında Washington Üniversitesi’nden ayrıldım ve bir dereceye sahip değilim, ancak Google ve SEO üzerindeki çalışmalarım, Amerika Birleşik Devletleri Kongresi, ABD Federal Ticaret Komisyonu, Wall Street Journal, New York Times ve John Oliver’ın Last Week Tonight programı gibi birçok yerde alıntılandı. Bir web ölçekli bağlantı dizini tasarımı üzerine birkaç patente sahibim ve dijital pazarlama dünyasında bir web sitesinin Google arama motorunda sıralama yeteneğini değerlendirmek için yaygın olarak kullanılan makine öğrenimi tabanlı bir puan olan Domain Authority dahil olmak üzere birçok bağlantı dizini metriğinin yaratıcısıyım.
Tamam. Şimdi Google sızıntısına dönelim.
Google API İçerik Deposu Nedir?
Bu devasa API dokümantasyonu hazinesine bakarken, ilk makul soru seti şunlar olabilir: “Bu nedir? Ne için kullanılır? İlk etapta neden var?
Sızıntı, GitHub'dan gelmiş gibi görünüyor ve bu belgenin ifşa edilmesiyle ilgili en güvenilir açıklama, anonim kaynağımın telefon görüşmemizde bana söyledikleriyle örtüşüyor: Bu belgeler kazara ve kısa bir süreliğine halka açık hale getirilmiş (belgedeki birçok bağlantı, özel GitHub depolarına ve Google’ın kurumsal sitesindeki belirli Google kimlik bilgileri gerektiren iç sayfalara işaret ediyor). Muhtemelen Mart ve Mayıs 2024 arasında gerçekleşen bu kazara kamuya açık dönem sırasında, API dokümantasyonu Hexdocs’a (kamuya açık GitHub depolarını indeksleyen bir platform) yayıldı ve diğer kaynaklar tarafından bulundu/dolaştırıldı (başkalarının da bir kopyaya sahip olduğundan eminim, ancak şimdiye kadar hiçbir kamuoyu tartışması bulamamam tuhaf).
Eski Google çalışanı kaynaklarıma göre, bu tür dokümantasyon neredeyse her Google ekibinde mevcut olup, bir projede çalışanlara kullanılabilir veri unsurlarını tanıtmak için çeşitli API özelliklerini ve modüllerini açıklar. Bu sızıntı, aynı notasyon stili, biçimlendirme ve hatta süreç/modül/özellik adları ve referanslarını kullanarak, kamuya açık GitHub depolarındaki ve Google’ın Cloud API dokümantasyonundaki diğerlerine uymaktadır.
Eğer tüm bunlar teknik açıdan zor anlaşılıyorsa, bunu Google’ın arama motoru ekibi üyeleri için talimatlar olarak düşünün. Bir kütüphanedeki kitapların envanteri, bir tür kart kataloğu gibi, bu çalışanlara neyin mevcut olduğunu ve nasıl erişebileceklerini söyleyen bir rehberdir.
Ancak, kütüphaneler halka açıkken, Google arama motoru dünyadaki en gizli, sıkı korunan kara kutulardan biridir. Son çeyrek yüzyılda, Google’ın arama bölümünden bu büyüklükte veya ayrıntıda bir sızıntı hiç rapor edilmemiştir.
Google’ın arama motorunun bu API belgelerinde detaylandırılan her şeyi kullandığından ne kadar emin olabiliriz?
Bu yoruma açıktır. Google bunların bazılarını emekliye ayırmış olabilir, diğerlerini sadece testler veya iç projeler için kullanmış olabilir ya da hiç kullanılmayan API özelliklerini bile erişime açmış olabilir.
Ancak, dokümantasyonda kullanımdan kaldırılmış özelliklere referanslar ve diğerlerinin artık kullanılmaması gerektiğini belirten özel notlar bulunmaktadır. Bu, bu tür detaylarla işaretlenmeyenlerin Mart 2024 sızıntısı itibarıyla hala aktif kullanımda olduğunu güçlü bir şekilde göstermektedir.
Ayrıca, Mart sızıntısının bu dokümantasyonun en güncel versiyonu olup olmadığını kesin olarak söyleyemeyiz. API belgelerinde bulabildiğim en son tarih Ağustos 2023'tür:
İlgili metin şöyle diyor:
“Websitesi için alan düzeyinde görünen adı, örneğin google.com için “Google”. Daha fazla ayrıntı için go/site-display-name öğesine bakın. Ağustos 2023 tarihi itibarıyla, bu alan, ek bilgiler içeren host düzeyinde site görüntü adları ile tercih edilmesi nedeniyle info.[AlternativeTitlesResponse].site_display_name_response alanına terk edilmektedir.”
Makul bir okuyucu, belgenin geçen yaz (2023) güncel olduğunu düşünebilir (2023 ve daha önceki yıllarda yapılan diğer değişikliklere referanslar da bulunmaktadır, hatta 2005 yılına kadar uzanan bazıları da var), ve belki de Mart 2024 ifşa tarihine kadar güncel olabileceğini düşünebilir.
Google arama açıkçası yıldan yıla büyük değişiklikler geçiriyor ve son dönemdeki AI Overviews gibi yeni tanıtımlar bu sızıntıda yer almıyor. Bahsi geçen öğelerin hangileri bugün Google’ın sıralama sistemlerinde aktif olarak kullanılıyor? Bu spekülasyona açıktır. Bu hazine, Google dışı mühendisler için tamamen yeni olan birçok ilginç referans içeriyor.
Ancak, okuyucuları bu sızıntıdaki belirli bir API özelliğine işaret ederek “BAKIN! Bu, Google’ın sıralamalarında XYZ kullanıyor olduğunun kanıtı!” dememeye teşvik ederim. Bu kesin kanıt değil. Patent başvurularından veya Googler'ın kamu açıklamalarından daha güçlü bir işaret olsa da, hala bir garanti değil.
Bununla birlikte, geçen yılki DOJ davasında Google yöneticilerinin tanıklık ettiği zamandan beri ortaya çıkan en kesin kanıt kadar yakın olduğunu söyleyebilirim. Ayrıca, o tanıklığa dair birçok nokta belge sızıntısında doğrulanmış ve genişletilmiş durumda, Mike'ın yazısında detaylandırdığı gibi.
Veri Deposu Sızıntısından Ne Öğrenebiliriz?
Bu devasa dosya setinden yıllar boyunca ilginç ve pazarlama uygulamasına yönelik içgörülerin kazanılması bekleniyor. Sadece bir hafta sonu süren göz atmanın kapsamlı bir şekilde ortaya çıkarabileceği veya yaklaşabileceği bir sonuç kümesini ortaya çıkarmak için çok büyük ve yoğun olduğunu düşünmek saflık olur.
Ancak, gözden geçirmemde bulduğum en ilginç beş keşfi paylaşacağım; bazıları Google'ın uzun zamandır yapıyor olduğu varsayılan şeylere yeni ışık tutarken, diğerleri şirketin kamu açıklamalarının (özellikle "ne topladıkları" konusundaki açıklamalarının) yanlış olduğunu öne sürüyor. Google'ın geçmişte çalışmalarıma yönelik saldırılarını dikkate alarak, bu belgelerle Googlers'ın ne dediği ile bu belgenin ima ettiği şeyleri yan yana göstermek sıkıcı olabilir ve kişisel bir yaklaşım olarak algılanabilir, bu yüzden bunu yapmayacağım. Ayrıca, Mike bu konuda yazısında harika bir iş çıkardı.
Bunun yerine, gözden geçirebildiğim modüllerin tümünden çıkarılan ilginç ve/veya faydalı içgörülere odaklanacağım, Mike'ın sızıntı hakkındaki yazısına ve Google hakkında bildiğimiz diğer gerçeklerle nasıl birleştiğine dair çıkarımlarımı paylaşacağım.
#1: Navboost ve Tıklamaların Kullanımı, Tıklama Oranı (CTR), Uzun vs. Kısa Tıklamalar ve Kullanıcı Verileri
Belgelerdeki birkaç modül, "goodClicks," "badClicks," "lastLongestClicks," impressions, squashed, unsquashed ve unicorn clicks gibi özelliklere atıfta bulunur. Bu özellikler Navboost ve Glue ile ilişkilendirilmiştir, Google'ın DOJ tanıklığı inceleyen kişiler için tanıdık olabilecek kelimelerdir. İşte DOJ avukatı Kenneth Dintzer'ın Arama Kalite ekibinin Başkan Yardımcısı Pandu Nayak'a sorgulamasından ilgili bir alıntı:
S. Navboost 2005'e kadar uzanıyor, öyle değil mi?
C. Evet, o civarlarda. Belki de daha önce.
S. Güncellenmiş. Eskisi gibi değil mi navboost?
C. Hayır.
S. Diğeri de Glue, değil mi?
C. Glue, sayfada bulunan diğer tüm özellikleri içeren navboost için başka bir isim.
S. Tamam. Web sonuçlarında navboost işliyor, değil mi?
C. Evet.
S. Ve Glue, web sonuçları dışında sayfadaki diğer her şeyi yapıyor, değil mi?
C. Doğru.
S. Birlikte, sonunda SERP'imize çıkan şeyleri bulmaya ve sıralamaya yardımcı oluyorlar, değil mi?
C. Doğru. Her ikisi de bu sinyallerdir, evet.
Bu API belgelerini bilen bir okuyucu, bu belgelerin Nayak'ın ifadesini desteklediğini ve Google'ın site kalitesi patentleriyle uyumlu olduğunu bulacaktır:
Kalite Navboost Veri modülü Navboost Veri'nin Coğrafi Bölümlemesi Navboost'ta Tıklamaların Sinyalleri Veri Yaşlandırma İzlenimleri ve tıklamaları Google'ın sıralama sistemlerinde saymak istemedikleri tıklamaları filtreleme ve saymak istedikleri tıklamaları içerme yöntemleri olduğu görünmektedir. Ayrıca, tıklamaların süresini (yani pogo-sticking - bir arama yapanın bir sonuca tıkladıktan sonra hızla geri tuşuna basması, bulduğu cevaptan memnun olmaması) ve izlenimleri ölçtükleri görünmektedir.
Google'ın tıklama verilerini nasıl kullandığı hakkında zaten birçok şey yazılmış olduğundan, bu noktayı uzatmayacağım. Önemli olan, Google'ın bu ölçüm için özellikler adlandırdığı ve açıkladığıdır, bu da kanıtlar yığınına daha da fazla kanıt ekler.
#2: Chrome Tarayıcı Tıklama Akışlarının Google Arama'yı Güçlendirmek İçin Kullanımı
Anonim kaynağım, Google'ın 2005 yılında internet kullanıcılarının tam tıklama akışını istediğini iddia etti ve Chrome ile bunu şimdi elde ettiklerini belirtti. API belgeleri, Google'ın hem bireysel sayfalarla hem de tüm alanlarla ilgili olarak kullanılabilecek çeşitli metrikleri hesapladığını gösteriyor.
Özellikle, Google'ın Site Bağlantıları oluşturduğu süreci tanımlayan bu belge ilginçtir. Belge, "topUrl" olarak adlandırılan bir çağrıyı sergiliyor, bu da "chrome_trans_clicks" olarak adlandırılan en yüksek iki seviye puanına sahip en üst URL'lerin bir listesi. Benim anlayışıma göre, Google muhtemelen Chrome tarayıcılarındaki sayfa tıklamalarının sayısını kullanarak sitenin en popüler/önemli URL'lerini belirler ve bu URL'ler Site Bağlantıları özelliğine dahil etme hesaplamasında kullanılır.
Yukarıdaki ekran görüntüsünde, Google'ın sonuçlarından "Fiyatlandırma," "Blog" ve "Giriş" gibi sayfalar en çok ziyaret edilenlerimizdir ve Google bunu milyarlarca Chrome kullanıcısının tıklama akışlarını takip ederek bilmektedir.
Kalite NSR Veri modülü
Video İçerik Arama modülü
Kalite Site Haritası modülü
#3: Seyahat, Covid ve Politika Alanlarında Beyaz Listeler
"İyi Kaliteli Seyahat Siteleri" üzerine bir modül, Google'ın seyahat sektöründe bir beyaz listesi bulunduğu sonucuna varılmasını sağlar (bu, yalnızca Google'ın "Seyahat" arama sekmesi için mi, yoksa daha geniş web araması için mi olduğu net değil). "isCovidLocalAuthority" ve "isElectionAuthority" gibi çeşitli yerlerdeki işaretlemeler, Google'ın özellikle tartışmalı veya potansiyel sorunlu sorgular için belirli alan adlarını beyaz listeye aldığını önermektedir.
Örneğin, 2020 ABD Başkanlık seçimlerinden sonra bir aday, seçimin çalındığı iddiasında bulunarak takipçilerine başkente saldırıp yasama organlarına karşı şiddet içeren eylemler yapmalarını teşvik etti.
Google, bu olay hakkında bilgi almak için insanların muhtemelen ilk başvuracağı yerlerden biri olacaktı ve eğer arama motorları yanlışlıkla seçim kanıtlarını yanlış bir şekilde yansıtan propaganda web sitelerini döndürseydi, bu doğrudan daha fazla anlaşmazlığa, şiddete veya hatta ABD demokrasisinin sonuna yol açabilirdi. Özgür ve adil seçimlerin devam etmesini isteyenler olarak, Google'ın mühendislerinin bu durumda beyaz listeler kullanmasının çok değerli olduğunu düşünmeliyiz.
Kalite NSR Veri Özellikleri
Müzik Filtreleri için Asistan API Ayarları
Video İçerik Arama Sorgu Özellikleri
İyi Kaliteli Seyahat Siteleri Veri modülü
#4: Kalite Derecelendirici Geri Bildirimlerinin Kullanılması
Google uzun süredir EWOK adlı bir kalite derecelendirme platformuna sahiptir (SEO alanında önemli bir lider olan Cyrus Shepard, bu platforma birkaç yıl katkıda bulunmuş ve burada yazmıştır). Şimdi elimizde kalite derecelendiricilerden gelen bazı unsurların arama sistemlerinde kullanıldığına dair kanıtlar var.
Bu derecelendirici tabanlı sinyallerin ne kadar etkili olduğu ve tam olarak ne için kullanıldığı, ilk okumamda bana belirsiz görünüyor, ancak bazı dikkatli SEO dedektiflerinin sızıntıyı inceleyip daha fazla bilgi edinip yayınlamalarını bekliyorum. Beni büyüleyen şey, EWOK'un kalite derecelendiricileri tarafından üretilen puanların ve verilerin doğrudan Google'ın arama sistemlerinde kullanılması olabilir, yalnızca deneyler için bir eğitim seti olarak değil. Tabii ki, bunların sadece testler için olabileceği ihtimali var, ancak sızıntı belgelerini gözden geçirdikçe, bu durum doğru olduğunda notlarda ve modül detaylarında özellikle belirtiliyor.
Bu belge, EWOK aracılığıyla yapılan değerlendirmelerden elde edilen "belgeye özgü ilgili derecelendirme"yi açıklıyor. Detaylı bir not bulunmasa da, web sitelerinin insan değerlendirmelerinin ne kadar önemli olabileceğini hayal etmek zor değil.
Bu belge, "İnsan Derecelendirmeleri (örneğin, EWOK derecelendirmeleri)"ni vurguluyor ve bunların "genellikle yalnızca değerlendirme borularında yer aldığını" belirtiyor, bu da bu modülde bunların genellikle eğitim verisi olabileceğini gösteriyor (bu rolün hala son derece önemli olduğunu savunurum ve pazarlamacıların kalite derecelendiricilerinin web sitelerini nasıl algıladığını ve derecelendirdiğini göz ardı etmemeleri gerektiğini düşünüyorum).
Webref İfade Derecelendirmeleri modülü
Webref Görev Veri modülü
Belge Düzeyi İlgili Derecelendirme modülü
Webref Belgeye Özgü İlgili Derecelendirme modülü
Webref Varlık Birleştirme
#5: Google Bağlantıları Sıralamalarda Nasıl Ağırlıklandıracağını Belirlemek İçin Tıklama Verilerini Kullanıyor
Google'ın bağlantı dizinlerini sınıflandırmak için üç seviye/bucket (düzey) kullanması ilginç bir konudur (düşük, orta, yüksek kalite). Bir belgenin hangi bağlantı grafik dizin seviyesine ait olduğunu belirlemek için tıklama verileri kullanılır. Kaynak Türü (SourceType) burada ve Toplam Tıklama (TotalClicks) burada gösterilmiştir."
Özetle:
- Eğer Forbes.com/Cats/ adlı sayfa hiç tıklama almazsa düşük kalite dizinine girer ve bağlantı dikkate alınmaz.
- Forbes.com/Dogs/ adlı sayfa ise doğrulanabilir cihazlardan (önceki Chrome ile ilgili verilerden bahsedilenler) yüksek tıklama hacmine sahipse, yüksek kalite dizinine girer ve bağlantı sıralama sinyallerini geçirir.
- Bağlantı daha yüksek düzey dizine ait olduğu için "güvenilir" olarak kabul edildiğinde, PageRank ve bağlantı metinleri akışı sağlanabilir veya bağlantı spam sistemleri tarafından filtrelenip düşürülebilir. Düşük kalite bağlantı dizininden gelen bağlantılar bir sitenin sıralamasına zarar vermez; sadece dikkate alınmazlar.
Organik Arama Trafiğiyle İlgilenen Pazarlamacılar için Büyük Resim Çıkarımları
Eğer Google'ın nasıl çalıştığına dair teknik detaylarla çok ilgilenmiyor, ancak organik arama trafiğinin değerine stratejik olarak önem veriyorsanız, bu bölüm sizin için. Bu bölüm, 2005-2023 dönemini kapsayan bu sızıntıdan çıkarılabilecek pek çok şeyi özetleme girişimimdir ve yalnızca sızıntının onaylanmış unsurlarıyla sınırlı kalmayacağım.
Marka Her Şeyden Daha Önemlidir
Google, varlıkları tanımlamak, sıralamak, filtrelemek ve kullanmak için birçok yola sahiptir. Varlıklar markaları (marka adları, resmi web siteleri, ilişkili sosyal medya hesapları vb.) içerir ve Datos ile yaptığımız tıklama akışı araştırmalarında gördüğümüz gibi, Google, web'de büyük, güçlü markalara öncelik tanıma ve trafik gönderme yolunda sürekli ilerlemektedir.
Eğer organik arama sıralamalarınızı ve trafiğinizi genel olarak iyileştirmeyi amaçlayan bir pazarlamacı olarak tek bir evrensel tavsiyem olsaydı, şunu söylerdim: “Google aramasının dışında, kendi alanınızda tanınmış, popüler, iyi bilinen bir marka oluşturun.”
Deneyim, Uzmanlık, Yetkinlik ve Güvenilirlik (“E-E-A-T”) Bazı SEO'cuların Düşündüğü Kadar Doğrudan Önemli Olmayabilir
Sızıntıda şu ana kadar bulduğumuz tek konu uzmanlığına dair referans, Google Haritalar inceleme katkıları hakkındaki kısa bir nottur. E-E-A-T'nin diğer yönleri ya gömülmüş, dolaylı, tanımlanması zor yollarla etiketlenmiş ya da daha olası olarak (bence) Google'ın kullandığı ve önemsediği şeylerle ilişkili, ancak sıralama sistemlerinin belirli unsurları değildir.
Mike'in makalesinde belirttiği gibi, sızıntıda Google'ın yazarları tanımlayabildiğini ve onları sistemde varlık olarak ele aldığını öne süren belgeler bulunmaktadır. Bir yazar olarak çevrimiçi etkisini artırmak, Google'da sıralama avantajları sağlayabilir. Ancak sıralama sistemlerinde "E-E-A-T"yi oluşturan şeylerin tam olarak ne olduğu ve bu unsurların ne kadar güçlü olduğu açık bir sorudur. E-E-A-T'nin %80'inin propaganda, %20'sinin ise öz olduğunu düşünüyorum. HouseFresh'in yakın zamanda yayımlanan viral makalesinde ayrıntılı olarak belirttiği gibi, Google'da son derece iyi sıralanan ve çok az deneyim, uzmanlık, yetkinlik veya güvenilirlik barındıran birçok güçlü marka bulunmaktadır.
Kullanıcı Niyeti ve Bu Niyetin Yarattığı Desenler Olduğunda İçerik ve Bağlantılar İkincil Öneme Sahiptir
Diyelim ki, örneğin, Seattle bölgesindeki birçok kişi "Lehman Brothers" için arama yapıyor ve sayfa 2, 3 veya 4'e kadar kaydırıyor, ardından Lehman Brother sahne prodüksiyonu için tiyatro listesini buluyor ve bu sonuca tıklıyor. Google hızla, bu kelimeler için arama yapanların o bölgede ne istediğini öğrenir.
2008 mali krizde Lehman Brothers'ın rolü hakkındaki Wikipedia makalesi, bağlantı kurma ve içerik optimizasyonuna ağır yatırım yapsa bile, Seattle'ın tiyatroya gitmek isteyenlerinin kullanıcı niyet sinyallerini (sorgulardan ve tıklamalardan hesaplanmış) aşması olası değildir.
Bu örneği daha geniş web ve arama geneline yayarak, hedeflediğiniz bölgelerde yeterli olasılıktaki arayıcılar arasında web sitenize talep yaratabilirseniz, klasik sayfa içi ve sayfa dışı SEO sinyalleri olan bağlantılar, bağlantı metni, optimize edilmiş içerik ve benzerlerine olan ihtiyacı atlatabilirsiniz. Navboost'un gücü ve kullanıcı niyetleri muhtemelen Google'ın sistemlerinde en güçlü sıralama faktörüdür. Google Başkan Yardımcısı Alexander Grushetsky, 2019'da diğer Google yöneticilerine (Danny Sullivan ve Pandu Nayak da dahil olmak üzere) gönderdiği bir e-postada şöyle demiştir:
“Zaten biliyoruz, bir sinyal, belirli bir metrikte tüm büyük sistemden daha güçlü olabilir. Örneğin, NavBoost'un tek başına tıklamalar üzerinde (ve muhtemelen doğruluk / fayda metriklerinde) geri kalan sıralamadan daha olumlu olduğundan oldukça eminim (Bu arada, Navboost ekibi dışındaki mühendisler de Navboost'un gücünden ve "zaferleri çalıyor" olmasından memnun değillerdi)"
Daha fazla onay arayanlar, Google mühendisi Paul Haahr'ın ayrıntılı özgeçmişini inceleyebilirler, burada şunları belirtir:
“Günlük tabanlı sıralama projelerinin yöneticisiyim. Ekibin çabaları şu anda dört alana bölünmüş durumda: 1) Navboost. Bu zaten Google'ın en güçlü sıralama sinyallerinden biridir. Mevcut çalışmalar, yeni navboost verilerinin otomasyonuna odaklanmıştır;”
Klasik Sıralama Faktörleri: PageRank, Bağlantı Metinleri (Bağlantı Metninin Konusal PageRank'i) ve Metin Eşleştirme Yıllardır Önemini Yitiriyor. Ancak Sayfa Başlıkları Hala Oldukça Önemli.
Mike'in mükemmel analizinden elde ettiğim bir bulguyu burada çağırmamak aptalca olur. PageRank hala arama indeksleme ve sıralamada bir yere sahip gibi görünüyor, ancak neredeyse kesinlikle 1998 tarihli orijinal makaleden evrim geçirmiştir. Belge sızıntısı, birden fazla PageRank sürümünün (rawPagerank, "en yakın tohumlara" atıfta bulunan eski PageRank, belgenin ilk kez sunulduğu zamandan itibaren firstCoveragePageRank, vb.) oluşturulduğunu ve yıllar içinde terk edildiğini ima ediyor. Ve bağlantı metinleri, sızıntıda mevcut olsa da, önceki SEO yıllarımda beklediğim kadar önemli veya yaygın görünmüyor.
Çoğu Küçük ve Orta Ölçekli İşletme ve Yeni Yaratıcı/Yayınevleri için SEO, Güvenilirlik, Yönlendirme Talebi ve Güçlü Bir İtibar Oluşturana Kadar Muhtemelen Zayıf Getiriler Gösterecektir.
SEO, büyük markalar ve popüler alan adlarının oyunudur. Bir girişimci olarak, SEO'yu göz ardı etmiyorum, ancak önümüzdeki yıllar boyunca, SparkToro endüstrisinde çok daha büyük, daha popüler, daha fazla aranan ve tıklanan bir marka haline gelmedikçe, bu web sitesinin, kendi orijinal içeriği için bile, 10 yıldan fazla süredir var olan toplayıcılar ve yayınevleri tarafından geride bırakılmaya devam edeceğini güçlü bir şekilde düşünüyorum.
Bu, diğer yaratıcılar, yayınevleri ve KOBİ'ler için neredeyse kesinlikle geçerlidir. Büyük, popüler web siteleri ve iyi bilinen markalarla rekabet varsa, oluşturduğunuz içerik Google'da iyi performans göstermesi olası değildir. Google artık tüm doğru numaraları bilen, kurnaz, akıllı, SEO meraklısı operatörleri ödüllendirmiyor. Tanınmış markaları, arama ölçülebilir popülerlik biçimlerini ve arayıcıların zaten bildiği ve tıkladığı yerleşik alan adlarını ödüllendiriyor. 1998-2018 (veya öylesine) yılları arasında, SEO ile Google için güçlü bir pazarlama döngüsü başlatmak makul bir şekilde mümkündü. 2024'te bunun gerçekçi olduğunu düşünmüyorum, en azından İngilizce web'de rekabetçi sektörlerde değil.
Arama Endüstrisi İçin Sonraki Adımlar
Bu sızıntıyı analiz etmek için daha güncel deneyime ve derin teknik bilgiye sahip uygulayıcıların nasıl bir yol izleyeceğini görmek beni heyecanlandırıyor. Merak eden herkesi, bu belgeleri incelemeye, diğer kamuya açık belgeler, açıklamalar, ifadeler ve sıralama deneyleriyle bağlantı kurmaya çalışmaya ve ardından bulgularını yayımlamaya teşvik ediyorum.
Tarihsel olarak, arama endüstrisindeki en gürültülü seslerden ve en üretken yayımlardan bazıları, Google’ın kamuya açık açıklamalarını eleştirel bir şekilde tekrar etmekten memnun olmuştur. "Google XYZ'nin doğru olduğunu söylüyor" gibi başlıklar yazmak yerine, "Google XYZ İddia Ediyor; Kanıtlar Aksi Yönde" demek daha uygun olabilir.
Önerilen Adımlar:
- Dokümantasyonu İnceleyin: Sızdırılan belgeleri detaylı bir şekilde analiz edin. Bu belgeler, Google’ın sıralama algoritmalarının nasıl çalıştığına dair önemli ipuçları içerebilir.
- Diğer Kamuya Açık Belgelerle Karşılaştırın: Google’ın patentleri, akademik makaleleri, blog yazıları ve resmi açıklamaları ile sızdırılan belgeleri karşılaştırın.
- Deneyler ve Testler Yapın: Google’ın sıralama sistemlerini anlamak için kendi SEO deneylerinizi ve testlerinizi gerçekleştirin. Bu, teorilerinizi doğrulamak veya yanlışlamak için pratik bir yol sağlar.
- Bulgu ve Analizlerinizi Yayınlayın: Elde ettiğiniz bulguları ve analizleri kamuoyuyla paylaşın. Bu, endüstrideki diğer profesyonellerin de bu bilgiden faydalanmasını sağlayacaktır.
- Google’ın İddialarını Eleştirel Bir Gözle Değerlendirin: Google’ın açıklamalarını sorgulayın ve elde edilen kanıtlarla karşılaştırın. Bu, daha şeffaf ve doğruluğu yüksek bilgiler elde etmenize yardımcı olabilir.
Sonuç
Bu sızıntı, arama motoru optimizasyonu (SEO) ve dijital pazarlama alanında çalışan profesyoneller için büyük bir fırsat sunuyor. Google’ın arama algoritmalarının nasıl çalıştığını daha iyi anlamak, stratejilerinizi daha etkili hale getirebilir. Ancak, bu bilgiyi kullanırken dikkatli olunmalı ve etik kurallar da göz önünde bulundurulmalıdır. Google’ın algoritmaları sürekli olarak güncellenmekte ve değişmektedir, bu yüzden mevcut bilgilere dayanarak stratejiler oluştururken esnek ve uyumlu olmalısınız.
harikaaa 🔥🔥🔥🔥
YanıtlaSilçakkall google 🤔
YanıtlaSilçok bilgilendirici azdım
YanıtlaSilefsanseghhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh azdım
YanıtlaSil