👋 Nový obsah na borekb.cz

Info Tento blog je v "read-only módu" a nový obsah již nebude přibývat. O vývoji píšu na DevBlog.

Google a operátor link? Čtyři mínus

Google hledá dobře, ale nedávno mě celkem překvapilo, jak špatné výsledky dává při použití opertátoru link:. Zkoušel jsem hledat zpětné odkazy na Koskův článek Proč nepoužívám XHTML, který svého času vyvolal odezvu snad na všech domácích blozích.

Google najde pouhopouhých 16 odkazů (z což v reálu znamená 11 odkazů, viz Why do search engines lie?). Hodně odkazů je navíc nerelevantních – ten první odkazuje na conBLOG, druhý na Bobův weblog, vždy však na domovskou stránku místo na konkrétní článek. Výsledky celkem k ničemu.

Co na to Yahoo? Výsledky jsou téměř ideální – na prvních místech se objevují související články Intervalu Proč používám XHTML a Jak používám XHTML, po čemž následují odkazy z české blogosféry. Pravda, některé jsou málo relevantní (odkaz na hlavní stránku blogu místo odkazu na konkrétní příspěvek), ale celkově jsou výsledky velmi uspokojivé. A je jich 503 (48 unikátních).

Pro úplnost ještě MSN Search, které vrací 90 výsledků (ve skutečnosti 36). To je víc než u Googlu, taky relevance je vyšší (na první stránce se zobrazují zmíněné články Proč/Jak používám XHTML), ale zas tak úplná sláva to není (na první stránce se třeba zobrazuje odkaz na domovskou stránku tohoto blogu, což je odkaz zcela na nic).

Resumé? Google nebrat. Při použití operátoru link: dává s přehledem nejhorší výsledky. Nejlepší je naopak Yahoo!, které nejen že vrací výrazně více stránek se zpětnými odkazy, ale i relevance výsledků je daleko vyšší. MSN se pak pohybuje někde mezi, trochu blíž Yahoo! než Googlu.

P.S. Nejedná se o nahodilý výsledek, zkusil jsem vyhledat zpětné odkazy na zdejší článek Proč nemám rád AJAX, který je nebo byl odkazován jen ze dvou míst: z hlavní stránky tohoto blogu a z La Trine (je mi velkou ctí). Google nic, Yahoo!MSN bez problémů.

Zařazeno do kategorií |
sloper (Pá, 2006-02-10 08:36):

Google pri pouziti operatora link do vysledkov nezaraduje stranky s PageRank pod istou hodnotou.

Borek (Pá, 2006-02-10 08:54):

Ano, o tom jsem už taky slyšel, ale problém je v tom, že http://blog.con­verter.cz/?… má menší PageRank než http://interval­.cz/clanek.as­p?… a přesto se první odkaz v Googlu objevuje, zatímco druhý ne.

Hellish (Pá, 2006-02-10 09:38):

Google skutečně nevrací všechny zpětné odkazy, které najde, ale jenom ty, které uzná za „kvalitní“. Co to ovšem přesně znamená nikdo neví a můžeme se jenom dohadovat, že to má hodně společného s PageRankem. Podle mě to ale není jediné kritérium (nemluvě o tom, že PageRank, který ukazuje Google toolbar je zřídka aktualizovaný a v principu i trochu odlišný od PageRanku, který používá Google pro vyhodnocování kvality stránky)

Vilém Málek (Pá, 2006-02-10 10:36):

Velmi pěkná analýza. Ať už Google vybírá odkazy jakkoli, jsou jeho výsledky nesmyslné, a to je podstatné. Mezi SEO specialisty jde o poměrně známou věc, bylo by však dobré ukázat i ostatním, že Google není žádný zázrak a nemá patewnt na dokonalost ;-)

Hellish (Pá, 2006-02-10 11:19):

Vilém Málek – Souhlasím s vámi, že v současné době Google vrací dost nerelevantní výsledky. Nenazýval bych proto ale ostatní vyhledavače dokonalejší. Ostatní prostě vrací vše, co naleznou – to není nic těžkého. Google se však snaží z nalezených odkazů vytáhnout jen ty důležité a výsledky tím udělat kvalitnější. Že se mu to zatím moc nedaří je zcela bez pochyby, ale věřím že ten směr je správný a Google to časem vychytá. Ale je také možné, že se mýlím…

Borek (Pá, 2006-02-10 11:40):

Plně souhlasím s panem Málkem, že vůbec není podstatný algoritmus výběru, ale prezentované výsledky. Ještě bych chápal, že u normálního vyhledávání se Google záměrně snaží schovat podle něj nerelevantní odkazy, ale u operátoru link: mi tato logika není vůbec jasná – cílem je přece ukázat všechny stránky, které na dané URL odkazují, takže jaképak filtrování?!

Vilém Málek (Pá, 2006-02-10 12:08):

2 Hellish: Já ale také nenazývám ostatní vyhledávače dokonalejšími. Jediná věc, kterou bych chtěl, je trošku méně nekritického obdivu ke Google ;–)

Jaro (Pá, 2006-02-10 13:27):

[2] To, aký PageRank Google používa pri vyhodnocovaní spätných odkazov nemôžete vedieť. Prakticky každý nástroj na zisťovanie PageRank-u uvádza odlišné hodnoty.

Ja osobne si myslím, že Google nezobrazuje všetky spätné odkazy z obavy pred neprirodzeným ovplyvňovaním výsledkov vyhľadávania a ochrany know-how.

Tiež je možné, že majú vo svojich databázach obrovský zmätok :)

JersyWoo (Pá, 2006-02-10 15:27):

Někdy před x-tou dobou se psalo, že by se neměly zobrazovat výsledky s GTPR méně než 4. GTPR se prý aktualizuje jednou za cca 3 měsíce jako výsledek po google dance, ale je tam časové spoždění. Zároveň by tam měl být faktor „kvalitních“ linků podle vzájemnosti množin klíčových slov v odkazech a odkazujících stránek, včetně odchozích odkazů z těch webů.

Borek (Pá, 2006-02-10 17:41):

JersyWoo: A jakou to má logiku? Zpětné odkazy na dané URL jsou nějakou množinou a operátorem link: projevuji přání tuto množinu zobrazit. Zde je citace z nápovědy:

The query link:siteURL shows you pages that point to that URL. For example, link:www.google.com will show you pages that point to Google's home page.

Nikde ani zmínka o tom, že by měl hrát roli PageRank. Ale především mi není jasné, proč by ji měl hrát.

[…] Není to poprvé, co Google ve vyhledávání za svými konkurenty výrazně zaostává, viz třeba Google a operátor link? Čtyři mínus. Asi není reálně možné, aby se každá nová informace objevila v indexu během několika minut nebo hodin, ale zaslechl jsem, že MSN do výsledků vyhledávání novinek šikovně integruje prohledávání blogů, které je výrazně rychlejší. Je na čase, aby to začali dělat i konkurenti. […]

Tathata (So, 2009-10-31 16:36):

No nevím, jestli je to zrovna chyba… Zajímavý článek o téhle problematice je zde: Proč Google vidí méně zpětných odkazů než Yahoo?

Nikola (St, 2011-06-22 20:35):

Pěkný článek, myslím že je na tom něco pravdy.

Komentáře jsou uzavřeny (blog je v read-only módu). Pokud mě chcete kontaktovat, můžete mailem.