Indexace a vyhledávače – jak to funguje a proč je dobré to...

Indexace a vyhledávače – jak to funguje a proč je dobré to vědět

Pokud chceme být ve vyhledávačích dobře vidět, měli bychom alespoň zhruba tušit, jak vyhledávače fungují. Díky těmto znalostem totiž můžeme vytvářet weby, které budou mít vyhledávače rádi. Takové weby budou mít šanci se častěji objevovat ve výsledcích vyhledávání. Jak tedy fungují vyhledávače jako Seznam, Google nebo Bing?

Jedna důležitá věc na úvod. Vyhledávač neprochází celý internet v momentě, kdy zadáme do vyhledávače dotaz. To by bylo velmi neefektivní. Buď bychom dostávali špatné a neúplné výsledky, nebo bychom na ně čekali hrozně dlouho. Vyhledávač prochází internet neustále a ukládá si obsah stránek na své disky.

Z uloženého obsahu stránek si vyhledávač vytváří index. Index se dá s trochou nadsázky přirovnat k rejstříku v knize. Index, stejně jako rejstřík, slouží k rychlému vyhledání konkrétního výrazu ve velkém množství dat. V momentě, kdy zadáme dotaz, vyhledávač hledá už jen v datech uložených ve svém indexu. Díky tomu se zobrazí výsledky vyhledávání téměř okamžitě.

Práce vyhledávačů se tedy skládá ze tří základních fází:

  • procházení a ukládání obsahu internetu
  • sestavování indexu
  • zobrazení výsledků

Všechny tyto činnosti se neustále opakují. Nyní se podíváme na každou fázi trochu podrobněji.

Procházení webu – crawler

Tuto část obstarává robot neboli crawler. To je program, který automaticky prochází všechny stránky na internetu a ukládá jejich obsah. Crawler přechází mezi stránkami pomocí odkazů, které vedou z jedné stránky na druhou. Začne tedy na jednom webu, prochází tento web, a když na něm najde odkaz na jiný web, přejde na tento web, který opět prohledává, a po odkazech přechází dále.

Prvním předpokladem je tedy dostat na váš web crawlera. Z podstaty fungování crawlera je jasné, že by na váš web měly vést nějaké odkazy z jiných webů, přes které crawler najde váš web. Crawlera můžeme poslat na svůj web i sami přes formulář, který najdete na Seznamu, Googlu i Bingu. Doporučuji tyto formuláře použít vždy při spouštění nového webu.

Když už crawlera dostanete na svůj web, snažte se mu procházení webu co nejvíce usnadnit. Jak? Třeba jednoduchou strukturou webu a logicky uspořádanou navigací na webu. Web s větším počtem stránek by měl mít soubor sitemap, ve kterém je celá struktura webu přehledně popsána. Tímto souborem usnadníme crawlerovi práci s hledáním všech podstránek webu. Odkaz na tento soubor se vkládá do souboru robots.txt. To je první místo, kam se crawler dívá, když přijde na váš web. V souboru robots.txt můžete také crawlerovi vzkázat, na které části vašeho webu má jít a kam naopak ne.

Indexování

I když váš web navštíví crawler, ještě nemáte vyhráno. Ve výsledcích vyhledávání se začnete objevovat, teprve až vyhledávač zařadí vaše stránky do indexu. To může chvíli trvat a můžete si to snadno ověřit zadání dotazu site:nazevwebu.cz do vyhledávače. Pokud se objeví nějaké výsledky, jste v indexu a podle počtu výsledků zjistíte, kolik stránek z vašeho webu vyhledávač indexuje.

V indexu se zároveň stránky řadí tak, aby se ve výsledcích vyhledávání zobrazovaly stránky seřazené podle relevance a kvality. Vyhledávače samozřejmě chtějí poskytovat svým uživatelům kvalitní výsledky. Kritérií, podle kterých se stránky seřazují, je ohromné množství. Základem je však mít na webu originální obsah, dobře zvládnutou technickou strukturu dokumentu (validita kódu, struktura nadpisů atd.), mít zpětné odkazy z jiných kvalitních webů a vyhnout se zbytečným chybám.

Nejčastější a nejvíce podceňovanou chybou jsou duplicity na webu. Duplicity vznikají tak, že stejný nebo velmi podobný obsah je na více různých adresách. Jak se správně vypořádat s duplicitami, se dočtete v nápovědě Google. Další velmi závažnou a častou chybou je změna URL adresy bez přesměrování.

Zobrazení výsledků

Tady dochází na lámání chleba. Uživatel na stránce vyhledávače zadá do vyhledávacího pole dotaz a objeví se mu stránka s výsledky. Pokud se mezi výsledky objeví váš web, máte téměř vyhráno. Ještě zbývá zaujmout uživatele mezi ostatními stránkami natolik, že si vybere právě tu vaši stránku. A poslední důležitý krok je, že uživatel najde na vaší stránce přesně to, co hledal. Bez této zdánlivé maličkosti je totiž veškerá předešlá snaha zbytečná.

Vyhledávače neustále vylepšují své vyhledávací mechanismy a přidávají různé nové funkce. Základní princip fungování vyhledávačů však zůstává stále stejný a hned tak se nezmění. Díky znalostem o fungování vyhledávačů můžeme tvořit lepší weby, které budou mít rádi lidé i vyhledávače.