Optimalizace webu – Sitemap.xml

  • 5 minut čtení

Podobně jako soubor robots.txt slouží ke komunikaci s roboty i soubor sitemap.xml. S jeho pomocí můžete určit, které stránky a jak často by se měly indexovat . Tímto způsobem lze udržovat obsah webu aktuální a indexovaný.  K tomu, aby webový robot soubor sitemap  našel a zpracoval, je potřeba definovat, kde má hledat. Definici cesty k sitemap.xml vkládejte do souboru robots.txt.

Sitemap, čili mapu webu pro roboty je vhodné využít, například pokud chcete informovat  vyhledávač o stránkách, které dosud nebyly indexovány, nebo může být pro robota obtížné je nalézt.

Sitemap.xml může být dynamicky generovaný. To je vhodné zejména pokud se Vaše stránka (web) často mění. Automatické generování sitemapy zajistí aktuální odkazy ve vyhledávačích. Pokud vytvoříte a odešlete soubor Sitemap, pomůžete tak zajistit, že se Google dozví o všech stránkách vašeho webu, včetně adres URL, které Google neodhalí během obvyklého procesu procházení.

Pro tyto účely je velmi vhodné využít Google nástroje pro správce webu.

google pro správce

Kromě toho můžete pomocí souborů Sitemap poskytnout vyhledávači data o specifických typech obsahu na vašem webu. Mohou to být videa, obrázky, nebo zprávy. Například u videa lze v souboru Sitemap uvést délku, kategorie a informace, zda je video vhodné pro pro danou věkovou kategorii. U obrázků  lze v souboru uvést, co je na obrázku zobrazeno, o jaký typ se jedná, případně pod jakou licencí je poskytován.  Pomocí  aktualizovaného souboru Sitemap můžete poskytnout také další informace o svém webu – například datum poslední změny nebo odhad, jak často se budou jednotlivé stránky měnit.


 

Soubory Sitemap jsou užitečné zejména, pokud:

– Stránky mají dynamický obsah.
– Web obsahuje stránky, které nejsou během procházení robotem snadno zjistitelné – například stránky obsahující multimediální prvky  nebo obrázky.
– Stránky jsou nové. (Prohledávač prochází web pomocí odkazů z jedné stránky na druhou. To znamená, že pokud webové stránky nejsou dobře propojené, může být pro robota obtížné je objevit.)
– Rozsáhlý web, s obsahem, který není dobře propojen, nebo na jednotlivé stránky nevedou žádné odkazy.

Google a Seznam nezaručují, že robot bude procházet a indexovat všechny adresy URL. Údaje z vašeho souboru Sitemap používají roboti především k tomu, aby zjistili strukturu vašich stránek. Ve většině případů je pro správce webu odeslání souboru Sitemap velkým přínosem a je doporučené vždy tento prostředek optimalizace využívat.

 


Jak vytvořit sitemap.xml ručně?

Sitemap.xml je poměrně jednoduchý XML soubor, který obsahuje informace o URL adresách vašeho webu. Uložené informace pomáhají vyhledávačům a jejich robotům lépe procházet strukturu webu. Obecně je sitemap.xml pouhý seznam jednotlivých adres, existují ale i další informace, které můžete do tohoto souboru přidat a vylepšit tím indexování stránek.

Výhodou vytváření sitemapy ručně, je že princip jazyka XML je poměrně jednoduchý.  V první řadě musíte definovat hlavičku dokumentu. Tedy XML deklaraci.


<?xml version=“1.0″ encoding=“UTF-8″?>

Následuje sitemap schéma a obsahový (obalovací)  tag <urlset>

<urlset xmlns=“http://www.sitemaps.org/schemas/sitemap/0.9″>

</urlset>

 


Jednotlivé adresy uvádějte do tagu: <url> adresa </url>


Další informace, které můžete k adrese připojit, jsou například:

Datum a čas poslední úpravy a frekvence změn

Určuje datum (popř. čas) kdy byla stránka naposledy změněna. Zároveň ale můžete zadat jak často se obsah mění.  To je výhodné pro roboty, kteří budou vědět, jak často se na stránku mají vracet a znovu.

 

Například:

<lastmod>2013-01-08</lastmod>

<changefreq>yearly</changefreq>



Priorita stránky

Priorita stránky určuje, které stránky jsou důležitější než ostatní. Toto nastavení nesnižuje pořadí stránky oproti ostatním webům, jen určuje hierarchii uvnitř struktury vašeho webu.

<priority>0.8</priority>

 


 

Příklad jednoduchého Sitemap.xml:


< ?xml version=“1.0″ encoding=“UTF-8″?>

<urlset xmlns=“http://www.sitemaps.org/schemas/sitemap/0.9″>


<url>

<loc> http://www.kurzygrafiky.cz/cenik </loc>

<lastmod>2013-03-12</lastmod>

<changefreq>weekly</changefreq>

<priority>1</priority>

</url>


<url>

<loc>http://www.kurzygrafiky.cz</loc>

<lastmod>2013-03-12</lastmod>

</url>

 

</urlset>

 

Pokud nechcete vytvářet sitemap.xml ručně, můžete využít některou z dostupných online služeb, které vygenerují soubor z již existující struktury webu. Velmi kvalitní nástroj je například http://www.xml-sitemaps.com/.

google pro správce