SiteMap co to slovíčko vlastně znamená a k čemu je to vůbec dobré? Pro začínající tvůrce webu je toto slovo úplně neznámé a bohužel i pro některé pokročilejší tvůrce. jedni říkají, že na sitemap nezáleží jiní zase že dosti. Ale napřed řeknu k čemu sitemap vůbec slouží. Sitemap je taková mapa pro vyhledávače, aby se snadněji zorientovali na vašem webu. Když vyhledávač přijde na váš web a začne indexovat prochází všechny stránky postupně jak na sebe odkazují. Ale ne vždy na všechny stránky narazí a pokud ano, tak jim třeba nedává takovou váhu, jakou by jste si přáli. Také, když vyhledávač prochází váš web již po několikáté, neví hned, jaká stránka je nová. A poslední věcí je, že vyhledávače neví, jak často mají váš web navštěvovat.

Od toho tu je však sitemap.xml, tento soubor pomůže vyhledávači jednak rychleji projít všechny vaše stránky, jelikož mu dáte seznam těchto stránek. Také mu řeknete jak často se daná stránka aktualizuje, jakou stránce přikládáte prioritu a na víc, která stránka je nová a že ji má co nejdříve zaindexovat.

Pojďme se tedy podívat na to jak vůbec takový soubor sitemap.xml vypadá a jaká má omezení.

<?xml version=“1.0″ encoding=“UTF-8″?>
<urlset xmlns=“http://www.google.com/schemas/sitemap/0.84″>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&amp;desc=prague</loc>
</url>
</urlset>

Soubor sitemap.xml má jen tři povinné parametry z možných 6. Každý element je párový. Což znamená, že parametrem, kterým se začíná se i končí, ale musí se ještě přidat zpětné lomítko. (např. <url> </url>)

První element, je <urlset> </urlset> – tento element je nejvyšší úrovně a uzavírá vše do jednoho celku.

Následuje <url> </url> – do tohoto elementu se uzavírají informace o každé stránce zvlášť.

Element <loc> </loc> – obsahuje adresu URL dané stránky.

Další element s názvem <lastmod> </lastmod> – obsahuje čas poslední úpravy stránky. Používá se textová hodnota ve formátu podle požadavků Date and time formats . Pro ty, kterým to nic neříká zapisujte datum nejednoduší formou rok-měsíc-den (např. 2013-07-15)

Předposledním elementem je <changefreg> </changefreg> – ten uvádí jak je často odkazovaná stránka měněna. Lze do něj zapsat 7 hodnot.

always – web se mění pokaždé, když k němu prohlížeč přistoupí

hourly – každou hodinu

daily – každý den

weekly – týdně

monthly – měsíčně

yearly – ročně

never – nikdy

Poslední element je <priority> </priority> – tento element udává váhu stránky vůči ostatním stránkám webu. Má velikost od 0.0 až 1.0 – čím větší číslo tím větší priorita. Tato priorita nemá vliv na pořadí stránky ve vyhledávání. Automatická hodnota, když není tento element zadán je 0.5. Nemá smysl všem stránkám dávat stejnou hodnotu.

Teď, když jsme si vysvětlili složení sitemap.xml, tak bych měl ještě říci jaká jsou omezení. Jsou jen dvě omezení, soubor nesmí obsahovat více jak 50 000 řádků a nesmí mít více jak 10 Mb. Těchto hodnot není těžké dosáhnout. Jak tedy tento problém řešit, je to snadné vytvoří se několik sitemap najednou a složí se do jedné pomocí hlavní sitemap_index.xml.

<?xml version=“1.0″ encoding=“UTF-8″?>
<sitemapindex xmlns=“http://www.google.com/schemas/sitemap/0.84″>
<sitemap>
<loc>http://www.example.com/sitemap-1.xml</loc>
<lastmod>2005-06-14T13:50:00+01:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap-2.xml</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>

Ten je podobný až na to, že elementy <url> a <urlset> jsou nahrazeny <sitemap> (za <url>) a <sitemapindex> (za <urlset> ).

Teď, když jsme si vysvětlily, jak tvořit sitemap a jak je složit dohromady, podíváme se na nástroje, které nám pomohou vytvořit sitemap automaticky. Všechny tyto nástroje vytváří sitemap podle procházení webu, proto také vytvoření takovéto sitemap trvá delší dobu. Většina aplikací je také online a některé se dají nainstalovat přímo do počítače (těmi se zabývat nebudu). ty online mají většinou omezení na počet stránek v sitemap. A zde je několik online generátorů sitemap. XML-sitemaps.com, FreeSitemap a ten nejvýkonnější WEbSiteMap.

Ovšem nic se nevyrovná tomu, když si vytvoříte svůj sitemap ručně, vše zapíšete tak, jak potřebujete, zatímco tyto generátory vytvoří sitemap v hrubém formátu. Ale pokud využíváte nějaký CMS (redakční systém), jejich souhrn jsem již psal zde, tak je tu ještě jedno dosti dobré řešení a to automatické generování sitemap, podle přesně daných parametrů. Výhodou je snadnost, automatická aktualizace a nastavení parametrů podle potřeby. Nevýhodou je vytížení serveru, při generování sitemap. Jelikož tento web běží na systému wordpress, tak napíši o vytváření sitemap pro tento systém, ale je možné využít pluginy i pro jiné systémy (Joomla, Drupal, atd.)

Pro wordpress je nejlepším pluginem Google XML Sitemap. Když si tento plugin nainstalujete a aktivujete naleznete jej v Menu -> Nastavení -> XML – sitemap . Jelikož je většina komentářů a vysvětlivek přeložena do češtiny není nutné vysvětlovat co kde a jak nastavit. Pro ty, kteří by nevěděli je dobré nechat vše v základním nastavení a vygenerovat první sitemap. Poté se již program postará o všechno sám.

Pokud ovšem chcete, aby google zaindexoval váš sitemap.xml rychle, je dobré se přihlásit do Webmaster Tools a tam vložit odkaz na vytvořenou sitemap. Doporučuje se všechny sitemap dávat do hlavního adresáře webu. A je tedy sitemap důležitá a nebo je to ztráta času? Sám za sebe mohu říct, že díky sitemap, mi vyhledávače rychleji indexují web a také lépe chápu jeho strukturu. Proto bych jistě na sitemap nezapomínal a hlavně ne u začínajících webů, o kterých zatím nemají vyhledávače ani ponětí.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Post Navigation