Google sitemap(s)

Google is  de absloute nummer 1 op het gebied van zoekmachines. Veel sites zijn voor hun bezoekers afhankelijk van google. Een webmaster heeft twee hier twee problemen:

  1. De pagina”s moeten zo snel en zo volledig mogelijk in de index komen
  2. De pagina”s moeten zo hoog mogelijk scoren in google

Voor het eerste heeft google nu Google Sitemaps geïntroduceerd

In tegenstelling tot de klassieke manier van indexering waar een zoekrobot of spider een site bezoekt en stap voor stap doorzoekt (content pull), kan bij google sitemaps de webmaster een complete index van zijn site aanbieden aan google (content push). Groot voordeel hiervan is dat ook moeilijk toegankelijke pagina’s ( bijvoorbeeld door het gebruik van java of flash) aan google aangeboden kunnen worden. En als de site uitgebreid wordt met een groot aantal nieuwe pagina’s is het nu nog afwachten wanneer de robot alle pagina’s een voor 1 gevonden heeft. Google Sitemap stelt webmasters in staat om de Googlebot, de robot (bot,spider) van Google, middels een op XML bestand te voorzien van alle links van een site. De volledige specificaties zijn te vinden op de site van google, er zijn een drietal mogelijkheden. verder onder staan er twee beschreven: RSS en XML-Sitemaps

Helaas zal het gebruik van google sitemaps niet automatisch leiden tot een betere score in google. Noch is er een garantie dat de aangeboden sitemap gebruikt wordt of dat alle links in de sitemap bezocht worden.

RSS

Inmiddels maakt google geen gebruik meer van RSS feeds. Het gebruik ervan is sowieso sterk afgenomen.

Veel sites, vooral weblogs, beschikken over een RSS feed. Deze xml pagina geeft een overzicht van de laatste wijzigen van een site. De RSS feed kan rechtstreeks aangeboden worden aan google sitemaps. Google sitemaps ondersteund RSS 2.0 en ATOM 3.0

In afwachting van de creatie van een echte XML-Sitemap is het zaak zo snel mogelijk een rss feed bij google te krijgen.

XML-Sitemaps

XML-Sitemaps is een special xml-schema ontwikkeld door google om een sitemap aan te bieden.

Een voordeel van het gebruik van dit xml-schema in plaats van een rss feed is dat een sitemap dan de hele index kan bevatten in plaats van alleen de laatste n wijzigingen zoals bij rss feeds vaak gebruikelijk.

Een wezenlijk verschil en voordeel van google sitemaps vergeleken met een rss-feed is de mogelijkheid aan te geven hoe vaak een pagina gewijzigd wordt ( om het uur, dagelijks, nooit) met de ChangeFreq tag. Bovendien hoe belangrijk de pagina van een site is, met de priority tag, hiermee geef je de relatieve waarde van een pagina aan vergeleken met andere pagina’s met betrekking tot de zoekmachines, een voorbeeld:

pagina Priority ChangeFreq
index.html .4 Always
overzicht1.html .6 Daily
product1.html .5 Weekly
bestelinfo.html .1 Never

Note: De bestelinfo.html pagina is wellicht een zeer belangrijke pagina voor de site maar niet met betrekking tot de zoekmachine.

De priority is een relatief getal per site. Dus alle pagina”s een waarde 1 te geven heeft net zo veel nut als alles op .1 te zetten. De ChangeFreq is alleen een hint voor google, of en hoe ze ervan gebruik maken laten ze in het midden.

Hoe maak je een xml-sitemap bestand.

Veel content management systemen zijn druk bezig om de creatie van een xml-sitemap te integreren in hun product. De generatie is niet bijzonder ingewikkeld en verschilt niet wezenlijk van een rss-feed. wordpress en Movable Type hebben inmiddels een sitemap-feed.

Lastig is wel dat de meeste content management systemen (nog) geen mechanisme hebben om de priority van een pagina aan te geven en niet alle systemen houden bij hoe vaak een pagina gewijzigd is. Met de tijd zullen hier vast fraaie oplossingen voor komen.

Een andere optie is het gebruik van een sitemap generator aangeboden door google. Helaas is deze geschreven in python een taal die niet op alle systemen voorkomt. Er zullen binnenkort wel andere oplossingen komen zo is er al eentje voor windows.

Verdere eisen waaraan het xml bestand moet voldoen vind je op de google-sitemap pagina

Txt

Het schijnt mogelijk te zijn de url ook als tekst bestand aan te bieden. Een URI per regel in UTF-8 formaat.

Het aanbieden van de sitemap

Als er een sitemap gemaakt is kan deze via de google search console aangeboden worden. Hier is dan ook te zien hoe wanneer de sitemap voor het laatst opgehaald is.

Een andere methode is het rechtstreeks aanbieden van de sitemap via een ping. Dit zou je kunnen gebruiken om bij elke update google op de hoogte te stellen. Denk echter niet dat dit zinvol is, eens per dag lijkt een betere keuze.

Het zal niet lang duren voordat cms systemen een google-ping inbouwt hebben

Als er veel links op een website zijn (> 50.000) dan is het nodig de sitemap te splitsen en via een sitemap-map aan te bieden, meer details zijn op de google site te vinden.

In de kleine lettertjes van google sitemaps zit een belangrijk addertje verstopt. De locatie van het rss bestand of de xml-sitemap is van belang, de sitemap moet zich helemaal bovenin de structuur bevinden liefst in de root van de directory structuur: Stel de sitemap is te vinden op: http://www.example.com/pub/sitemap.xml, dan zal http://www.example.com/content/1/index.html niet meegenomen worden !

Zie voor meer voorbeelden de handleiding van google.

Plaats een reactie