Alle pagina”s die worden bezocht door de googlebot worden opgenomen in de database van Google. Dit uiteraard met uitzondering van pagina’s die door middel van de robots.txt of noindex tag uitgesloten worden.
In de database van Google komen is 1 ding en relatief eenvoudig, zorg voor een link naar die pagina en na voorloop van tijd is de klus geklaard. Echter, eenmaal in de database moet de pagina ook verschijnen op de zoekresultaten pagina (Search Engine Results Page – SERP) liefst op nummer 1 of anders minstens bij de top 10. Of en voor welke zoekwoorden ( trefwoorden) een pagina op de resultaten pagina verschijnt, wordt bepaald door de geheime algoritmes van Google. Over deze algoritmes bestaat veel speculatie en mystiek. Van tijd tot tijd worden de algoritmes aangepast wat tot een verschuiving van pagina’s in de zoekresultaten leidt. In Maart 2004 leidde een verandering bij google tot een fenomeen dat bekend staat als de Google Sandbox, letterlijk vertaald de Google Zandbak of misschien beter het Google Putje of de Google Wachtkamer.
Als een nieuwe pagina in de google database wordt opgenomen zal deze vroeger of later in de zoekresultaten verschijnen. Vaak scoren nieuwe pagina”s (tijdelijk) heel goed. Het blijkt echter dat nieuwe pagina”s slecht scoren op “dure” trefwoorden waarvoor veel competitie is. Hoewel de pagina in de database voorkomt, en goed scoort voor “goedkope” trefwoorden scoort de pagina slecht op andere trefwoorden waarvoor meer competitie is hoewel je op basis van vergelijkbare pagina”s een betere score zou verwachten. Na verloop van tijd klimt de pagina op die trefwoorden dan langzaam omhoog om uiteindelijk wel goed te scoren. Naar zeggen kan dit 2 tot 6 maanden duren.
De meningen over het Sandbox effect zijn verdeelt, sommige zijn van mening dat het effect een bewust onderdeel is van het google algoritme, anderen gaan ervan uit dat het verschijnsel een bijwerking is van het algoritme in zijn geheel en niet specifiek. Sowieso is elke stelling over vermeend gedrag van google speculatie!
Waarom zou google sites in de wachtkamer zetten?
Gevonden worden in google is voor sites van groot commercieel belang. Het verschil tussen een nummer 5 en een nummer 50 positie kan honderden bezoekers per dag schelen. Daarom worden door webmasters en zoekmachine-optimalisatie-specialisten (!) allerhande trucks uitgehaald om sites hoog te laten scoren op bepaalde trefwoorden. In sommige gevallen wordt de zoekmachine hierdoor vervuilt met paginas de hoog scoren op trefwoorden maar die eigenlijk en hoge score op die trefwoorden niet verdienen, er wordt dan gesproken over zoekmachine spam. Na ontdekking worden de paginas uit google verwijdert, de webmaster zal een nieuwe site opbouwen weer de zoekmachine spammen etc etc. Om dit te voorkomen is het interessant om sites voor dure trefwoorden eerst een tijdje in de wachtkamer te zetten, het spammen heeft zo weinig zin en de circel is doorbroken.
En Toch
Is er ook een eenvoudige verklaring voor het effect te geven Stel een nieuwe pagina krijgt een bonus en wordt door google automatisch bij de eerste 1% van zoekresultaten geplaatst, dit om pagina een kans te geven zich te bewijzen. Als er 1000 resultaten zijn voor een combinatie van trefwoorden eindigt zo een pagina bij de eerste 10. Als er 100.000 pagina”s zijn bij de eerste 1.000. Als in het eerste geval een positie 3 wordt bereikt, zo dat in het tweede geval een positie ergens tussen de 250 en 350 betekenen. Na verloop van tijd verdwijnt de “nieuwe pagina bonus” en zakt de pagina of verder weg, of stijgt ten gevolge van binnenkomende links en dergelijke.
En Toch
Er is een bijzonder verschijnsel, bij een google op tuin staat mijn tuin wiki ergens op plaats 400. Bij een google op tuin -qwewe -erewre -wqeweq -rrewrt -eewer -qweqw -qacaa -qwewe -erewre -wqeweq -rrewrt -eewer -rrewrt -eewer -qweqw -qacaa -qwewe -erewre -wqeweq -rrewrt -eewer -qweqw -qacaa -qwewe -erewre -wqeweq -rrewrt -eewer -qweqw -qweqw -qacaa -qwewe -erewre -wqeweq -rrewrt -eewer -qweqw -qacaa -qwewe -erewre -wqeweq -rrewrt -eewer -qweqw -qacaa op positie 11 Dat was de stand in maart, ondertussen (juli) is de tuin wiki weer terug richting de 20-30)
Waarbij nog opgemerkt kan worden dat de eerste versie van de tuin wiki op http://wiki.brambring.nl ook op die positie stond. De verhuizing van http://wiki.brambring.nl naar http://www.tuin-wiki.nl is volgens de regels gedaan ( via een 301 header response) en de inhoud is identiek.
Op de een of andere manier wijzigt het algoritme als er een reeks onzinnige – (niet vinden) opdrachten staan. Naar mening van de Google Sandboxaanhangers is de werkelijk positie van de tuin wiki positie 12, en zal deze positie na verloop van tijd bereikt worden.
Bovenstaande zoekresultaten en de truk zijn gedaan op 4/2/05 zouden nu dus andere resultaten kunnen opleveren
De zandbak bestaat niet
In reply to a question from Brett Tabke, Matt Cutts (%blue%medewerker google%%) said that there wasn”t a sandbox, but the algorithm might affect some sites, under some circumstances, in a way that a webmaster would perceive as being sandboxed.
http://www.webmasterworld.com/forum30/32067.htm