Google Analytics wordt door veel mkb’ers gebruikt, maar steeds meer bedrijven vragen zich af of ze niet beter website statistieken in eigen beheer kunnen nemen. De redenen die hiervoor genoemd worden hebben vaak betrekking op de AVG en de problemen dit met zich meebrengt bij het delen met externe partijen.
Google Analytics is al lange tijd de marktleider voor het verzamelen van websitestatistieken voor zowel particulieren als het mkb. Het gemak en de mogelijkheden gecombineerd met het feit dat er niet voor betaald hoeft te worden zorgde ervoor dat ondernemers bij het maken van een website zelden naar alternatieven zochten.
Tegenwoordig krijgen wij steeds meer vragen of deze dienst wel de beste optie is. Vaak wordt er verwezen naar de AVG of willen ondernemers graag om andere redenen volledige controle over de verzamelde gegevens, bij voorbeeld om het beter te kunnen combineren met andere data of via een interne tool de gegevens te kunnen tonen.
Naast Google Analytics bestaan er een groot scala aan andere aanbieders die soortgelijke diensten leveren. Sommige richten zich op algemene meetgegevens zoals Google dat doet, anderen hebben een specifieke niche in hoe en wat er gemeten wordt. In dit artikel zullen wij het alleen hebben over de producten die volledig in eigen beheer opgezet kunnen worden en daardoor gegevens kunnen verzamelen zonder dat deze met derden worden gedeeld. Een deel van deze leveren dezelfde oplossing ook als een cloud dienst.
Ten eerste moet het duidelijk zijn dat er verschillende manieren zijn om statistieken te verzamelen. De meest voorkomende methodes zijn scripts en logbestanden. Bij scripts wordt er een stukje code in de site gebouwd, dit script laat de browser van de bezoeker gegevens sturen. Bij logbestanden wordt er gebruikt gemaakt van de gegevens die automatisch op de onderliggende webserver verzameld worden.
Meten op basis van scripts
Bij het verzamelen van statistieken op basis van scripts wordt er een klein stukje code ingebouwd in de website. Deze code vraagt de browser van de bezoeker om gegevens naar een bepaalde plek te sturen. De code bepaalt welke gegevens worden verzameld en bij welke gebeurtenissen dit moet gebeuren. Een gebeurtenis kan zijn wanneer een pagina wordt geladen, maar ook bij het klikken van een link of knop of het starten van een video.
Het voordeel van deze techniek is dat er rijke data verzameld kan worden. Het is mogelijk om gegevens van de browser te krijgen, waardoor het mogelijk wordt om te zien of een site veel mobiel of juist desktop bezoekers heeft. Ook is het mogelijk om op basis van handelingen van de gebruiker gegevens te meten. Er kunnen daarmee kliks op links of andere delen van pagina’s gemeten worden, of zelfs waar de muis van een bezoeker zich heeft verplaatst. Door gebruik te maken van cookies of soortgelijke technologieën kunnen er ook meerdere bezoeken aan elkaar gekoppeld worden.
Een ander voordeel is dat er geen toegang nodig is tot de webserver zelf. Het wordt daarmee makkelijk om een tracking script toe te voegen in de meeste sites, ook wanneer deze worden gehost binnen een platform van een sitebouwer zoals SquareSpace of Wix.
Er zijn echter ook nadelen. Ten eerste is het nodig dat er een server klaarstaat om de gegevens te verzamelen. Wanneer er gebruik gemaakt wordt van Google Analytics, dan zorgt Google hiervoor. Wanneer er voor een oplossing in eigen beheer wordt gekozen, dan moet er ook enige technische kennis zijn om deze server in te richten en up-to-date te houden.
Afhankelijk van hoe de site gemaakt is kan het inbouwen van het script ook complex zijn. Wanneer alles vanuit een CMS zoals WordPress, Joomla of Drupal komt, dan is het makkelijk om functionaliteit toe te voegen die een script in alle pagina’s invoegt. Voor sites waar onderdelen uit verschillende systemen worden gegenereerd, die losse onderdelen of statische pagina’s hebben is het wel belangrijk om ervoor te zorgen dat het script binnen alle onderdelen geïnstalleerd wordt en vanuit deze ook op dezelfde manier geladen wordt.
Tot slot komt met een script ook een risico op bedoelde of onbedoelde verkeerde metingen. Een script kan door een browser of plug-in geblokkeerd worden, het laden van het script of het doorgeven van de data kan gestopt worden door tijdelijke netwerkstoringen, maar kwaadwillenden kunnen ook ongeldige data sturen. Enkele jaren geleden was dit bij veel gebruikers van Google Analytics het geval, site eigenaren dachten een gestage groei van bezoekers te zien terwijl misschien soms wel een derde van de “bezoeken” spambots waren.
In de lijst van tools hieronder zijn Matomo, Open Web Analytics en Umami voorbeelden die op basis van scripts werken.
Meten op basis van logbestanden
De eerste tools voor website statistieken werkten op basis van logbestanden. De gegevens die standaard door een webserver werden verzameld vormden de basis voor de getoonde statistieken. Deze meetmethode is minder gebruikt. De focus voor de meeste website statistieken is vanuit een marketing oogpunt, en de meer technische gegevens die uit logbestanden komen zijn dan niet altijd toereikend.
Een bijkomende factor is dat er bij het meten van logbestanden standaard alleen gegevens kan meten waarbij er iets van de server is gevraagd. Veel moderne sites hebben grote delen waarbij de site initieel wordt geladen en daarna volledig binnen de browser van de gebruiker werken. Bij dit soort sites is er dus alleen te zien als iemand de site voor het eerst opent, verdere handelingen komen daarin niet terug.
De consequentie is dat metingen op basis van logbestanden vooral worden gebruikt voor de verificatie van het correct werken van een site en server. Wanneer het doel marketinggericht is, dan wordt er vaker gekozen voor metingen op basis van scripts.
Toch zijn er voordelen bij deze methode. Zo is het zeker dat alle bezoeken aan een website gemeten worden. Gegevens die in de logbestanden van een server terecht komen kunnen niet geblokkeerd worden door browsers of plug-ins, en fouten in de scripts van een server kunnen ook niet voor problemen met de metingen zorgen.
Een ander voordeel kan zijn dat er op de server waar de website op staat geen aparte software geïnstalleerd hoeft te worden, en de site zelf ook ongewijzigd kan blijven. Wanneer er met scripts wordt gewerkt moet het script ook op elke pagina geladen worden. Wanneer een site uit verschillende systemen bestaat dan is er een aanzienlijk risico dat delen gemist worden. Bij logbestanden kan deze situatie zich niet voordoen.
Het nadeel is uiteraard dat alleen het opvragen van pagina’s en andere bestanden (zoals afbeeldingen) gemeten kan worden. Wanneer een site zo gemaakt is dat deze alleen een startpagina laadt en alle verdere interactie via scripts verloopt, dan zal dit standaard niet goed gemeten worden door het analyseren van logbestanden.
In de lijst van tools hieronder zijn GoAccess, AWStats en Webalizer voorbeelden die op basis van logbestanden werken.
Andere meetmethoden
Naast scripts en logbestanden kunnen er ook op andere manieren gegevens gemeten worden. Dit wordt echter meestal alleen als aanvulling op de eerdergenoemde methoden gedaan. Bij voorbeeld kan er op basis van de databasegegevens van een website de statistieken verrijkt worden. Wanneer bestellingen of andere conversies in een database worden opgeslagen, dan kunnen deze gegevens vergeleken worden met die uit een andere bron (zoals vanuit script tracking). Door gegevens te combineren en vergelijken kan er een schatting worden gemaakt van het foutpercentage van de methodes. Het wordt hiermee ook mogelijk om blinde vlekken binnen de set-up gevonden worden. Als er bij voorbeeld 10.000 deelnames aan een wedstrijd gemeten zijn vanuit de database (daadwerkelijke inzendingen) en er maar 9.000 gemeten zijn via script tracking, dan kan dit gegeven gebruikt worden om ook andere gegevens van script tracking te analyseren.
Tools
Matomo
Matomo (eerder bekend onder de naam Piwik) is een van de leiders van de self-hosted analytics opties. Waar Matomo sterk op heeft gericht is een tracking script en werking dat zo veel mogelijk overeenkomt met die van Google Analytics om het daarmee ook zo makkelijk mogelijk te maken voor een site-eigenaar of ontwikkelaar om over te stappen. Er zijn ook plug-ins beschikbaar voor de meeste grote content management systemen, zoals WordPress, Joomla en Drupal.
Veel van de rapportages komen ook overeen met die van Google Analytics, zoals die voor bezoekers, paginaweergaven, doelen en funnels. Iemand die bekend is met Google Analytics zal zich dus ook redelijk snel wegwijs kunnen maken binnen het dashboard van Matomo.
Matomo heeft een demo dashboard beschikbaar waar de verschillende rapportages bekeken kunnen worden.
Open Web Analytics
Open Web Analytics positioneert zich net als Matomo als alternatief voor Google Analytics. Ook dit pakket het een tracking script en een dashboard dat veel lijkt op dat van Google Analytics.
Ook Open Web Analytics heeft een demo dashboard beschikbaar waar de verschillende rapportages bekeken kunnen worden.
Umami
Umami biedt een heel simpel dashboard waar enkele kerngegevens worden weergegeven. De focus is duidelijk om gegevens in een oogopslag te presenteren. Het is daarom een goede tool voor gebruikers die snel een overzicht willen kunnen zien en geen behoefte hebben aan meer diepgaande data of complexe analyses.
Umami heeft een demo dashboard beschikbaar.
Aurora
Aurora heeft net als Umami een eenvoudig dashboard, maar gaat hier nog verder in. Waar Umami nog rapporten heeft waar naartoe doorgeklikt kan worden beperkt Aurora het tot het overzicht. Een hoofddoel van dit product is om alleen volledig geanonimiseerde data weer te geven. Het feit dat Aurora pas in juni 2021 een versie 1.0 uitbracht speelt hier uiteraard in mee.
Aurora heeft een demo dashboard beschikbaar.
GoAccess
Een iets nieuwere tool die steeds meer aandacht krijgt is GoAccess. GoAccess verwerkt standaard logbestanden van webservers om gegevens over bezoek op de site weer te geven. Ondanks het feit dat GoAccess zonder scripts werkt, hebben de ontwikkelaars een uitgebreid dashboard weten te maken waarin veel nuttige informatie in weer wordt gegeven. Zo wordt na het aantal bezoekers ook meteen statistieken over bij voorbeeld de bezoekduur weergegeven.
GoAccess heeft een demo dashboard beschikbaar.
AWStats
AWStats was voor de opkomst van Google Analytics een van de meest bekende en gebruikte producten voor website statistieken. De tool gebruikt de logfiles van een webserver en bouwt op basis daarvan grafieken op. Alhoewel het voor de tijd een goede oplossing was is het duidelijk dat de ontwikkeling achter is gebleven vergeleken met nieuwere tools.
Er is nog steeds een demo dashboard beschikbaar waar de werking van AWStats gezien kan worden.
Webalizer
Webalizer was een tool die in dezelfde periode als AWStats ontwikkeld en gebruikt werd. Waar de ontwikkeling van AWStats minder is geworden, is de ontwikkeling hier volledig stil komen te liggen. Sinds augustus 2013 is er geen update geweest. Wij noemen de tool toch uit een historisch belang, maar ook omdat er nog lang bestaande sites op oude webservers dit in gebruik hebben. De gegevens zijn uiteraard beperkt, maar kunnen wel een lange historie van een site weergeven (mits de logbestanden bewaard zijn gebleven).
De afbeelding hierboven is gegenereerd uit de demopagina van Webalizer.
Andere opties
Er kan op basis van logfiles of andere databronnen uiteraard ook met andere tools gewerkt worden. Door gebruik te maken van een product dat grafieken maakt zoals Grafana, of business intelligence tools zoals Tableau of Power BI kunnen er dashboards opgebouwd worden. Het voordeel hiervan is de flexibiliteit en mogelijkheid tot integratie met andere interne of externe databronnen. Het nadeel is uiteraard dat alles vanaf de basis opgebouwd moet worden.
Een tool die een middenweg hierin vindt is Snowplow dat vanuit verschillende bronnen data kan laden en weergeven maar tegelijk in basis ingericht is om website statistieken te tonen. Daarmee biedt het een basis waarmee gestart kan worden en vervolgens uitgebreid of aangevuld kan worden met andere data.
Wie een alternatief in eigen beheer wil gebruiken voor Google Analytics doet er goed aan om van tevoren vast te stellen welk doel de metingen hebben en welke middelen er beschikbaar zijn. Op basis hiervan kan een juiste keuze gemaakt worden.