Jaaroverzicht 2020

Leestijd: 4 minuten

Een heuse traditie op Weblog van Stach: het jaaroverzicht. In de eerste paar weken van het nieuwe jaar maak ik de statistieken van het vorige jaar bekend. Dat deed ik ook in 2018 en 2019.

Vorige jaren deelde ik de AWStats-statistieken. AWStats is een scriptje dat op mijn server runt. Het scriptje houdt bij hoe vaak bepaalde pagina’s van mijn site worden opgevraagd. Voor 2020 rolt daar deze tabel uit:

Maand Unieke bezoekers Aantal bezoeken Bezochte pagina’s Totaal aantal weergaven pagina’s Data naar gebruikers verstuurd
Jan 2020 1,434 3,210 18,544 39,933 733.05 MB
Feb 2020 2,090 3,664 14,257 29,922 459.99 MB
Mar 2020 3,356 7,285 23,928 44,133 672.17 MB
Apr 2020 1,980 6,313 29,016 53,785 941.76 MB
Mei 2020 2,048 5,834 24,073 42,852 1003.09 MB
Jun 2020 1,569 5,859 23,803 39,394 816.33 MB
Jul 2020 1,788 6,254 29,383 53,060 1.27 GB
Aug 2020 1,639 6,053 27,133 46,325 825.37 MB
Sep 2020 2,174 7,705 30,149 52,989 2.52 GB
Okt 2020 2,117 7,456 29,329 56,078 1.85 GB
Nov 2020 2,202 8,296 27,945 69,229 1.81 GB
Dec 2020 2,742 8,914 39,696 63,581 1.37 GB
Totaal 25,139 76,843 317,256 591,281 14.15 GB

Unieke bezoekers:
Het aantal unieke IP-adressen dat die maand Weblog van Stach heeft bezocht.
Aantal bezoeken:
Totaal aantal bezoeken door alle unieke IP-adressen.
Bezochte pagina’s:
De som van het totale aantal pagina’s dat door alle bezoekers is bekeken. Dubbel bekeken pagina’s in één sessie zijn uitgesloten.
Totaal aantal weergaven pagina’s:
Hier zijn dubbel bekeken pagina’s in één sessie meegenomen in de berekening.
Data naar gebruikers verstuurd:
De hoeveelheid data die de servers van Weblog van Stach naar computers van anderen hebben verstuurd.

In de bovenstaande tabel staan geen data die gegenereerd zijn door robots, crawlers en wormen.

Normaal gesproken had ik alleen bovenstaande tabel met jullie gedeeld, maar een paar dagen geleden ontdekte ik iets vreemds. Je moet weten dat op deze site, naast AWStats, ook Google Analytics draait. Google Analytics is een stukje code (JavaScript) dat zichzelf activeert op het moment dat een gebruiker een pagina bezoekt. Via een lange, ingewikkelde weg verzamelt de code gegevens van de gebruiker en stuurt deze naar een centraal dashboard. Daar kan ik de statistieken inzien.

Ik gebruik Google Analytics onder andere om deze fantastische diagrammen te maken:

Wereldkaart met daarop alle Weblog van Stach bezoeken.
Alle blauwgekleurde landen hebben in 2020 Weblog van Stach bezocht. Hoe blauwer, hoe meer bezoeken.

Maar nu…

De gegevens die Google Analytics heeft verzameld, komen niet overeen met die van AWStats.

Paginaweergaven volgens Google Analytics

Deze gegevenset zou, per definitie, overeen moeten komen met ‘Totaal aantal weergaven pagina’s‘ in de tabel. Je hebt geen wiskunde D nodig om te zien dat dat absoluut niet het geval is.

Het wordt nog gekker.

Laten we eens naar trends kijken. Al kloppen de getalletjes niet helemaal, een stijgende of dalende trend zou bij beide partijen er ongeveer hetzelfde uit moeten zien.

Dit zijn volgens Google Analytics de paginaweergaven in 2019 ten opzichte van de paginaweergaven in 2020:

Paginaweergaven in 2019 en 2020 volgens Google Analytics

Merk op dat het oranje balkje (2020) in bijna alle gevallen kleiner is dan het blauwe balkje (2019). Google Analytics vertelt ons dus dat er sprake is van een dalende trend: in 2020 bezochten per maand gemiddeld minder mensen Weblog van Stach dan in 2019.

Maar nu, nu wordt het raar. Dit zijn de paginaweergaven in 2019 en 2020 volgens AWStats.

Paginaweergaven in 2019 en 2020 volgens AWStats

Hier is duidelijk een stijgende trend zichtbaar. Slechts drie keer is het oranje balkje lager dan het blauwe.

Dat de absolute getallen niet kloppen, is nog oké, maar dat zelfs de trends verschillen, is voor mij écht een brug te ver.

Waarom komen de gegevens niet overeen? En welke zijn de juiste?

Om antwoorden op die vragen te vinden, duik ik dieper in de data. Laten we de plekken waar fouten kunnen ontstaan, analyseren.

Google Analytics meet écht alleen maar personen, en geen bots. Dit komt omdat JavaScript bijna nooit wordt geactiveerd door (zoek)robotjes. Bij AWStats wordt het verschil tussen mens en machine bepaald door een blacklist met bekende bots. Het kan zijn dat een bot niet op die lijst staat en in dat geval meet AWStats de bot dus als een persoon. 1-0 voor Google Analytics.

Maar… internetgebruikers kunnen Google Analytics uitschakelen. En dat gebeurt ook. Men schat dat ongeveer 15% van de bezoekers van een site Google Analytics, onbewust of bewust, blokkeert. AWStats draait op mijn servers. Daar kunnen bezoekers niet bij. Bezoekers van Weblog van Stach kunnen AWStats dus niet uitschakelen.

1-1.

Ik weet het niet meer. Ik weet niet meer wie of wat ik moet vertrouwen, en al helemaal niet welke gegevens juist zijn. Misschien gaan webdevelopment en statistiek gewoon niet goed samen…


Advertentie:
Share