Hey. Waarom is mijn direct traffic in Google Analytics of HubSpot absurd hoog?

Johan Vantomme
Johan Vantomme
13 juli 2016
DELEN

Als je in Google Analytics of HubSpot je trafiekbronnen bekijkt, valt direct op dat het percentage direct verkeer naar je website vaak hoog is. Absurd hoog. Verwarrend hoog.

Je zou natuurlijk graag denken dat die bezoekers je url rechtstreeks hebben ingetikt of je pagina hebben gebookmarkt. Stel jij je daar vragen over? Wij zeker wel. We duiken in de materie:

Trafiekbronnen en direct trafic: een voorbeeld

Laten we even een voorbeeld nemen. In onderstaand rapport zie je dat 57,30% van de bezoeken direct trafic zijn. Waaruit je zou kunnen concluderen dat die gewoon manueel jouw url hebben ingetikt.

bron-direct-traffic-medium-none.png

Wat meer is: 95% van de nieuwe sessies komt in het direct-segment terecht. Dat kunnen toch niet allemaal mensen zijn die onze site hebben gebookmarkt? Hier klopt iets niet, dit moeten we onderzoeken.

Wat zijn de definities van je webtrafiek?

Van Google lezen we in Google Analytics Help volgende definities:

Bron: elke verwijzing naar een website heeft een herkomst of bron. Mogelijke bronnen zijn: 'google' (de naam van een zoekmachine), 'facebook.com' (de naam van een verwijzende site), 'nieuwsbrief_mei' (de naam van een van uw nieuwsbrieven) en 'direct' (gebruikers die uw URL rechtstreeks in hun browser hebben getypt of uw site als bladwijzer hadden ingesteld).

Medium: elke verwijzing naar een website bevat ook een medium. Mogelijke mediums zijn: 'organisch' (onbetaald zoeken), 'cpc' (kosten per klik, dat wil zeggen, betaalde zoekresultaten), 'verwijzing' (verwijzing), 'e-mail' (de naam van een aangepast medium dat u heeft gemaakt), 'geen' (rechtstreekse bezoeken die 'geen' medium hebben).

Maar dat is geen goede interpretatie van direct traffic. Het is enorm misleidend en niet accuraat. We zoeken verder.

Waar haalt Google Analytics zijn informatie?

Eerst moeten we weten hoe Google komt aan informatie over de oorsprong van een bezoek. Google maakt daarvoor gebruik van een functie binnen het http-protocol. Het http-protocol laat toe om de HTML DOM referrer property op te vragen. Hier staat ook gedefinieerd hoe een browser dat mag benaderen.

The Referer [sic] request-header field allows the client to specify, for the server's benefit, the address (URI) of the resource from which the Request-URI was obtained (the "referrer", although the header field is misspelled.) The Referer request-header allows a server to generate lists of back-links to resources for interest, logging, optimized caching, etc. It also allows obsolete or mistyped links to be traced for maintenance. The Referer field MUST NOT be sent if the Request-URI was obtained from a source that does not have its own URI, such as input from the user keyboard.

Dus, als iemand een webpagina op je site bezoekt, kan (!) die pagina de referrer tonen. De referrer is dan beschikbaar, ook voor Google Analytics die het verder verwerkt. Maar ... het is niet verplicht en het mag niet voorzien worden indien de oorsprong geen url (Unique Resource Indentifier) heeft.

Hier kan je dus al een deel van je bronnen verliezen.

Plus: Google denkt eerst aan zichzelf

Voor het verwerken van de referrer-data zorgt Google eerst een beetje voor zichzelf en zijn eigen producten. Het kijkt eerst naar Google AdWords en DoubleClick-data, dan naar campaign-data, dan naar document location (utm_source) en daarna pas naar de referrer.

(Voor wie er interesse in heeft: lees verder over Google Analytics voor campagnes en verkeersbronnen of het stroomdiagram voor verwerking bekijken.)

Met andere woorden: als Google Analytics geen AdWords-data vindt, geen utm-waarden en er kan geen campagne-data gekoppeld worden aan de browser, dan wordt ‘Direct/none’ als source/medium aangewezen.

Eigenlijk zou daar moeten staan: ‘Unknown/undefined’, want Google heeft niet het minste idee waar de bezoeker vandaan komt. De bezoeker kan de url manueel hebben ingetikt, hij kan vertrokken zijn van een bookmark, een link geklikt in WhatsApp, in een mail, of er is iets anders gebeurd waardoor de referrer niet werd ingevuld door de browser.

ENKELE VOORBEELDEN van een verkeerde bron

Hierbij een (niet-volledige) lijst waarbij de gebruiker als 'Direct/none' beschouwd zal worden:

  • url wordt ingetikt
  • klikken op een bookmark
  • klikken in een e-mail vanuit Outlook/Thunderbird of gelijkaardig
  • klikken op een link in Skype of een andere messenger
  • klikken op een link in een app (Snapchat, … )
  • klikken in een document (pdf, doc, xls, …)
  • klikken op een link in je desktop
  • klikken op een verkorte url
  • links komende vanuit een https-omgeving
  • bezoek komende vanuit search kan in sommige gevallen omgeleid worden en als 'direct' binnenkomen (uit onderzoek van Groupon blijkt dat dit tot 60% van de traffic kan oplopen).

Hoe kunnen we dit oplossen?

Spijtig genoeg is er voor links die van een https-website komen of voor sommige mobiele links geen oplossing.

Maar door parameters zelf toe te voegen aan je url's (zogenaamde utm_codes) kun je al veel oplossen. Gebruik utm_codes voor alle url's die je verspreidt, onafhankelijk van de drager. Maak je een PDF, een doc of een xlsx, voorzie de links dan eveneens van de nodige utm_codes. Doe hetzelfde als je iets post op social, een nieuwsbrief uitstuurt, een drip campaign opzet, enzovoort.

Kortom: al je externe online communicatie voorzie je van utm’s. Op die manier kun je zeker een groot deel van het direct/none traffic wegwerken. Ben je niet vertrouwd met utm-codes? Hier kun je alvast meer info terugvinden alsook een formulier dat alles genereert voor jou. Let wel, dit is niet retroactief. Oude links die verspreid zijn, zullen direct/none traffic blijven genereren.

Conclusie

In de rapportering van je webtrafiek vind je hoogstwaarschijnlijk een verwarrend hoog percentage direct trafiek. Heel veel kans dat het geen échte directe trafiek is, want Google geeft vaak een deel van de info niet verder mee, maar geeft nog wel de bron 'Direct/none' mee, waar het beter zou zijn die gewoon ‘Unknown/undefined’ te noemen.

Een pro-tip om een deel van dat probleem aan te pakken: gebruik extra parameters in de url's die je zelf verspreidt (utm_codes). Die zorgen dat een pak van de directe trafiek met een juiste bron worden weergegeven in je rapportering.

New Call-to-action

 

Johan Vantomme

Johan Vantomme

Johan is een van de oprichters van leadstreet, Platinum HubSpot Partner. HubSpot-certified op 5 niveau's. Hij weet technische kennis voor het ontwikkelen van websites te koppelen aan een grote kennis van online en de bijhorende commerciele en marketingkant. Johan is (ex-)zeilfanaat en een foodie.