Scroll

Alle belangrijke ins- and outs over canonical tags.

Alles over canonical tags

Google houdt van waardevolle en unieke content, en is dus geen fan van content die exact gekopieerd is of vergelijkbaar is aan een andere pagina op je website. Ook heeft dubbele content invloed op de ranking van je website en je zichtbaarheid: zoekmachines weten namelijk niet meer welke pagina het belangrijkste is. Google kan niet goed onderscheiden welke pagina ze moeten tonen. De ene keer is dit pagina A en de volgende keer pagina B. Daardoor kun je nooit een hoge positie behalen. Toch komt het in de praktijk regelmatig voor dat de content op bepaalde pagina’s van je website exact of grotendeels hetzelfde is. Dat is waar de canonical tag in het spel komt: met deze tag laat je aan zoekmachines weten welke URL je wil laten indexeren en dus graag in de zoekresultaten zou zien. In dit blog vind je alle belangrijke ins- and outs over canonicals.

Wat is een canonical tag?

In de standaardsituatie indexeert een zoekmachine als Google je pagina met de URL in de adresbalk. In het geval van dit blog is dat:

In de meeste gevallen zorgt dat niet voor problemen. Het zorgt wel voor problemen als je te maken hebt met duplicate content. In dat geval vecht de content van de pagina’s onderling met elkaar en maak je het lastig voor search engines om te beslissen welke relevanter is. Om dit te voorkomen zeg je via een canonical tag tegen een zoekmachine dat bepaalde pagina’s een exacte kopie zijn, bijna dezelfde content of vergelijkbare content bevatten, en welke pagina het relevantst is.

Je hebt dus te maken met duplicate content, ook wel dubbele content, als de content op op meer dan één locatie op het internet te vinden is. Een locatie is in dit geval een unieke URL. Simpel gezegd: staat de content op meer dan één webadres, dan heb je al te maken met duplicate content.

Interne en externe duplicate content

Canonical tags zijn van toegevoegde waarde voor zowel interne- en externe content.

Interne duplicate content ontstaat doordat je via diverse wegen op een pagina kunt landen. Dit kan bijvoorbeeld gebeuren als je een pagina hebt die gaat over industriële eettafels én een blog over industriële eettafels die je allebei hebt geoptimaliseerd voor hetzelfde zoekwoord. Nu is het voor Google ingewikkeld om te beslissen welke pagina het relevantst is. Door een verwijzende canonical tag toe te voegen naar de pagina die je wil laten ranken, zeg je tegen Google dat die pagina getoond moet worden in de zoekresultaten. Deze vorm van dubbele content veroorzaak je dus vaak zelf.

  • Interne content = inhoud op je eigen website die bestaat uit content die exact of bijna gekopieerd is of vergelijkbaar is.

Externe duplicate content ontstaat wanneer twee verschillende domeinen dezelfde content bevatten. Het komt vaak voor doordat een blog of artikel ook op een andere website wordt ge(her)publiceerd omdat het interessant kan zijn voor hun bezoekers. Als dit met toestemming en correct gebeurt verwijzen deze pagina’s met een canonical link naar het originele artikel of blog. Dus, dit type dubbele content wordt door jijzelf of juist de andere partij gecreëerd. Dit kan ook onbewust gebeuren bij bijvoorbeeld webhops met productbeschrijvingen die door de fabrikant worden aangeleverd.

  • Externe content = inhoud op je eigen website die vergelijkbaar of gekopieerd is van andere websites.

De geschiedenis van canonical URL’s

Leuk om te weten is dat de canonical URL al sinds 2009 bestaat. Google, Microsoft en Yahoo kondigden dit nieuwe link element aan met het doel om dubbele URL’s op websites op te schonen en zo de zoekresultaten schoon, uniek en waardevol te houden. De mogelijkheid om een voorkeurs-URL op te geven gaf website-eigenaren meer controle over de URL in de SERPs (Search Engine Results Page). Dit helpt de mensheid ook weer om bijna direct te vinden waar we naar zoeken. Het idee klinkt simpel, maar de toepassing is dat niet (altijd). Geen zorgen, dit blog helpt je op weg.

Hoe ziet een canonical tag eruit?

Een canonical URL bestaat altijd uit twee onderdelen:

  1. rel=”canonical” hier verwijst ‘rel’ naar relatie. Daarom bepalen we hier dat het een canonical URL betreft.
  2. href=”URL” href verwijst naar de bestemming van de URL link, zet de te indexeren en rangschikken URL hier neer en je maakt de Google duidelijk om welke pagina het gaat.

In onderstaande voorbeeld zie je hoe de canonical tag voor de Buro 3 homepagina eruit ziet.

Waar staat een canonical tag?

Een canonical tag is een HTML element geplaatst in de HTTP header of broncode van een pagina.

Een canonical tag in de broncode van je pagina

De <head> sectie van je broncode is de meestvoorkomende locatie van de canonical tag. Dat komt omdat dit de eenvoudigste en meest logische manier is om canonical tags in te stellen. Met een beetje kennis en uitleg zou je dit eenvoudig zelf kunnen doen. Let op: als de canonical tag niet hier, maar op een andere plek in de code, staat kunnen search engines je canonical URL onmogelijk vinden.

Op deze afbeelding zie je duidelijk dat de canonical tag voor de Buro 3 homepagina te vinden is in de <head> sectie van de code.

canonical tag in head

Een canonical tag in de HTTP header van je pagina

Je plaatst een canonical vaak alleen in de HTTP header als er bestanden zijn die invloed kunnen hebben op de duplicate content van je site. Bijvoorbeeld als een bezoeker de pdf van de handleiding die bij je blog hoort kan downloaden.

Het instellen van canonical tags in de HTTP header is wat ingewikkelder. Dus als je net zoveel verstand hebt van webdevelopment als ik, is het waarschijnlijk verstandiger om hiervoor de hulp van experts/je development team in te schakelen 😉 Wat je wel zelf kunt doen is de HTTP header bekijken. Ik gebruikte daar deze gratis tool voor.

 

Hoe weet je of je site canonical tags gebruikt?

Een canonical tag is alleen zichtbaar voor Google. Gebruikers van je website merken hier dus niets van, tenzij ze er in de code naar gaan zoeken. Zoals je net hebt geleerd staat een canonical URL altijd in de code of HTTP header. Hier kun je de canonical URL dus vinden. In de video kun je zien hoe je de canonical tag op de Buro 3 homepagina in de code terugvind. Probeer het zelf maar eens!

Wanneer worden canonical tags gebruikt?

Search engines willen de meest relevante en kwalitatieve resultaten tonen aan haar websurfers. Daarom filteren zoekmachines dubbele resultaten en identieke pagina’s. Zoals je hebt geleerd kiest Google zelf voor een van de pagina’s wanneer de search engine geen canonical ziet. Ook weet je nu dat deze keuze lastig is, dus om er zeker van te zijn dat je op de juiste pagina gevonden wordt help je zoekmachines een handje.

Zelfverwijzende en verwijzende canonicals

We maken het onderscheid tussen twee canonical URL’s:

  1. De zelfverwijzende canonical = Zo laat je aan Google weten dat dit de enige versie van de content en de pagina zelf is en je deze pagina geïndexeerd wil hebben.
  2. Canonical tags die verwijzen naar andere vergelijkbare pagina’s = Als je te maken hebt met dubbele content of meerdere pagina’s die erg op elkaar lijken plaats je een canonical tag waarmee je de zoekmachine laat weten welke versie juist is.

Canonical tags combineren

Als je te maken hebt met meerdere of twee pagina’s waarbij de content dubbel of vergelijkbaar is ga je de zelfverwijzende tag combineren met verwijzende tags. De relevante en meest waardevolle pagina, waarvan je hoopt dat deze in de organische zoekresultaten te zien is, voorzie je van een zelfverwijzende canonical tag. De gelijksoortige ‘verkeerde’ pagina’s voorzie je van een verwijzende canonical tag naar de pagina met de zelfverwijzende canonical tag.

Andere situaties waarin een verwijzende canonical tag kunt gebruiken:

  • Als je website gebruik maakt van filters en/of sorteerfuncties is het slim om een verwijzende canonical in te stellen.
  • Als je van plan bent om een A/B test op te zetten kan het helpen om een pagina als belangrijkst te markeren. Zo krijg je geen onderlinge concurrentie die je test kan beïnvloeden tussen pagina a en pagina b.
  • Heb je een pdf bestand gelinkt waarvan de inhoud overeenkomt met je website content? Stel dan ook een canonical in. Pdf’s worden namelijk ook geïndexeerd door search engines.
  • Blogs die terugkomen in allerlei categorieen van je website.
  • Bij het gebruiken van een mobiele- en desktop versie met elk een eigen link.

Moet elke webpagina een eigen canonical tag hebben?

Het is slim om een canonical tag toe te wijzen aan al je webpagina’s. Zo voorkom je allerlei problemen. Zoals je hierboven hebt geleerd. Stel je een zelfverwijzende canonical in als er geen andere pagina is (die beter of waardevoller is). Gebruik verwijzende canonical tags als je liever wil dat een andere pagina wordt toegevoegd aan de index door de zoekmachine.

Hoe komt een zoekmachine canonical tags tegen?

Een zoekmachine bestaat uit een crawler, index en een algoritme. In het geval van canonical tags is de crawler belangrijk.

  1. Deze crawler surft op het wereld wijde web op zoek naar websites.
  2. Bij het bezoek aan je website sprokkelt de crawler de inhoud bij elkaar.
  3. Vervolgens voegt de crawler de gevonden inhoud toe aan de index, een enorme database. Elk bezoek van de crawler aan je website zorgt dus voor een update van de index.
  4. Het algoritme gaat vervolgens aan de slag om te bepalen welke positie de zoekresultaten krijgen.

Een van de manieren om een crawler te beïnvloeden is het instellen van canonicals. Op het moment dat een crawler je canonical tag ziet zeg je: ‘Ik wil dat je deze pagina niet indexeert.’ of ‘Je moet deze pagina verkiezen boven die andere pagina’s waarvan de content hetzelfde is.’ of ‘Deze pagina is de juiste versie en de enige met deze content’.

Ook voorkom je zo dat een zoekmachine veel tijd verknoeit met het crawlen van allerlei versies van dezelfde content, met het risico dat andere belangrijke inhoud aan de crawler voorbij gaat en dus pas later in de index terechtkomt. Een canonical tag voorkomt dus niet dat een pagina wordt gecrawld, je brengt hiermee alleen prioriteit aan.

Voorkomt een canonical tag crawl problemen?

Nee. Het doel van een canonical tag is om aan een crawler aan te geven welke pagina het meest waardevol is (de bron van de content) en welke pagina’s niet geïndexeerd hoeven worden. Zo geef je dus niet aan welke pagina’s de crawler langs moet gaan. Crawl problemen voorkom je dus niet met canonicals, hier gebruik je bijvoorbeeld het robots.txt bestand voor.

Mythe: met canonical tags sluit je duplicate content uit

Omdat een canonical altijd een suggestie is en geen opdracht kan de crawler van de zoekmachine altijd nog zelf beslissen. Het komt weinig voor, maar het is wel de reden dat duplicate content nooit compleet uitgesloten kan worden.

De invloed van canonical tags op je SEO

Dubbele content kan een groot probleem zijn voor je SEO. Zoekmachines, vooral Google, streven naar een optimale gebruikservaring. Als Google jouw website beschouwt als een site met veel pagina’s waarvan de inhoud identiek, of extreem vergelijkbaar is, krijg je een lagere score. En dat is niet gek, identieke dubbele inhoud botst direct met het principe van SEO: het maken en verspreiden van unieke en waardevolle content voor de websurfer.

Bovendien is het moeilijk voor zoekmachines om te beslissen welke URL de grootste waarde heeft en dus geïndexeerd en gerankt moet worden in de zoekresultaten, als gevolg zal de individuele ranking-power van je verschillende URL’s zwakker worden. Dit zorgt weer voor een lagere vindbaarheid.

Door het toevoegen van een canonical help je zoekmachines om de juiste keuze te maken. Dit heeft weer een positief effect op jouw eigen ranking: de juiste URL wordt namelijk getoond in de organische zoekresultaten en je content is onderling niet meer aan het concurreren. Op deze manier wordt dubbele content op het wereldwijde web voorkomen en markeert een zoekmachine je pagina’s niet als duplicate content. Zo blijft je website relevant en uniek voor bezoekers en hou je Google te vriend.

Implementeren van canonical tags

Het is belangrijk om je canonical tags goed in te stellen. Een paar punten waar je rekening mee kunt houden als je canonicals gaat implementeren:

  • Gebruik in elk geval maar één canonical per pagina van je website. Als je er meerdere op dezelfde pagina in de broncode of HTTP header instelt raakt de zoekmachine van slag. Google negeert dubbel geplaatste tags altijd.
  • Als de pagina niet te indexeren is raakt de zoekmachine ook in de war. Zorg er dus voor dat je canonical tags alleen toevoegt aan indexeerbare pagina’s.
  • Gebruik altijd de volledig uitgeschreven URL van je webpagina. Inclusief https, subdomeinen en www. Zo weet de zoekmachine welke link het betreft.
  • Stel geen canonical tag in naar je homepagina. Dit kan veroorzaken dat je pagina, die niet gemarkeerd is als canonical, niet meer geïndexeerd wordt.

Beslissen welke pagina je de voorkeur geeft

Maar hoe weet je welke pagina je het beste de voorkeur kunt geven? Dit proces van het selecteren en het markeren van de belangrijkste URL’s heet ‘canonicalization’. In de meeste situaties spreekt het voor zich welke URL het meest waardvol is.

Kom je er echt niet uit of zijn de pagina’s een exacte kopie? Kies dan gewoon één pagina. Het is altijd beter om je URL’s wel te canonicaliseren, dan er niets mee te doen. In dit geval kun je wel altijd besluiten om te kiezen voor de pagina waar het meeste verkeer landt of de URL het netst is. Maar dat is geen must.

Om dit nog iets concreter te maken: als je onderstaande afbeelding bekijkt valt op dat alle stoeltjes bijna identiek zijn, de verschillen zijn minimaal. Het zou in principe niet uitmaken welk stoeltje je kiest. In de praktijk zou je hier waarschijnlijk niet eens over nadenken en kies je er gewoon één. Probeer je identieke pagina’s op dezelfde manier te benaderen als je gaat canonicaliseren.

301 redirect of canonical tag, welke kies je?

Een andere manier om duplicate content aan te pakken is een 301 redirect. Maar wat is het verschil en voor welke oplossing kies je?

Het verschil tussen een canonical tag en een 301 redirect

  • Als je kiest voor een canonical tag, blijven alle URL’s bereikbaar en is het dus mogelijk om op beide pagina’s te blijven landen. Hiermee geef je alleen de voorkeurspagina aan.
  • Als je kiest voor een 301 redirect landen bezoekers automatisch op de pagina waarnaar je de redirect hebt ingesteld, de andere pagina’s zijn niet meer zichtbaar of bereikbaar voor bezoekers. Dit doe je bijvoorbeeld bij verwijderde pagina’s

Kies dus voor een canonical tag als je wil dat alle webpagina’s bereikbaar en in leven blijven, maar je er wel maar één geïndexeerd wil hebben. Kies voor een redirect als je maar 1 webpagina bestaand wil houden. Een andere reden om te kiezen voor een canonical tag kan zijn dat redirecten van bezoekers een negatieve invloed op de gebruikerservaring kan hebben of op een andere manier voor problemen kan zorgen.

Let op, canonical url’s kunnen ook gevaarlijk zijn

Pagina’s met een verwijzende canonical worden niet langer geïndexeerd door zoekmachines. Als je de tag verkeert toewijst kan dit vervelende gevolgen hebben voor je website. Het risico is dan dat zoekmachines belangrijke webpagina’s niet indexeren. Het advies is wel altijd om de canonical tag in te zetten, maar let dus goed op.

Worden canonical tags altijd geaccepteerd door zoekmachines?

Het toevoegen van een canonical tag is altijd een suggestie aan een zoekmachine. En een suggestie hoeft per definitie niet opgevolgd te worden. Echter, komt het weinig voor dat een zoekmachine de canonical niet accepteert, overruled of negeert. Maar het kan gebeuren in het geval van een exacte kopie of .nl website met ook een Belgisch webdomein. Dan lijkt de content zo op elkaar dat de zoekmachine de tag overruled en zelf gaat bepalen welke optie beter is. Als dit zou gebeuren kun je met Google Search Console ontdekken welke pagina door Google als canonical werd gemarkeerd.

Ondersteunt elke zoekmachine canonical tags?

De grootste zoekmachines: Google, Yahoo en Bing ondersteunen de canonical tag. De meeste van ons Googlen er vooral op los, dus over het algemeen hoef je je hier geen zorgen over te maken.

Lise van den Elzen

Designer & Content Marketeer