Wanneer u een gegevensgestuurde website uitvoert of andere redenen heeft waarom een document kan worden gedupliceerd, is het belangrijk om zoekmachines die kopiëren, de hoofdkopie of in het jargon, de "canonieke" kopie te vertellen. Wanneer een zoekmachine uw pagina's indexeert, kan deze zien wanneer inhoud is gedupliceerd. Zonder aanvullende informatie zal de zoekmachine beslissen welke pagina het beste aansluit op de behoeften van zijn klanten. Dit is misschien goed, maar er zijn veel voorbeelden van zoekmachines die oude en verouderde pagina's weergeven omdat ze het verkeerde document als canoniek hebben gekozen.
Hoe de Canonical-pagina te specificeren
Het is heel gemakkelijk om zoekmachines de canonieke URL met metagegevens in uw documenten te vertellen. Plaats de volgende HTML bovenaan uw
HOOFD element op elke pagina die dat is niet canonieke:
Als u toegang hebt tot de HTTP-headers (zoals met. Htaccess of PHP), kunt u ook de canonieke URL instellen voor bestanden die geen HTML hebben
HOOFD, zoals een PDF. Hiertoe stelt u de headers in voor niet-canonieke pagina's als deze:
Link: < URL van de canonieke pagina >; rel = "canonical"
Hoe de Canonical Tag werkt en wanneer dat niet het geval is
De canonische metagegevens worden gebruikt als een hint voor zoekmachines met betrekking tot welke pagina de master is. Zoekmachines gebruiken dit om hun index bij te werken om te verwijzen naar de hoofdkopie als de primaire kopie, en wanneer ze zoekresultaten leveren, leveren ze de pagina waarvan zij denken dat deze canoniek is.
Maar de canonieke pagina die u opgeeft, is mogelijk niet de pagina die zoekmachines leveren. Er zijn veel redenen waarom dit kan gebeuren:
- Als de URL die u opgeeft 404 niet is gevonden, zullen zoekmachines proberen de op één na meest relevante URL te vinden die moet worden geleverd
- Als de zoekmachine van mening is dat uw site is gehackt om een nep-canonieke URL toe te voegen, zullen deze deze niet gebruiken (u zult in dat geval grotere problemen ondervinden)
- Als u de link in de tag plaatst, of als er een reden is om aan te nemen dat de
HOOFD tag was niet gesloten. Dit komt omdat veel websites gebruikers toestaan om de inhoud op de pagina te bewerken (binnen de
LICHAAM element), en als zuigen een canonieke referentie gevonden, zou er ook onbetrouwbaar zijn.
Wat de Rel = Canonical Tag niet is
Veel mensen geloven dat als je de
rel = canonical link naar een pagina en vervolgens wordt die pagina omgeleid naar de canonieke versie, bijvoorbeeld met een HTTP 301-omleiding. Dat is niet waar. De
rel = canonical link geeft informatie aan zoekmachines, maar heeft geen invloed op de manier waarop de pagina wordt weergegeven, en evenmin op omleiding op serverniveau.
De canonieke link is uiteindelijk slechts een hint. Zoekmachines hoeven dit niet te honoreren. De meeste zoekmachines doen hun uiterste best om de wensen van de pagina-eigenaren te respecteren, maar uiteindelijk zijn de zoekresultaten wat ze doen en als ze uw canonieke pagina niet willen weergeven, doen ze dat niet.
Wanneer gebruik ik de Canonical Link?
Zoals ik hierboven al zei, zou u de link moeten gebruiken op elke dubbele pagina die niet canoniek is. Als je pagina's hebt die vergelijkbaar zijn, maar niet identiek, is het soms logischer om een van deze te veranderen om meer anders te zijn dan om een canonieke te maken. Het is prima om twee pagina's te markeren die niet absoluut identiek zijn als canoniek. Ze zouden vergelijkbaar moeten zijn, maar dat zou wel moeten nooit wijs eenvoudigweg alle pagina's naar uw startpagina. Canonical betekent dat de pagina de meestertekst van dat document is, en niet een soort hoofdkoppeling op uw site.
Ik denk dat het belangrijk is dat laatste stukje te herhalen - je moet nooit al je pagina's naar je startpagina verwijzen als de canonieke pagina ongeacht hoe verleid je bent om dat te doen. Als u dit doet, zelfs per ongeluk, kan elke pagina die niet canonisch is (dat wil zeggen elke pagina die niet uw startpagina is en de
rel = canonical koppeling) om te worden verwijderd uit de indexen van zoekmachines. Dit is geen kwaadaardige Google (of Bing of Yahoo! of een andere zoekmachine). Ze doen wat u van hen vraagt: elke pagina een duplicaat van uw startpagina en alle resultaten naar die pagina. Wanneer klanten gefrustreerd raken op uw startpagina in plaats van een relevant document, is die pagina minder populair en zal deze in de zoekresultaten verdwijnen. Zelfs als u het probleem oplost, kunt u uw zoekresultaten maanden achtereen doden en is er geen garantie dat uw siterangschikking zal herstellen.
U moet geen pagina canoniek maken die om wat voor reden dan ook is uitgesloten van het zoeken (zoals bij de
noindex metatag of uitgesloten door het robots.txt-bestand). Als een zoekmachine een pagina als canoniek moet verwijzen, moet deze er in de eerste plaats naar kunnen verwijzen.
Goede plaatsen om het te gebruiken
rel = canonical link omvatten:
- Sites met dynamische URL's - u kunt het gebruiken om te bepalen welke URL-indeling u verkiest
- E-commercesites, vooral op productlijsten: wanneer uw klanten de sorteercriteria wijzigen, hoeft die nieuwe URL niet te worden geïndexeerd
- Gesyndiceerde inhoud: uitgevers die de inhoud gebruiken die je hebt geschreven, moeten de
rel = canonical op hun pagina's verwijzen naar uw originele document
Wanneer mag u de Canonical Link niet gebruiken
Je eerste keuze moet een 301-omleiding zijn. Dit vertelt de zoekmachine niet alleen dat de pagina-URL is gewijzigd, maar het brengt mensen ook naar de meest actuele (en ik durf te zeggen, canonicol?) Versie van de pagina.
Wees niet lui.Als u uw URL-structuur wijzigt, gebruikt u een of andere vorm van HTTP-headermanipulatie (zoals. Htaccess of PHP of een ander script) om de 301-omleidingen automatisch toe te voegen. Hoewel u de kunt gebruiken
rel = canonical link, dat neemt de oudere pagina's niet weg. En dus kan iedereen op elk moment bij hen terecht. Als een klant een pagina met bladwijzers heeft en u de URL wijzigt, werkt u de zoekmachines alleen bij met behulp van a
rel = canonical link, die klant zal nooit zie de nieuwe pagina.
De
rel = canonical link is een handig hulpmiddel voor sites met veel dubbele inhoud. Door te begrijpen hoe het werkt, kunt u het effectief gebruiken. Maar uiteindelijk is het een hulpmiddel dat door zoekmachines is vrijgegeven om te helpen hen houd hun zoekindexen up-to-date. Als u uw servers niet schoon en up-to-date houdt, hebben uw klanten ook last van uw site en kan uw site worden beschadigd. Gebruik het op verantwoorde wijze.




