Benjamin Bar
Benjamin Bar

BtoB SEO consultant / BtoB Brand Content Strategist

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn

Balises canoniques, pas de place pour les pâles copies

Dans le vaste monde du SEO technique je demande les URL canoniques. N’y faîtes aucun rapprochement avec l’âge canonique, le SEO n’est peuplé que d’hérétiques. 

Nos chères URL canoniques donc, existent depuis 2009, et permettent de lutter contre ce que l’on appelle le contenu dupliqué (pas d’angoisse, je ferais un article là-dessus).

Savoir utiliser les URL canoniques est très important pour le référencement naturel de votre site. En les appliquant sans faire fonctionner un neurone on s’engage vite dans un sacré bourbier. 

Vous l’aurez deviné, c’est un peu le sujet du jour. Je vais vous expliquer ce que sont les URL canoniques, ce qu’elles représentent et comment les utiliser dans les règles de l’art. 

A vos papiers et vos crayons ! 

Qu’est ce qu’une URL canonique ?

L’URL canonique, alias balise canonique, est un élément de lien HTML qui se traduit par un attribut rel=canonical qui se trouve dans l’élément <head> de votre page Web. 

Lorsque vous avez plusieurs pages web avec des contenus similaires (comme des pages produits avec couleurs ou tailles différentes), les balises canoniques vont permettrent d’indiquer au moteur de recherche laquelle de ces pages à la paternité sur les autres. 

Lorsque le moteur de recherche va alors voir les pages : 

votredomaine.fr/produit1/bleu

votredomaine.fr/produit1/jaune

votredomaine.fr/produit1

Si la dernière URL dispose de la balise rel=canonical alors le moteur de recherche considérera que c’est cette version qu’il doit prendre en compte et pas les autres. 

Pas d’inquiétude à avoir donc si plusieurs URL de votre site ont le même contenu. Avec l’aide des balises canonical, votre site ne sera pas pénalisé par Google. 

Pourquoi je vous parle de contenu dupliqué ?

Dans le petit monde du SEO et plus globalement dans le “marketing digital” il y a un adage qui dit que “le contenu est roi”. Ce qui veut dire en d’autres termes que le contenu que vous produisez et publiez sur votre site et en dehors a une grande importance pour votre visibilité. 

La règle universelle veut qu’un contenu doit être unique et pertinent par rapport à la recherche d’un internaute. En suivant cette logique on se donne plus de chance d’être dans les petits papiers des moteurs de recherche. 

Toujours dans la règle universelle, un contenu qui n’est pas unique est donc déclaré dupliqué. Et donc devient facteur de déclassement pour votre site…

Dans les faits, on est très éloigné de ces vérités. Mais encore une fois si je me mets à vous en parler on va sortir du sujet. 

Là, maintenant, j’aimerai juste vous montrer les raisons qui peuvent impliquer du contenu dupliqué au sein de votre site. 

  • Le préfixe de domaine régional : Si votre site Web est disponible dans différentes régions, vous devez utiliser des balises canoniques pour pointer vers le contenu principal afin d’éviter la duplication du contenu.
  • Variations de protocole de transfert/sous-domaine : Si vous pouvez accéder à un site par le biais de différentes URL, comme indiqué précédemment, les moteurs de recherche les considéreront comme des pages distinctes.
  • Versions mobiles : Les versions mobiles des sites sont souvent disponibles via des URL différentes. Vous devez utiliser des balises canoniques pour les différencier.
  • Pages produits : Le problème du contenu dupliqué est très répandu sur les sites e-commerce, surtout lorsqu’il existe différentes variantes d’un même produit.
  • Contenu copié : Dans certains cas, vous pouvez avoir besoin de plus d’un site Web pour publier le même contenu. Si c’est le cas, vous devez canoniser le contenu privilégié.

À quoi ressemble une balise canonique ?

Bien, il est temps de rentrer un peu plus dans le vif du sujet, vous ne pensez pas ?

Depuis tout à l’heure je vous fais languir en vous parlant d’url canonique, de balise canonique mais vous ne savez toujours pas à quoi ça ressemble. Et bien voilà la bête !

<link rel= »canonical » href= »https://www.domaine.fr »>

Pour l’exemple disons que vous avez un site e-commerce et que l’une de vos pages produits est accessible via ce chemin principal 

Maintenant, imaginons que ce produit A est accessible à partir d’un certain nombre d’URLs telles que :

votresitee-commerce.fr/tous-les-produits/produitA

votresitee-commerce.fr/top-ventesvendus/produitA

votresitee-commerce.fr/petits-prix/produitA

Comme je vous le disais un peu plus haut, il y a de nombreuses raisons qui poussent à rendre un contenu accessible par différentes URL. 

Dans ce cas, la bonne pratique c’est d’ajouter un URL canonique – donc une URL de référence – dans l’en-tête de toutes les pages dupliquées pour indiquer aux moteurs de recherche la version correcte de l’URL.

Dans notre exemple, nous voulons conserver l’URL : votresitee-commerce.fr/productA comme URL préférée. Nous allons donc ajouter la balise canonique suivante dans la section <head> des trois pages de contenu dupliqué : 

<link rel= »canonical » href= »https://votresitee-commerce.fr/productA/>

Pourquoi les URL canoniques sont-elles importantes pour votre référencement naturel ?

Un rappel n’est jamais de trop hein ?! 

Tout l’intérêt des balises canoniques est de vous éviter des soucis de contenu dupliqué au sein de votre propre site. Mais elles ne servent pas qu’à ça non plus. 

Les balises canoniques spécifient l’URL que vous souhaitez voir apparaître dans les résultats de recherche.

Lorsqu’une balise canonique est placée sur une page, les moteurs de recherche savent quelle version de la page ils doivent afficher. Le contenu dupliqué peut causer plusieurs problèmes de référencement, et les moteurs de recherche peuvent ne pas savoir quel contenu classer. Par conséquent, ils passent à côté d’une partie de votre contenu faisant autorité.

Les balises canoniques simplifient le suivi des mesures pour un seul sujet

Lorsqu’il y a plusieurs URL avec un contenu similaire ou carrément identique, il peut être difficile d’obtenir des mesures consolidées pour un contenu individuel. En utilisant les balises canoniques vous facilitez le suivi des performances pour chaque page. 

Elles évitent à Googlebot d’explorer les pages en double

Une problématique que subissent davantage les gros sites, je parle ici de dizaines de milliers de pages minimum. Les balises canoniques permettent à Googlebot d’explorer vos nouvelles pages Web au lieu des versions dupliquées.

Les URL canoniques consolident les liens pour le contenu dupliqué et gèrent le contenu syndiqué

Les URL canoniques aident les moteurs de recherche à combiner les informations relatives à une URL en une seule URL faisant autorité. Elles permettent également de consolider le classement des pages vers votre URL préférée.

Quand et comment utiliser les balises canoniques ?

En toute honnêteté j’en ai déjà beaucoup sur l’utilisation des balises canoniques. Mais je peux encore faire un effort pour vous aiguiller dans vos prochaines décisions. 

On va avoir 3 principaux cas de figures où la balise canonique va être pertinente : 

  • quand il y a clairement des pages avec un contenu dupliqué
  • quand il y a des produits similaires
  • quand il y a nécessité de structurer des informations supplémentaires pour une URL 

Quelques bons conseils pour mettre en place vos balises canoniques. 

Utiliser une URL absolue

Vous pouvez utiliser rel= » canonical  » avec des URL absolues ou relatives. Mais, pour minimiser la confusion, je vous recommande de n’utiliser que des URL absolues, comme par exemple :

<link rel= » canonical  » href= « https://www.superdomaine.fr/pageA/ »/>

Et non pas :

<link rel= » canonical » href= »/pageA/ »/>

Vérifiez votre site pour les problèmes d’URL canoniques

Inspectez toujours vos pages Web pour vous assurer que le contenu dupliqué possède une balise canonique. Pour inspecter n’importe quelle URL, vous pouvez simplement vérifier le code source HTML de n’importe quelle page pour déterminer si une balise canonique a été ajoutée à toute page dupliquée.

Vous devez vous assurer que la page est explorable et indexable. Ouvrez Search Console et entrez l’URL de la page en haut de la barre.

Utilisez les balises canoniques avec parcimonie

Vous ne devez intégrer le rel=”canonical que sur vos pages dont le contenu est dupliqué, sinon vous risquez d’exclure d’autres pages pertinentes des classements. Donc, ne canonicalisez que si les pages sont similaires.

Canonicalisez votre page d’accueil

J’ai pour habitude d’insérer une rel=”canonical à même la page d’accueil car c’est l’une des pages la mieux référencée en règle général. En outre, les doublons de pages d’accueil sont les plus courants.

Attention à la manière d’écrire vos URL

Les moteurs de recherche traitent les URL en majuscules et en minuscules comme des URL différentes. Lorsque vous utilisez des balises canoniques, utilisez les minuscules par souci de cohérence. C’est important car cela garantit que la bonne URL est indexée.

Utilisez la bonne version du domaine

HTTP et HTTPS ne sont pas interchangeables, et si vous intervertissez leurs balises canoniques, cela pourrait perturber les robots des moteurs de recherche. Ainsi, si votre site utilise HTTP, ne définissez pas vos balises canoniques avec HTTPS.

Cependant, Google recommande d’utiliser HTTPS sur votre site pour améliorer l’expérience utilisateur. Vous devez donc faire passer votre site de HTTP à HTTPS pour le rendre sécurisé et convivial. 

Quelques erreurs que vous pouvez éviter quand vous intégrez des balises canoniques

Sur la papier, intégrer des balises canoniques est un jeu d’enfant. Dans les faits c’est une opération plutôt délicate. Je vais donc vous éviter de futures sueurs froides en vous listant quelques erreurs communes à leur intégration.

Comme ça vous pourrez pas dire que je vous avais pas averti. 

N’empêchez pas Google de crawler vos URL spécifiques 

C’est d’une évidence crasse mais si Google n’a pas les moyens d’explorer une URL, vous pouvez tirer une croix dessus qu’elle sera positionnée. Si voulez déviez, en quelque sorte, le regard de Google au sujet de certaines pages de votre site, mieux vaut utiliser des rel=”canonical, plutôt que de bloquer ces pages via le fichier robots.txt. 

Signaux mixtes

Ne canonisez qu’une seule source de contenu original pour plusieurs pages. En termes simples, ne canonisez pas la page A > la page B, puis la page B > la page A.

C’est déroutant, non ? Le moteur de recherche peut faire un mauvais choix. Si la page A est canonique, le schéma de canonisation correct devrait être page B > page A ; page C > page A ; page D > A, et ainsi de suite.

URL canonique vers une page redirigée 

Vous ne devez pas canoniser une URL qui sera redirigée. Au lieu de cela, définissez le lien canonique comme étant la cible de la redirection.

URL canonique renvoie vers un contenu non pertinent

Pas d’entourloupe possible avec les URL canoniques. On peut être tenté de se dire qu’on va indiquer à Google une autre page sans rapport avec la première mais ça ne marche pas comme ça. 

Intégrer plusieurs URL canoniques

C’est clair comme de l’eau de roche. Si vous mettez en place plusieurs balises canoniques, elles seront toutes ignorées par les moteurs de recherche. Une seule et unique balise par page. 

URL canonique, ce qui se conçoit bien s’énonce clairement

Pour faire simple, la balise canonique donne à une page une autorité – aux yeux du moteur de recherche – sur d’autres pages au contenu très similaire ou dupliqué. 

On peut retenir 3 avantages à une implémentation sérieuse d’une balise canonique : 

  • elle renforce le référencement naturel 
  • elle renforce voire permet d’augmenter légèrement le trafic
  • elle renforce la fiabilité des données collectées par des outils de tracking. 

Si vous avez des doutes sur la bonne implémentation de vos balises canoniques, si vous jugez qu’il y a trop de fiches produits identiques dans votre catalogue e-commerce, je vous recommande tout de suite de commander un audit. 

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn

More to explorer

Submit your response

Votre adresse e-mail ne sera pas publiée.