Le guide ultime pour comprendre la balise canonique sans migraine

Marie-Thérèse Yapi
11 min de lecture

Comprendre et utiliser la balise canonique pour le référencement SEO

Vous êtes novice en et le terme « balise canonique » vous paraît aussi mystérieux qu'un casse-tête chinois ? Vous avez peut-être entendu dire que cette balise est cruciale pour gérer le contenu en double sur un site web. Vous voulez bien comprendre comment tout ça fonctionne. Si vous vous sentez concerné par ces propos, alors vous êtes au bon endroit.

Dans cet article, vous découvrirez l'essentiel à savoir sur cette notion clé du référencement technique.

Qu'est-ce qu'une balise canonique ?

La balise canonique est une ligne de code HTML qui joue un rôle très important en SEO.

Également appelée balise canonical ou rel=canonical1, voici à quoi elle ressemble : 

<link rel="canonical" href="URL_de_la_page_canonique">

Sa fonction est d'aider les moteurs de recherche à reconnaître la version « principale » ou « originale» d'une page qui existe en plusieurs versions.

Grâce à elle, le robot d'indexation2 sait quelle version d'une page il doit afficher dans les SERP.

Ajouter une balise rel=canonical sur une page web, c'est comme laisser une note qui dit : 

« Coucou GoogleBot ! Attention, cette page est une copie. Voici sa version originale. C'est cette dernière que je veux que tu indexes et présentes aux internautes dans la SERP. »

En somme, une balise canonique permet de définir une page ou URL canonique3.

Comment fonctionne une balise rel=canonical concrètement ?

Supposons que vous avez un blog de cuisine sur lequel une page recette est accessible via quatre URL différentes :

  • URL 1 : https://www.monsitecuisine.com/recettes/poulet-curry
  • URL 2 : https://www.monsitecuisine.com/recettes/poulet-curry?source=facebook
  • URL 3 : https://www.monsitecuisine.com/recettes/poulet-curry?print=1
  • URL 4 : https://www.monsitecuisine.com/recettes/poulet-curry/pfd

Vous pouvez par exemple décider de définir l'URL 1 comme URL canonique.

Il suffit de lui attribuer la balise link rel=canonical, comme ceci : <link rel= »canonical » href= » https://www.mon-site-cuisine.com/recettes/poulet-curry »/>.

Ensuite, vous placez ce lien dans le code source des autres pages (URL 2, URL 3, URL 4). 

Ainsi, comprend que l'URL 1 est celle qu'il doit indexer et afficher dans les résultats de recherche, à la place des autres.

NB : Comme l'a expliqué Martin Splitt Google considère la balise canonique comme une suggestion et non comme une directive. Il pourrait donc, pour une raison ou une autre, ignorer votre URL canonique et choisir une autre à sa place. Après tout, c'est lui, le Boss

Quand utiliser la balise canonical ?

Vous pouvez penser qu'il n'y a pas de contenu en double sur votre site Web.

Après tout, vous êtes de la team SEO White Hat. N'est-ce pas ?

Vous n'avez jamais plagié4 le contenu de quelqu'un d'autre ni publié la même page deux fois.

Alors pourquoi devriez-vous utiliser ces fameuses balises canoniques.

Détrompez-vous, la réalité est bien plus complexe.

Sur un site internet, le duplicate content n'est pas toujours volontaire ou intentionnel.

Voici quelques cas spécifiques où l'utilisation d'une balise canonique est indispensable.

  • URL paramétrées : Plusieurs URL pointent vers la même page à cause des paramètres (de recherche, d'identifiant de session, de filtres…). Dans ce cas, la balise canonique permet de spécifier quelle URL doit être considérée comme l'URL principale.
  • Page accessible via différentes URL : Que ce soit avec « www » ou sans « www », HTTPS ou HTTP, AMP ou non AMP,.. La balise canonique peut aider à spécifier la version préférée pour l'indexation.
  • Contenu à imprimer ou PDF : Lorsque vous proposez des versions en PDF de vos pages, la balise canonique peut être utilisée pour indiquer la version principale pour l'indexation.
  • Versions Mobiles : La balise canonical est également utile pour lier la version mobile de votre site (m.example.com) à la version de bureau (www.example.com) ou vice versa.

Pourquoi les balises canoniques sont-elles importantes en SEO ?

Elles aident les moteurs de recherche à indexer la « bonne page »

Lorsque différentes URL renvoient au même contenu, le robot d'indexation ne sait pas trop où donner de la tête. À dire vrai, il est un peu largué face à de tels cas.

Bien qu'il décide d'indexer une URL parmi le lot, il se pourrait qu'il affiche « la version qui ne vous convient pas » dans les SERP.

Or, en implémentant une balise canonique sur la version préférée, vous lui facilitez la tâche. Il sait laquelle des pages est la plus importante et lesquelles il doit ignorer.

Elles permettent de préserver le budget de crawl

Lorsque vous définissez les URL canoniques, vous permettez à GoogleBot de se concentrer davantage sur les pages qui comptent le plus.

Il ne perdra donc pas son temps et des ressources à explorer inutilement plusieurs versions de la même page.

Ce qui garantit une préservation du budget d'exploration.

Elles consolident le Pagerank

Lorsque plusieurs URL pointent vers le même contenu, cela entraîne une dispersion de l'autorité des backlinks et des signaux de classement. L'ajout de balises canoniques sur ces pages permet de centraliser l'équité des liens vers une seule URL, renforçant ainsi son classement global sur Google.

En somme, le contenu dupliqué peut entraîner un certain nombre de problèmes SEO susceptibles de nuire au référencement naturel du site web. Heureusement la mise en place des balises canoniques permet de les éviter (résoudre).

Comment paramétrer une URL canonique avec la balise rel=canonical ?

D'abord, vous devez identifier les contenus doublons présents sur le site web. Il suffit d'utiliser un outil SEO comme Screaming Frog.

Ensuite, choisissez la page5 que vous souhaitez définir comme URL canonique. Optez pour la page la plus pertinente et la plus qualitative.

Comme les balises Meta Robots et Hreflang, les balises canoniques se placent dans le code source des pages.

Vous devez ajouter la balise link rel=canonical dans le code source de chaque URL dupliquée.

Vous pouvez le faire manuellement.

Vous avez également la possibilité d'utiliser un plug-in pour implémenter automatiquement la balise canonical sur vos pages.

Il faudra donc passer par Yoast SEO ou RankMath pour paramétrer les URLs canoniques sur WordPress.

NB : la balise rel=canonical n'est pas le seul moyen de paramétrer une URL canonique. Il existe également d'autres méthodes :

  • Définir un en-tête de réponse HTTP rel=canonical.
  • Ajouter l'URL dans le sitemap
  • Utiliser des redirections 301.

Pour vérifier quelle URL Google a sélectionnée comme URL canonique, utilisez l'outil d'inspection d'URL de la console de recherche de Google

Questions fréquentes sur le sujet

Quel principal danger éviterez-vous en utilisant une balise canonique ?

La balise canonique protège votre site internet de la pénalité pour plagiat. En effet, l'URL canonique est l'URL que vous choisissez comme la page principale parmi plusieurs pages similaires. Elle sera indexée et affichée en priorité. Bien que les termes « URL canonique » et « balise canonique » puissent prêter à confusion, ils ne signifient pas la même chose. Comme expliqué plus haut, la balise rel=canonical est l'élément HTML qui permet de définir une URL canonique.

Qu'est-ce qu'une URL canonique auto-référentielle, et quand devrais-je l'utiliser ?

Une URL canonique auto-référentielle est une URL canonique qui pointe vers elle-même en tant que version principale. Vous devriez l'utiliser lorsque vous souhaitez spécifier que la page actuelle est la version préférée, par exemple, si votre site génère automatiquement des URL en double pour une même page.

Est-il recommandé d'ajouter plusieurs balises canoniques sur une seule page ?

Evitez d'utiliser plusieurs balises canoniques sur une seule page. Cela peut causer de la confusion pour les moteurs de recherche. Il est préférable de n'utiliser qu'une seule balise canonique par page pour indiquer clairement l'URL canonique.

Puis-je inclure des URL canoniques dans le fichier robots.txt ?

Vous ne devez pas mettre les URL canoniques dans le fichier robots.txt. Le fichier robots.txt est utilisé pour contrôler l'indexation. Il ne devrait pas être utilisé pour spécifier les URL canoniques. Les URL canoniques sont mieux gérées en utilisant la balise rel=canonical ou d'autres méthodes appropriées.

Curcial pour gérer des contenus doubles 

La balise canonique est un élément crucial en SEO pour gérer le contenu en double sur un site web. Elle guide les moteurs de recherche vers la version privilégiée d'une page, tout en préservant le budget de crawl et en consolidant le PageRank.

En utilisant correctement les balises canoniques, vous pouvez améliorer le référencement naturel de votre site et offrir une expérience utilisateur optimale.

  • La balise canonique est une ligne de code HTML, simple à installer
  • Elle indique aux moteurs de recherche, la version originale ou principale d'une page internet qui existe en plusieurs versions
  • Elle consolide votre score PageRank 
  • Elle préserve votre budget de crawl

Pour Aaron Nimzowitsch, l'un des piliers du jeu d'échecs consiste à garder le contrôle du centre. L'action d'optimiser son site avec les balises canoniques et les échecs ont quelques similitudes. Vous déplacez vos pions (pages) avec stratégie pour les moteurs de recherche, mais vous laissez toujours votre reine (la version canonique) au centre du jeu.


Références :

  1. Spécifier une URL canonique avec rel= »canonical » et d'autres méthodes, Google Search Central. Consulté le 30 janvier 2024. ↩︎
  2. URL Inspection Tool, Search Console Help. Consulté le 30 janvier 2024. ↩︎
  3. Canonicalization, Moz. Consulté le 30 janvier 2024. ↩︎
  4. URL Canonique : Guide du Débutant pour les Balises Canoniques, Semrush blog. Publié le 22 septembre 2023. Consulté le 30 janvier 2024. ↩︎
  5. Canonical tags: the complete guide, Hallam. Publié le 07 décembre 2023. Consulté le 30 janvier 2024. ↩︎
Partagez cet article