Trouver et éviter le contenu dupliqué sur son site

Le contenu dupliqué (ou dit en double) fait référence à des parties importantes de texte identique ou très similaire qui apparaissent sur plusieurs pages Web, soit au sein d’un domaine, soit entre plusieurs domaines. Le contenu dupliqué est considéré comme problématique pour le référencement, car les moteurs de recherche évitent d’inclure des pages Web similaires dans les résultats de recherche, car ils compromettent l’expérience utilisateur.

Qu’est-ce qu’un contenu dupliqué ?

Pris de manière restrictive, le contenu en double fait référence à un contenu très similaire, ou exactement identique, se trouvant sur plusieurs pages de votre propre site Web ou sur d’autres sites Web.

Dans l’ensemble, le contenu dupliqué est un contenu qui ajoute peu ou pas de valeur à vos visiteurs. Par conséquent, les pages avec peu ou pas de contenu corporel sont également considérées comme du contenu en double.

Vous devez éviter d’avoir du contenu en double, car cela perturbe les moteurs de recherche et peut nuire à vos performances de référencement. Avoir une douzaine de pages de contenu en double sur un site Web de 100 pages est quelque chose à examiner et à corriger. Mais le contenu en double pèsera vraiment sur vos performances de référencement lorsqu’il y a une quantité excessive de contenu dupliqué (un rapport de plus de 3 pages de contenu en double pour chaque page normale).

Contenu dupliqué en SEO

Pourquoi le contenu en double est-il mauvais pour le référencement?

Le contenu en double est mauvais pour deux raisons :

  1. Lorsqu’il existe plusieurs versions de contenu disponibles, il est difficile pour les moteurs de recherche de déterminer la version à indexer, puis de l’afficher dans leurs résultats de recherche. Cela réduit les performances pour toutes les versions du contenu, car elles se font concurrence.
  2. Les moteurs de recherche auront du mal à consolider les métriques de lien (autorité, pertinence et confiance) pour le contenu, en particulier lorsque d’autres sites Web sont liés à plus d’une version de ce contenu.

Y a-t-il une pénalité pour le contenu dupliqué ?

Avoir du contenu en double peut nuire à vos performances de référencement. Mais cela ne vous donnera pas de pénalité de Google tant que vous n’avez pas copié intentionnellement le site Web de quelqu’un d’autre. Si vous êtes un propriétaire honnête de site Web avec des défis techniques sur le site Web et que vous n’essayez pas de tromper Google, vous n’avez pas à vous soucier d’obtenir une pénalité de Google.

Si vous avez copié de grandes quantités de contenu d’autres personnes, alors vous marchez sur des œufs. Voici ce que Google en dit :

Le contenu en double sur un site n’est pas un motif d’action sur ce site, sauf s’il apparaît que l’intention du contenu en double est d’être trompeur et de manipuler les résultats des moteurs de recherche. Si votre site souffre de problèmes de contenu en double et que vous ne suivez pas les conseils énumérés ci-dessus, nous choisissons bien une version du contenu à afficher dans nos résultats de recherche.

Causes courantes de contenu en double

Le contenu en double est souvent dû à un serveur Web ou un site Web mal configuré. Ces événements sont de nature technique et n’entraîneront probablement jamais de pénalité pour Google. Cependant, ils peuvent sérieusement nuire à votre classement, il est donc important d’en faire une priorité.

Mais en plus des causes techniques, il y a aussi des causes d’origine humaine : du contenu qui est délibérément copié et publié ailleurs. Comme nous l’avons dit, ceux-ci peuvent entraîner des sanctions s’ils ont une intention malveillante.

Contenu en double pour des raisons techniques

Non-www vs www et HTTP vs HTTPs

Supposons que vous utilisez le sous-domaine www et HTTPs. Ensuite, votre moyen préféré de diffuser votre contenu est via https://www.example.com. Ceci est votre domaine canonique.

Si votre serveur Web est mal configuré, votre contenu peut également être accessible via :

Contenu en double pour les URLs

Choisissez un moyen privilégié de servir votre contenu, et mettre en œuvre des redirections 301 pour les moyens non préférés qui mènent à la version préférée: https://www.example.com.

Contenu en double causé par le contenu copié

La recherche payante nécessite des pages de destination dédiées qui ciblent des mots clés spécifiques. Les pages de destination sont souvent des copies des pages originales, qui sont ensuite ajustées pour cibler ces mots clés spécifiques. Étant donné que ces pages sont très similaires, elles produisent un contenu en double si elles sont indexées par les moteurs de recherche.

Contenu dupliqué titre h1

Empêchez les moteurs de recherche d’indexer les pages de destination en implémentant l’attribut « noindex » des méta robots. En règle générale, il est recommandé de ne pas créer de lien vers vos pages de destination ni de les inclure dans votre sitemap XML.

Autres parties copiant votre contenu

Du contenu dupliqué peut également provenir d’autres personnes copiant votre contenu et le publiant ailleurs. C’est en particulier un problème si votre site Web a une autorité de domaine faible et que celui qui copie votre contenu a une autorité de domaine plus élevée. Les sites Web dotés d’une autorité de domaine supérieure sont souvent explorés plus fréquemment, ce qui entraîne que le contenu copié est d’abord exploré sur le site Web de celui qui a copié le contenu. Ils peuvent maintenant être perçus comme l’auteur d’origine et se classer au-dessus de vous.

Assurez-vous que d’autres sites Web vous créditent à la fois en implémentant une URL canonique menant à votre page et en créant un lien vers votre page. S’ils ne le souhaitent pas, vous pouvez envoyer une demande DMCA à Google et/ou engager une action en justice.

Copie de contenu à partir d’autres sites Web

La copie de contenu à partir d’autres sites Web est également une forme de contenu en double. Google a documenté la meilleure façon de gérer cela d’un point de vue SEO : un lien vers la source d’origine, combiné avec une URL ou une meta robots noindexbalise canonique. Gardez à l’esprit que tous les propriétaires de sites Web ne sont pas satisfaits de l’utilisation de leur contenu, il est donc recommandé de demander la permission d’utiliser leur contenu.

Recherche de contenu en double

Recherche de contenu en double sur votre propre site Web

À l’aide d’outils, vous pouvez facilement trouver du contenu en double en vérifiant si vos pages ont un titre de page unique, une méta description et un en-tête H1 . Vous pouvez le faire en accédant à la section Problèmes et en ouvrant les cartes «Méta-informations» et «Titres de contenu». 

Voir s’il y a des problèmes ouverts concernant :

  • « Le titre de la page n’est pas unique »
  • « La méta description n’est pas unique »
  • « Le titre H1 n’est pas unique »

Trouver du contenu en double en dehors de votre propre site Web

Si vous avez un petit site Web, vous pouvez essayer de rechercher dans Google des phrases entre guillemets. Vous pouvez facilement trouver du contenu en double en vérifiant si vos pages ont un titre de page unique, une méta description et un en-tête H1.

Vous souhaitez vérifier si vous avez du contenu dupliqué sur votre site internet ? Nous vous offrons cette possibilité lors de notre audit SEO ! Commencez un audit SEO de base maintenant et découvrez le contenu dupliqué.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *