bloggerselite logo

Contenu dupliqué : Qu’est-ce que c’est + 4 façons d’y remédier

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier

Qu’est-ce que le contenu dupliqué ?

Le contenu en dupliqué est un contenu identique ou très similaire qui apparaît à plusieurs endroits en ligne. 

Ainsi, même si un élément de contenu n’est pas une copie exacte d’une autre page, il peut toujours être considéré comme un doublon s’il est suffisamment similaire à cette autre page.

Voici à quoi ressemblent des contenus identiques et similaires :

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Un contenu copié mot à mot et légèrement réécrit

Il peut y avoir du contenu dupliqué sur différentes pages Web de votre site. Ou sur des sites Web distincts.

Pour être considéré comme un doublon, un élément de contenu doit présenter les éléments suivants :

  • Chevauchement notable dans la formulation, la structure et le format avec un autre texte
  • Peu ou pas d’informations originales
  • Aucune valeur ajoutée pour le lecteur par rapport à une page similaire

Dans cet article, nous expliquerons l’impact du contenu dupliqué  sur le référencement et cinq causes courantes de contenu dupliqué . Et vous montrer comment éviter et résoudre les problèmes de contenu dupliqué .

Commençons par l’impact SEO.

Impact SEO Contenu dupliqué

Il n’y a aucune pénalité de Google pour le contenu dupliqué, sauf si celui-ci a l’intention de « être trompeur et de manipuler les résultats des moteurs de recherche ». 

Alors, pourquoi la duplication de contenu est-elle un problème pour le SEO ? Nous allons jeter un coup d’oeil:

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Quel est l’impact du contenu en double sur le référencement

Cela peut nuire à votre classement

L’objectif de Google est de présenter aux chercheurs des pages contenant des informations originales et utiles. Pas des pages qui reprennent simplement du contenu déjà trouvé ailleurs (y compris le contenu de votre propre site Web).

C’est pourquoi ils disposent de systèmes de classement de recherche conçus pour donner la priorité au contenu original lors du classement des résultats.

Ainsi, si vous avez plusieurs pages qui se ressemblent, Google fera de son mieux pour identifier quelle page est l’originale.

Mais s’il ne parvient pas à identifier l’original, votre classement pourrait en souffrir. Et la page pourrait ne pas être classée du tout.

Et si votre contenu est classé, la version choisie par Google pourrait ne pas être celle que vous souhaitez afficher dans les pages de résultats des moteurs de recherche (SERP).

Conseil de pro

Pour éviter de créer du contenu dupliqué  dès le départ, exécutez votre contenu via  l’outil SEO Writing Assistant de Semrush  pour vérifier son originalité avec la fonction de vérification du plagiat.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Score du contenu de l’Assistant de rédaction SEO

Les backlinks sont des liens sur d’autres sites Web qui pointent vers votre site.

Chaque backlink est comme un vote de confiance de cet autre site Web. Ce qui indique à Google que votre contenu est probablement précis et utile.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Qu'est-ce qu'un backlink

Avoir deux versions ou plus d’un même élément de contenu peut diluer l’équité des liens, c’est-à-dire la réputation et l’autorité qui sont transmises d’une page à l’autre via un backlink.

Voici pourquoi.

Supposons que vous disposiez de deux pages identiques avec les URL suivantes :

  • https://www.gardeningwebsite.com/gardening/planting-flowers
  • https://www.gardeningwebsite.com/flowers/planting-flowers

Ainsi, si vous avez 50 backlinks entre ces deux pages, 30 d’entre eux peuvent pointer vers la première URL tandis que les 20 restants renvoient vers la seconde.

Au lieu d’avoir une page renforcée avec 50 backlinks, vous obtenez deux pages avec moins de backlinks chacune.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Comment le contenu dupliqué peut diluer les signaux de classement

Cette distribution peut potentiellement conduire à une baisse du classement dans les moteurs de recherche, car aucune des deux pages n’obtient autant d’autorité qu’une seule page.

Cela peut nuire à l’exploration de votre site

Les moteurs de recherche comme Google doivent explorer et indexer (c’est-à-dire trouver et stocker) votre contenu pour qu’il apparaisse dans les résultats de recherche.

Les pages dupliqué gaspillent votre budget d’exploration (le temps et les ressources que les robots des moteurs de recherche consacrent à l’exploration de votre site avant de continuer). Parce que les robots d’exploration peuvent finir par examiner plusieurs versions du même contenu. 

Cela réduit le nombre de pages pouvant être explorées. Ce qui peut impacter la visibilité de votre site dans les résultats de recherche.

Causes courantes derrière le contenu dupliqué accidentel 

Il existe de nombreuses raisons pour lesquelles le contenu peut être accidentellement dupliqué, impliquant principalement des problèmes structurels du site Web tels que les variations d’URL et le contenu copié. 

Voici cinq causes courantes :

1. Gestion incorrecte des variantes WWW et non-WWW

Les utilisateurs peuvent souvent accéder à des sites Web via une URL comprenant « www » au début et une URL sans celui-ci.

Si votre site est accessible dans les deux sens et que vous ne gérez pas correctement ces variations, cela peut entraîner des problèmes de contenu dupliqué.

Imaginez que votre site Web est une maison avec plusieurs entrées. Certaines personnes peuvent entrer dans votre maison par la porte d’entrée en utilisant « www.example.com ». Et d’autres peuvent entrer par la porte arrière en utilisant « exemple.com ». 

Même s’il s’agit de la même maison, les variations d’URL peuvent la faire ressembler à deux sites distincts aux yeux des moteurs de recherche.

2. Accorder l’accès avec HTTP et HTTPS

Le fait que votre site Web soit accessible via les protocoles HTTP et HTTPS peut également conduire à du contenu dupliqué.

C’est comme avoir une porte ordinaire avec l’URL « http://example.com » pour certains visiteurs. Et une porte ultra sécurisée et verrouillée avec l’URL « https://example.com » pour les autres. 

Les robots de recherche les voient comme des portes menant à différentes maisons si vous ne leur dites pas quelle porte est l’entrée principale. 

3. Utiliser à la fois des barres obliques finales et des barres obliques non finales

Google considère les variantes d’une URL avec et sans barre oblique finale (“/”) comme du contenu dupliqué.

Par exemple, les deux URL suivantes seraient considérées comme uniques aux moteurs de recherche :

  • www.exemple.com/page/
  • www.exemple.com/page 

Pour éviter cette duplication, choisissez une approche des barres obliques finales sur les URL de vos pages et respectez-la. (Plus d’informations sur la façon d’utiliser les redirections 301 pour résoudre ce problème bientôt.)

prenons en exemple les captures d’écran de l’ adresse du blog Semrush.

Ainsi, si vous saisissez « https://www.semrush.com/blog » dans votre navigateur, vous serez immédiatement redirigé vers « https://www.semrush.com/blog/ ».

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Une redirection vers la page « https://www.semrush.com/blog/ »

4. Y compris le contenu récupéré ou copié

Le scraping de contenu se produit lorsque quelqu’un copie le contenu d’un site Web et le publie sur un autre site sans autorisation ni attribution appropriée.

Mais Google est généralement assez doué pour faire la distinction entre la source originale et le contenu copié. Ils ont déjà écrit sur la façon dont ils traitent le contenu récupéré , en disant :

Vous ne devriez pas être trop inquiet de voir les effets négatifs de la présence de votre site sur Google si vous remarquez que quelqu’un récupère votre contenu.

Conseil de pro

Pour éviter de copier accidentellement du contenu d’un autre site, exécutez votre contenu via  l’assistant de rédaction SEO de Semrush . Et utilisez la fonctionnalité qui vérifie l’originalité.

5. Avoir des versions mobiles et de bureau distinctes

Une façon de structurer votre site pour le rendre adapté aux mobiles consiste à utiliser des URL distinctes pour les versions de bureau et mobiles.

Par exemple, vous pouvez utiliser « exemple.com » pour les utilisateurs d’ordinateurs de bureau. Et « m.example.com » pour les utilisateurs mobiles.

Cette approche vous permet d’adapter le contenu et la conception spécifiquement aux appareils mobiles, afin de garantir une expérience plus conviviale.

Mais si elle n’est pas correctement mise en œuvre, l’utilisation d’URL distinctes pour les versions mobile et de bureau peut entraîner des problèmes de contenu dupliqué .

Comment trouver du contenu dupliqué  

La première étape pour lutter contre le contenu dupliqué  dans le référencement est de savoir où cela se produit sur votre site (le cas échéant). 

Voici deux façons de procéder :

Auditez votre site pour identifier le contenu dupliqué 

Vérifier régulièrement le contenu dupliqué de votre site vous aide à résoudre les problèmes dès le début.

Vous pouvez parcourir vos pages manuellement si votre site est suffisamment petit. Mais c’est inefficace. Et tu pourrais manquer certaines pages

Nous vous suggérons donc d’exécuter votre site via l’outil d’audit de site de Semrush .

Pour commencer, ouvrez l’outil, saisissez votre URL dans la barre de recherche et cliquez sur « Démarrer l’audit ».

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Barre de recherche de l'outil d'audit de site

Ensuite, il vous sera demandé de configurer les paramètres de base du crawl. Cela inclut la définition d’une limite pour les pages vérifiées et d’une fréquence d’audit. Vous pouvez suivre ce guide étape par étape pour configurer votre audit afin de parcourir les paramètres.

Lorsque vous êtes prêt, cliquez sur « Démarrer l’audit du site ».

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Fenêtre « Paramètres d'audit du site »

Lorsque vos résultats sont prêts, vous verrez un tableau de bord similaire à celui-ci : 

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Tableau de bord de présentation de l'audit de site

Cliquez sur l’onglet « Problèmes » pour voir une liste complète des problèmes techniques et le nombre de pages qu’ils affectent.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Rapport « Problèmes » dans l'outil d'audit de site

Ensuite, saisissez « dupliquer » dans la barre de recherche au-dessus de la liste des problèmes techniques.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Recherche de problèmes contenant un mot « en double » dans l'outil d'audit de site

Site Audit signale les pages comme contenu dupliqué si leur contenu est identique à au moins 85 %. Il signale également les titres et les méta descriptions dupliqué.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Problèmes de contenu en double, de balises de titre et de méta-description détectés dans l'audit du site

Si votre domaine comporte des pages dupliqués, vous verrez un lien « Pourquoi et comment résoudre ce problème » sur la même ligne. 

Cliquez dessus pour voir une fenêtre contextuelle contenant plus d’informations sur le problème donné et comment vous pouvez le résoudre.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Pourquoi et comment résoudre la fenêtre contextuelle du problème de contenu en double

Surveiller les pages indexées dans Google Search Console

Google Search Console (GSC) est un outil gratuit que vous pouvez utiliser pour voir si toutes vos pages sont indexées. Et lesquels ne le sont pas.

L’outil vous indique également pourquoi les pages ne sont pas indexées. Et l’une de ces raisons est le contenu dupliqué.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Section "Pourquoi les pages ne sont pas indexées" dans GSC

Pour commencer, configurez GSC. Si vous ne savez pas comment procéder, consultez notre guide de sur Google Search Console pour une procédure pas à pas.

Cliquez ensuite sur l’onglet « Pages » sous la section « Indexation » dans le menu de gauche.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Accédez à la section « Indexation » dans GSC

Vous verrez un graphique qui vous indique combien de pages sont indexées et combien de pages ne le sont pas.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - La section "Indexation des pages" indique combien de pages sont indexées et combien ne le sont pas.

Faites défiler vers le bas pour voir les raisons pour lesquelles vos pages n’ont pas été indexées.

Pour obtenir une liste de vos pages dupliqué, cliquez sur l’erreur « Dupliqué, Google a choisi un canonique différent de celui de l’utilisateur » si vous l’avez.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Erreur « Dupliqué, Google a choisi un canonique différent de celui de l'utilisateur » mise en évidence

Cela ouvrira un rapport qui vous montrera un graphique du nombre de pages affectées que vous avez eu au fil du temps. Et une liste de pages avec des doublons. 

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Pages concernées avec section d'exemples dans GSC

Vous pouvez résoudre le problème en utilisant l’une des méthodes indiquées ci-dessous. Et cliquez sur « Valider le correctif » pour inviter Google à vérifier votre site.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Bouton « Valider le correctif » en surbrillance

Comment résoudre les problèmes de contenu dupliqué

Il est maintenant temps de passer en revue ce que vous pouvez faire pour éviter les problèmes liés au contenu dupliqué. Ou remédier aux problèmes actuels.

Voici deux méthodes que vous pouvez utiliser :

Implémenter des balises canoniques

Les balises canoniques (également appelées balises rel=”canonical”) sont des extraits de code HTML qui spécifient l’URL préférée pour le contenu dupliqué ou très similaire.

Une balise canonique indique aux moteurs de recherche quelle version de votre page vous souhaitez qu’ils indexent et affichent dans les résultats de recherche.

Vous pouvez trouver la balise dans la section <head> du code HTML d’un site Web. Voici un exemple de ce à quoi cela ressemble :

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Section de balise canonique du code HTML d'un site Web

Les balises canoniques autoréférentielles (c’est-à-dire les balises sur une page qui pointent vers elle-même) peuvent également protéger votre contenu des scrapers. En effet, elles indiquent aux moteurs de recherche que la page sur laquelle ils se trouvent est la source originale et faisant autorité. 

Si les scrapers copient votre contenu et n’incluent pas correctement cette balise, les moteurs de recherche sont plus susceptibles de reconnaître votre page comme l’originale.

L’ajout d’une balise canonique à votre page diffère en fonction du système de gestion de contenu que vous utilisez : WordPress, Webflow, etc.

Le moyen le plus simple de le faire dans WordPress est d’utiliser le plugin Yoast SEO.

Tout d’abord, connectez-vous à votre compte WordPress.

Ensuite, ajoutez Yoast SEO à votre site WordPress en cliquant sur « Plugins » > « Ajouter un nouveau » dans le menu de gauche.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Ajouter un nouveau plugin à un site WordPress

Tapez « Yoast SEO » dans la barre de recherche. Ensuite, recherchez le plugin et cliquez sur « Installer maintenant ».

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - « Yoast SEO » sélectionné dans le tableau de bord des plugins

Après avoir installé le plugin et l’avoir configuré, cliquez sur « Pages » dans la barre latérale et accédez à l’une de vos pages dupliqué.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Accédez à « Pages » dans le menu de la barre latérale de WordPress

Ensuite, ouvrez la barre latérale Yoast SEO en cliquant sur le logo Yoast SEO situé dans le coin supérieur droit de votre écran.

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Logo Yoast SEO mis en évidence dans le coin supérieur droit de la « Page en double »

Faites défiler la barre latérale jusqu’à ce que vous voyiez « Avancé ». Cliquez dessus pour déployer et entrez le lien canonique dans l’espace sous « URL canonique ».

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Section « Avancé » de la barre latérale de Yoast SEO

Si la page est un doublon, ajoutez l’URL de la page que vous souhaitez que Google indexe dans l’espace. Si vous vous trouvez sur la page que vous souhaitez indexer, saisissez l’URL de cette page pour créer une balise canonique auto-référencée.

Conseil de pro

Apprenez à utiliser Yoast SEO à son plein potentiel avec  le guide de Semrush sur Yoast SEO .

Une fois que vous avez inséré la balise canonique, l’audit de site de Semrush pour tester votre implémentation. Et voyez si le nombre de pages dupliqué a diminué.

Implémentez des redirections 301 en cas de besoin

Une redirection 301 redirige définitivement les utilisateurs et les moteurs de recherche d’une URL vers une autre. Cette méthode est la meilleure pour les doublons que vous n’avez pas besoin de conserver (comme après être passé de HTTP à HTTPS ou lorsque vous avez déplacé une page vers une nouvelle URL). 

Contenu dupliqué : Qu'est-ce que c'est + 4 façons d'y remédier - Pages URL A et URL B redirigées vers une troisième page avec l'URL C

Supposons que vous ayez modifié l’URL de votre page À propos de « www.url.com/about-the-company » en « https://url.com/about ».

Vous souhaiterez rediriger l’ancienne URL vers votre nouvelle URL. Pour garantir que les utilisateurs et les moteurs de recherche se retrouvent sur la bonne page.

Certaines sociétés d’hébergement mettront automatiquement en œuvre une redirection 301 lorsque vous modifiez l’URL d’une page. Mais les étapes exactes de mise en œuvre d’une redirection 301 dépendent de votre serveur et du système de gestion de contenu (CMS) que vous utilisez. 

Pour des instructions détaillées, consultez notre guide des redirections 301.

Autres ressources

Surveillez et auditez votre contenu 

Le contenu dupliqué peut avoir un impact négatif sur le référencement. Cela peut réduire votre potentiel de classement et nuire à l’exploration de votre site Web.

Mais il existe des moyens d’éviter les problèmes de contenu dupliqué. Et résolvez les problèmes avant qu’ils ne commencent à affecter les performances de votre site Web.

Utilisez l’outil d’audit de site de Semrush pour surveiller régulièrement la santé de votre site. Et voyez rapidement si vous rencontrez des problèmes de contenu dupliqué  sur votre site Web.

Contenu dupliqué : FAQ

Qu’est-ce que le contenu dupliqué ?

Duplicate content qui veut dire en français « contenu dupliqué » évoque le contenu d’une page web ou d’un site internet qui est reproduit à l’identique ou presque sur le Web.

Quel est le meilleur logiciel gratuit pour supprimer les doublons Duplicate Media Finder Free ?

#1 Auslogics Duplicate File Finder | Windows

Auslogics Duplicate File Finder est entièrement gratuit. Il peut trouver tous les types de fichiers en double, tels que les images en double, les vidéos en double et les chansons en double.

Comment Eviter le duplicate content ?

Premier principe et qui est un objectif permanent en SEO : chaque page de votre site doit cibler de se positionner sur une requête (un mot clef ou un ensemble de mots clefs donnés).

Partager cet Article :
Newsletter
Recevez des astuces et des ressources gratuites directement dans votre boîte de réception.
Derniers Articles
☰ Navigation Rapide
0
J'adorerais vos pensées, veuillez commenter.x