
Qu’est-ce que le contenu dupliqué et comment cela affecte-t-il le référencement?
Le contenu dupliqué se produit lorsqu’un contenu identique ou similaire apparaît sur plusieurs URL. Il existe un contenu en double exact 1: 1 qui peut être créé de nombreuses manières (que nous aborderons ci-dessous) et un contenu similaire contenant des intentions de recherche qui se chevauchent.
Les deux instances de contenu dupliqué peuvent avoir un impact négatif sur les classements et les performances de recherche.
Quel est l’impact du contenu dupliqué sur les performances SEO?
Le contenu dupliqué peut avoir un impact négatif sur la visibilité de la recherche pour un certain nombre de raisons, car les moteurs de recherche ont du mal à décider quelle version du contenu afficher aux utilisateurs. En conséquence, le contenu dupliqué et / ou similaire peut créer:
- Concours interne – Les moteurs de recherche ne sauront pas quelle page classer s’ils sont identiques ou similaires. Cela peut également créer une expérience utilisateur déroutante car ils ne sauront pas sur quelle version de la page cliquer à partir des SERPs.
- Budget d’exploration gaspillé – S’il y a de nombreuses pages contenant du contenu en double et que vous ne voulez qu’une seule indexée, les robots d’exploration continueront à explorer toutes les variantes en double, ce qui peut leur prendre du temps pour explorer des pages importantes non dupliquées.
- Équité de lien diluée – Les liens externes et internes peuvent pointer vers différentes variantes de la page car il peut y avoir confusion sur laquelle créer un lien. Cela divisera l’équité du lien sur plusieurs pages, plutôt que de vous diriger vers la page que vous souhaitez indexer et classer.
Il existe de nombreuses façons de créer du contenu dupliqué. Souvent, c’est accidentel, cependant, il faut toujours y remédier.
Ces exemples d’URL semblent les mêmes pour les gens, mais ils sont techniquement différents des moteurs de recherche.
- https://seerinteractive.com
- https://www.seerinteractive.com
- https://seerinteractive.com/index.html
- https://www.seerinteractive.com/index.html
- http://www.seerinteractive.com/index.html
- https://www.seerinteractive.com/INDEX.html
Vous trouverez ci-dessous quelques méthodes courantes de création de contenu dupliqué:
Http contre Https
Cela se produit lorsqu’un site est accessible à la fois en http et en https. Une raison courante pour laquelle cela se produit est que si votre site est déplacé vers https et que vous n’avez pas correctement migré (redirection 301) la version http vers la version https, vous rencontrerez des problèmes de contenu en double. Explorer Liste de contrôle de la migration du voyant pour plus d’informations.
- https://www.seerinteractive.com
- http://www.seerinteractive.com
Www vs non-www
Cela se produit lorsqu’un site est accessible à la fois en www et non-www. Il est important qu’un site ne résout qu’une seule version, que ce soit www ou non-www. Le fait d’avoir les deux variantes en direct crée du contenu en double.
- https://seerinteractive.com
- https://www.seerinteractive.com
URL à casse mixte
Une duplication de casse mixte peut se produire lorsque les URL sont accessibles avec des caractères majuscules et minuscules. Idéalement, les URL doivent toujours être résolues en caractères minuscules pour éviter les problèmes de contenu en double.
- https://seerinteractive.com/Blog
- https://www.seerinteractive.com/blog
URL de barre oblique de fin ou non de fin et / ou fins d’URL multiples
La duplication des barres obliques de fin et non de fin peut se produire lorsque les URL ont des fins multiples et incohérentes. Cela peut également se produire lorsque les URL se terminent par / index. .html, .aspx, etc. ainsi que d’autres variantes. Les URL ne doivent être accessibles qu’avec une seule URL se terminant.
- https://seerinteractive.com/blog
- https://www.seerinteractive.com/blog/
Paramètres
Les paramètres peuvent être utilisés pour plusieurs raisons. Les utilisations courantes des paramètres consistent à modifier le contenu d’une page via des facettes et des filtres et à des fins de suivi. Souvent, les URL paramétrées peuvent créer un contenu léger qui n’a que peu de valeur pour les moteurs de recherche.
Le contenu dupliqué / léger généré à partir de facettes peut être traité avec soin grâce à des balises canoniques, des balises noindex, un blocage robots.txt ou une combinaison de ces éléments.
Dans l’exemple ci-dessous, la canonisation de l’URL paramétrée vers l’URL propre serait probablement la plus logique.
- URL paramétrée: https://www.example.com/rugs/floor-rugs?brand_name=21688&nav_color=19342&nav_price=11334&nav_style=11609
- Nettoyer l’URL: https://www.example.com/rugs/floor-rugs
Proche des doublons
Un contenu presque en double se produit lorsque des pages similaires sur un site partagent la même intention de recherche.
Par exemple, si nous avons une page de destination sur «Pourquoi le référencement est-il important» et une page de destination distincte sur les «Avantages du référencement», ces deux pages vont probablement se concurrencer pour les mêmes termes de recherche. Plutôt que d’avoir deux pages avec des thèmes de contenu similaires, nous devrions les combiner en une seule page de destination.
- Pour les problèmes de contenu dupliqué HTTP vs HTTPS, vous devez implémenter des redirections 301 de la variante d’URL HTTP vers l’URL HTTP. Il est important que les pages HTTP soient soigneusement redirigées vers leurs HTTP réciproques pour éviter la perte de capitaux propres et créer une mauvaise expérience utilisateur.
- Pour les URL www et non-www, avec casse mixte et barre oblique de fin ou non, vous pouvez implémenter une redirection 301 côté serveur pour forcer les URL à une variante d’URL.
- Si les redirections ne sont pas une option ou si les pages en double sont nécessaires dans plusieurs sections du site, vous pouvez canoniser la page la moins performante vers la page la plus performante. Cela signalera à Google qu’une seule des pages doit être indexée et classée.
- Les balises canoniques ne doivent être utilisées que pour les doublons 1: 1. En savoir plus sur les balises canoniques et leur utilisation ici.
- S’il existe de nombreuses pages de contenu dupliqué, la mise en œuvre d’une stratégie canonique ne conservera pas le budget d’exploration.
- Si les redirections ne sont pas une option ou si les pages en double sont nécessaires dans plusieurs sections du site, vous pouvez canoniser la page la moins performante vers la page la plus performante. Cela signalera à Google qu’une seule des pages doit être indexée et classée.
- Comment résoudre un contenu similaire: Si les pages ne sont pas des doublons 1: 1 mais partagent une intention de recherche similaire, envisagez de fusionner tout contenu unique et pertinent de la page redirigée vers la page de destination de destination pour créer une page de destination solide. Les redirections 301 doivent être utilisées pour consolider les pages similaires en 1.
* Pour toutes les solutions de contenu en double, n’oubliez pas de mettre à jour les liens internes et le plan du site XML pour n’inclure que la destination de l’URL canonisée ou de redirection.
Comment décider sur quelles URL consolider le contenu dupliqué?
Comme mentionné ci-dessus, la consolidation du contenu doit être effectuée en 301 en redirigeant ou en canonisant la page la moins performante vers la page la plus performante.
Vous trouverez ci-dessous quelques mesures à prendre en compte lors de la recherche de la page la plus performante pour consolider le contenu dans:
- Circulation
- Les conversions
- Classement des mots clés
- Nombre de backlinks