Contenu dupliqué et Google : les meilleures pratiques à suivre pour ne pas subir les pénalités

La duplication de contenu sur le web pose un véritable problème au niveau du référencement. Selon cette infographie réalisée par SemRush, 50% des sites web interrogés ont des soucis avec leur SEO directement en lien à du contenu dupliqué. Que la cause de ce phénomène soit d’origine humaine ou purement informatique, les pénalités de Google concernant votre SEO peuvent vite devenir gênantes pour votre entreprise. Alors comment se prémunir contre ce phénomène ? Quelles sont les bonnes pratiques à mettre en place pour protéger votre site web de ce problème ?

Contenu dupliqué : quelles explications ?

Google définit le contenu dupliqué comme plusieurs blocs de textes de taille relativement importante qui seraient exactement similaires ou sensiblement semblables, et qui se retrouveraient sur plusieurs URL distinctes issues du même domaine ou encore de sites complètement différents. Le premier moteur de recherche mondial est connu pour toujours prôner un contenu de qualité, véritable condition sine qua non pour atteindre les premières places dans les résultats des requêtes des internautes. Mais qui dit qualité, dit contenu 100% original et ce phénomène de duplication de textes vient véritablement à l’encontre de cette devise.

Pourtant les entreprises présentes sur le web ont de plus en plus de difficultés à éviter le contenu dupliqué de leurs supports web, et les raisons pour cela sont multiples:

  • Les copies volontaires de contenu : il se peut en effet que votre contenu soit copié à des fins malicieuses, il pourra alors potentiellement être considéré comme spam. Ce sera le cas par exemple si vous découvrez que votre contenu a été utilisé en l’état sur un autre site, contre tout accord de votre part et à votre insu.
  • Les raisons purement techniques : la plupart du temps cependant, les contenus dupliqués sont liés à des raisons purement techniques, du fait de la création même ou la refonte d’un site internet. Généralement présents sur le même domaine, il y a plusieurs raisons qui peuvent être à l’origine d’une duplication de contenus : erreurs de pagination, URLs similaires pour un même texte etc…
  • Les erreurs humaines : certaines mauvaises pratiques dans la stratégie de contenu de votre site peuvent également être à l’origine de contenu dupliqué. C’est le cas notamment si vous utilisez les textes de vos fournisseurs pour vos fiches produits par exemple, créant ainsi du contenu dupliqué présent sur le site officiel de votre fournisseur ou même sur d’autres sites de revendeurs.

Quels sont les risques encourus dans le cas d’un contenu dupliqué ?

Il y a de nombreux débats autour des pénalités que coure un site proposant du contenu dupliqué. Pourtant, Google précisait en 2008 sur un article de blog intitulé «Demystifying the duplicate content penalty », qu’ils n’existaient pas à proprement parler de pénalités pour la duplication de contenus, du moins dans la mesure où vous ne copiez pas volontairement du contenu existant sur votre site à des fins malicieuses par exemple. Car être considéré comme un « spammeur » pour les algorithmes de Google peut effectivement avoir de nombreuses conséquences au niveau de votre SEO, voire même conduire à la disparition complète de votre site sur le moteur de recherche.

Mais si les chances sont minces pour qu’un tel scénario catastrophe se produise, un contenu dupliqué par ailleurs peut tout de même avoir certaines conséquences sur les performances de vos pages et sur votre référencement, et cela s’explique par la manière dont les robots du moteur de recherche considéreront vos pages dans un tel cas de figure. Pour résumer ce processus, les robots de Google réalisent d’eux-mêmes un tri sélectif lors de la détection de contenus dupliqués et vont donc décider de discréditer certaines pages au bénéfice d’une page maîtresse sélectionnée en fonction de leurs critères de choix. L’infographie suivante résume en détails ce mécanisme qui a pour objectif de ne proposer qu’une seule et même page dans les résultats de recherche pour le même contenu, dans un souci de préservation de l’expérience utilisateur et pour éviter de proposer des résultats multiples au contenu identique aux internautes.

 

Les bonnes pratiques à mettre en place dès maintenant pour protéger votre contenu

Cela étant dit, il existe néanmoins quelques bonnes pratiques assez simples à mettre en œuvre afin de limiter ce phénomène de duplication, qu’il soit interne à votre domaine ou bien externe à votre site.

  • Cherchez les contenus dupliqués via Google Analytics

La première chose à faire est de détecter vos contenus dupliqués. Pour cela, vous pouvez utiliser une fonctionnalité de Google Analytics qui vous permet d’identifier tous les doublons au sein de votre contenu. Au sein du Webmaster Tools, vous allez pouvoir rapidement repérer ces duplicatas en allant dans « Améliorations html » puis dans la rubrique des titres identiques, qui représenteront en toute logique ces contenus dupliqués.

Il existe également d’autres logiciels qui vous permettent d’aller plus loin dans l’analyse de vos contenus dupliqués, et notamment ceux extérieurs à votre site. C’est le cas par exemple de Copyscape ou de Siteliner, qui pourront repérer un extrait de contenu sur le web et vous permettre également d’identifier des liens morts ou d’autres anomalies sur votre site.

  • Utilisez une feuille de style pour l’impression

Une des origines courantes d’un contenu dupliqué est la mise à disposition sur votre site des versions imprimables de votre contenu. Dans un tel cas de figure, vous aurez deux contenus identiques pour deux URLs différents, par exemple ‘combustible/article1’ et ‘combustible/print/article1’. Afin de corriger ce problème, nous vous conseillons d’utiliser des feuilles de style pour l’impression de vos contenus, plutôt que de proposer des versions imprimables distinctes.

  • Vous concentrer sur une URL unique

De manière générale, lorsque vous allez identifier les duplications de contenu, il va falloir les rediriger vers un URL unique afin que Google comprenne quelle page est la page maîtresse dans votre architecture. Vous pouvez indiquer votre domaine « préféré » à Google dans les outils de la Search Console. Cependant, et afin d’appuyer cette démarche, nous vous conseillons de veiller à être cohérent tout au long de vos publications et notamment au sein de vos liens internes, en adoptant une attention particulière à toujours utiliser la même URL.

Les problèmes de variantes de domaines

C’est notamment le cas avec les différentes versions d’un site, en fonction des utilisations du www ou non avec le nom de domaine, ou encore celle de l’https ou du / après .com ou .ca par exemple. L’objectif sera donc ici de choisir une formulation de votre URL et de rediriger toutes les variantes sur celle-ci. On aura le même problème si l’on propose des entrées différentes en fonction du pays d’origine de l’internaute par exemple, ou encore si l’on propose des accès personnalisés aux visiteurs avec un identifiant qui ouvrira une session spécifique et qui se retrouvera par conséquent dans l’URL.  Là encore, il s’agira de choisir un domaine par défaut en le spécifiant au maximum du possible à Google par une redirection automatique ou grâce à des balises spécifiques.

Rediriger les contenus dupliqués avec redirection 301

La redirection 301 permet justement de faire comprendre aux robots de Google qu’elle est la page du contenu source à indexer sur le moteur de recherche, laquelle bénéficiera ainsi automatiquement de la notoriété des pages dupliquées. C’est une manière simple et automatique de rediriger les pages doublons afin de ne subir aucune conséquence sur votre référencement global.

Utiliser la balise canonique ou « canonical »

Une autre façon de signifier à Google les pages dites dupliquées est d’utiliser une balise intitulée en anglais « canonical ». Celle-ci permet également de spécifier aux robots que vous êtes conscients de ce doublon en lui offrant la communication du lien vers la page originale. Cette balise, à intégrer dans la partie <head> de votre page, est un procédé un peu plus long que la redirection 301 car elle est moins automatique. Les robots doivent en effet « scanner » la page avant de trouver la balise mais celle-ci a l’avantage d’assurer votre référencement tout en conservant la page concernée si vous ne voulez pas la supprimer ou la rediriger. Cette balise peut aussi être très utile dans le cas où vous partageriez du contenu qui ne serait pas le vôtre, comme par exemple des citations sur votre site. La balise canonique permettra de rediriger les robots vers la source du texte sans en inquiéter votre référencement.

La balise « Noindex » pour désindexer vos contenus dupliqués

Une autre balise qui peut s’avérer utile est la balise « Noindex » qui, intégrée à vos pages, permet de signifier à Google de ne tout simplement pas indexer votre page. Cette technique est particulièrement efficace pour réguler les problèmes liés à la pagination sur un site ou certaines pages dupliquées qui se créent automatiquement.

  • Créez vos propres fiches produits

Une autre action moins technique que vous pouvez mener dès maintenant est celle de vous assurer que votre site propose des contenus qualitatifs et 100% originaux. Ainsi, nous vous conseillons par exemple si ce n’est pas déjà fait, de réécrire les fiches produits de vos fournisseurs ou tout autre texte susceptible d’apparaître ailleurs sur le web. Non seulement cela aura un effet positif sur le référencement de votre site, mais cela permettra également de personnaliser vos textes en fonction de votre cible particulière. Cela peut donc tout à fait avoir un intérêt d’un point de vue marketing.

  • Limitez la duplication des témoignages clients

Un autre aspect auquel on ne pense pas forcément lorsque l’on étudie son contenu dupliqué est celui relatif aux témoignages clients que vous pourriez intégrer à votre site. On a souvent tendance à retrouver ces témoignages sur diverses pages au sein d’un même domaine, voire même sur des sites extérieurs. Attention donc à ne pas multiplier ces mêmes contenus de façon trop importante.

  • Contrôlez vos programmes d’affiliation

Le problème des contenus dupliqués peut également survenir si vous menez des campagnes d’affiliation pour vos produits. Dans ce cadre, vous fournissez du contenu généralement déjà présent sur votre site (descriptions, messages publicitaires etc…), à vos affiliés pour qu’ils puissent en faire la promotion sur leur propre support. Bien que ce type d’action marketing soit très intéressant d’un point de vue du développement de vos ventes et de votre notoriété, vous pourriez à l’inverse voir votre positionnement dans les moteurs de recherche littéralement s’effondrer. Car en effet, le contenu affilié est bel et bien considéré comme du contenu dupliqué pour Google. Dans ce cas, vous aurez deux solutions. La première serait de demander aux affiliés de créer leur propre description inspirée de vos contenus, la deuxième consisterait à exiger de leur part l’intégration d’une balise canonique pour signifier à Google que votre page est bel et bien la page maîtresse dans ce cas de figure. La première solution semble cependant la meilleure d’un point de vue technique et de faisabilité de mise en place.

  • Qu’en est-il des contenus dupliqués à votre insu ?

Enfin et dans le cadre d’un contenu dupliqué sur un autre site et ce sans votre accord, vous vous devez absolument de réagir en essayant de contacter l’auteur ou l’hébergeur du site afin que celui-ci retire vos contenus de son site. Dans le cas où vos actions seraient restées sans effet, vous pourrez vous retourner contre l’imitateur directement via Google en demandant la suppression du contenu du site concerné.

Si vous vous retrouvez dans le cas extrême où Google aurait pénalisé votre site injustement en le désindexant complètement des résultats, vous pourrez demander une demande de réexamen après avoir réglé la cause de votre problème de contenu dupliqué. Heureusement, ces cas de figure ne surviennent que très peu souvent, mais n’oubliez pas que les contenus dupliqués ont la capacité d’être gérés et limités, alors autant en profiter pour ne pas s’attirer les foudres de Google ! Le principal ici étant de respecter au maximum les directives du moteur de recherche, comme le résume l’infographie ci-dessous, afin de bénéficier d’un SEO optimisé et efficace pour votre entreprise.

 

La duplication de contenu sur le web pose un véritable problème au niveau du référencement. Selon cette infographie réalisée par SemRush, 50% des sites web interrogés ont des soucis avec leur SEO directement en lien à du contenu dupliqué. Que la cause de ce phénomène soit d’origine humaine ou purement informatique, les pénalités de Google concernant votre SEO peuvent vite devenir gênantes pour votre entreprise. Alors comment se prémunir contre ce phénomène ? Quelles sont les bonnes pratiques à mettre en place pour protéger votre site web de ce problème ?

Contenu dupliqué : quelles explications ?

Google définit le contenu dupliqué comme plusieurs blocs de textes de taille relativement importante qui seraient exactement similaires ou sensiblement semblables, et qui se retrouveraient sur plusieurs URL distinctes issues du même domaine ou encore de sites complètement différents. Le premier moteur de recherche mondial est connu pour toujours prôner un contenu de qualité, véritable condition sine qua non pour atteindre les premières places dans les résultats des requêtes des internautes. Mais qui dit qualité, dit contenu 100% original et ce phénomène de duplication de textes vient véritablement à l’encontre de cette devise.

Pourtant les entreprises présentes sur le web ont de plus en plus de difficultés à éviter le contenu dupliqué de leurs supports web, et les raisons pour cela sont multiples:

  • Les copies volontaires de contenu : il se peut en effet que votre contenu soit copié à des fins malicieuses, il pourra alors potentiellement être considéré comme spam. Ce sera le cas par exemple si vous découvrez que votre contenu a été utilisé en l’état sur un autre site, contre tout accord de votre part et à votre insu.
  • Les raisons purement techniques : la plupart du temps cependant, les contenus dupliqués sont liés à des raisons purement techniques, du fait de la création même ou la refonte d’un site internet. Généralement présents sur le même domaine, il y a plusieurs raisons qui peuvent être à l’origine d’une duplication de contenus : erreurs de pagination, URLs similaires pour un même texte etc…
  • Les erreurs humaines : certaines mauvaises pratiques dans la stratégie de contenu de votre site peuvent également être à l’origine de contenu dupliqué. C’est le cas notamment si vous utilisez les textes de vos fournisseurs pour vos fiches produits par exemple, créant ainsi du contenu dupliqué présent sur le site officiel de votre fournisseur ou même sur d’autres sites de revendeurs.

Quels sont les risques encourus dans le cas d’un contenu dupliqué ?

Il y a de nombreux débats autour des pénalités que coure un site proposant du contenu dupliqué. Pourtant, Google précisait en 2008 sur un article de blog intitulé «Demystifying the duplicate content penalty », qu’ils n’existaient pas à proprement parler de pénalités pour la duplication de contenus, du moins dans la mesure où vous ne copiez pas volontairement du contenu existant sur votre site à des fins malicieuses par exemple. Car être considéré comme un « spammeur » pour les algorithmes de Google peut effectivement avoir de nombreuses conséquences au niveau de votre SEO, voire même conduire à la disparition complète de votre site sur le moteur de recherche.

Mais si les chances sont minces pour qu’un tel scénario catastrophe se produise, un contenu dupliqué par ailleurs peut tout de même avoir certaines conséquences sur les performances de vos pages et sur votre référencement, et cela s’explique par la manière dont les robots du moteur de recherche considéreront vos pages dans un tel cas de figure. Pour résumer ce processus, les robots de Google réalisent d’eux-mêmes un tri sélectif lors de la détection de contenus dupliqués et vont donc décider de discréditer certaines pages au bénéfice d’une page maîtresse sélectionnée en fonction de leurs critères de choix. L’infographie suivante résume en détails ce mécanisme qui a pour objectif de ne proposer qu’une seule et même page dans les résultats de recherche pour le même contenu, dans un souci de préservation de l’expérience utilisateur et pour éviter de proposer des résultats multiples au contenu identique aux internautes.

 

Les bonnes pratiques à mettre en place dès maintenant pour protéger votre contenu

Cela étant dit, il existe néanmoins quelques bonnes pratiques assez simples à mettre en œuvre afin de limiter ce phénomène de duplication, qu’il soit interne à votre domaine ou bien externe à votre site.

  • Cherchez les contenus dupliqués via Google Analytics

La première chose à faire est de détecter vos contenus dupliqués. Pour cela, vous pouvez utiliser une fonctionnalité de Google Analytics qui vous permet d’identifier tous les doublons au sein de votre contenu. Au sein du Webmaster Tools, vous allez pouvoir rapidement repérer ces duplicatas en allant dans « Améliorations html » puis dans la rubrique des titres identiques, qui représenteront en toute logique ces contenus dupliqués.

Il existe également d’autres logiciels qui vous permettent d’aller plus loin dans l’analyse de vos contenus dupliqués, et notamment ceux extérieurs à votre site. C’est le cas par exemple de Copyscape ou de Siteliner, qui pourront repérer un extrait de contenu sur le web et vous permettre également d’identifier des liens morts ou d’autres anomalies sur votre site.

  • Utilisez une feuille de style pour l’impression

Une des origines courantes d’un contenu dupliqué est la mise à disposition sur votre site des versions imprimables de votre contenu. Dans un tel cas de figure, vous aurez deux contenus identiques pour deux URLs différents, par exemple ‘combustible/article1’ et ‘combustible/print/article1’. Afin de corriger ce problème, nous vous conseillons d’utiliser des feuilles de style pour l’impression de vos contenus, plutôt que de proposer des versions imprimables distinctes.

  • Vous concentrer sur une URL unique

De manière générale, lorsque vous allez identifier les duplications de contenu, il va falloir les rediriger vers un URL unique afin que Google comprenne quelle page est la page maîtresse dans votre architecture. Vous pouvez indiquer votre domaine « préféré » à Google dans les outils de la Search Console. Cependant, et afin d’appuyer cette démarche, nous vous conseillons de veiller à être cohérent tout au long de vos publications et notamment au sein de vos liens internes, en adoptant une attention particulière à toujours utiliser la même URL.

Les problèmes de variantes de domaines

C’est notamment le cas avec les différentes versions d’un site, en fonction des utilisations du www ou non avec le nom de domaine, ou encore celle de l’https ou du / après .com ou .ca par exemple. L’objectif sera donc ici de choisir une formulation de votre URL et de rediriger toutes les variantes sur celle-ci. On aura le même problème si l’on propose des entrées différentes en fonction du pays d’origine de l’internaute par exemple, ou encore si l’on propose des accès personnalisés aux visiteurs avec un identifiant qui ouvrira une session spécifique et qui se retrouvera par conséquent dans l’URL.  Là encore, il s’agira de choisir un domaine par défaut en le spécifiant au maximum du possible à Google par une redirection automatique ou grâce à des balises spécifiques.

Rediriger les contenus dupliqués avec redirection 301

La redirection 301 permet justement de faire comprendre aux robots de Google qu’elle est la page du contenu source à indexer sur le moteur de recherche, laquelle bénéficiera ainsi automatiquement de la notoriété des pages dupliquées. C’est une manière simple et automatique de rediriger les pages doublons afin de ne subir aucune conséquence sur votre référencement global.

Utiliser la balise canonique ou « canonical »

Une autre façon de signifier à Google les pages dites dupliquées est d’utiliser une balise intitulée en anglais « canonical ». Celle-ci permet également de spécifier aux robots que vous êtes conscients de ce doublon en lui offrant la communication du lien vers la page originale. Cette balise, à intégrer dans la partie <head> de votre page, est un procédé un peu plus long que la redirection 301 car elle est moins automatique. Les robots doivent en effet « scanner » la page avant de trouver la balise mais celle-ci a l’avantage d’assurer votre référencement tout en conservant la page concernée si vous ne voulez pas la supprimer ou la rediriger. Cette balise peut aussi être très utile dans le cas où vous partageriez du contenu qui ne serait pas le vôtre, comme par exemple des citations sur votre site. La balise canonique permettra de rediriger les robots vers la source du texte sans en inquiéter votre référencement.

La balise « Noindex » pour désindexer vos contenus dupliqués

Une autre balise qui peut s’avérer utile est la balise « Noindex » qui, intégrée à vos pages, permet de signifier à Google de ne tout simplement pas indexer votre page. Cette technique est particulièrement efficace pour réguler les problèmes liés à la pagination sur un site ou certaines pages dupliquées qui se créent automatiquement.

  • Créez vos propres fiches produits

Une autre action moins technique que vous pouvez mener dès maintenant est celle de vous assurer que votre site propose des contenus qualitatifs et 100% originaux. Ainsi, nous vous conseillons par exemple si ce n’est pas déjà fait, de réécrire les fiches produits de vos fournisseurs ou tout autre texte susceptible d’apparaître ailleurs sur le web. Non seulement cela aura un effet positif sur le référencement de votre site, mais cela permettra également de personnaliser vos textes en fonction de votre cible particulière. Cela peut donc tout à fait avoir un intérêt d’un point de vue marketing.

  • Limitez la duplication des témoignages clients

Un autre aspect auquel on ne pense pas forcément lorsque l’on étudie son contenu dupliqué est celui relatif aux témoignages clients que vous pourriez intégrer à votre site. On a souvent tendance à retrouver ces témoignages sur diverses pages au sein d’un même domaine, voire même sur des sites extérieurs. Attention donc à ne pas multiplier ces mêmes contenus de façon trop importante.

  • Contrôlez vos programmes d’affiliation

Le problème des contenus dupliqués peut également survenir si vous menez des campagnes d’affiliation pour vos produits. Dans ce cadre, vous fournissez du contenu généralement déjà présent sur votre site (descriptions, messages publicitaires etc…), à vos affiliés pour qu’ils puissent en faire la promotion sur leur propre support. Bien que ce type d’action marketing soit très intéressant d’un point de vue du développement de vos ventes et de votre notoriété, vous pourriez à l’inverse voir votre positionnement dans les moteurs de recherche littéralement s’effondrer. Car en effet, le contenu affilié est bel et bien considéré comme du contenu dupliqué pour Google. Dans ce cas, vous aurez deux solutions. La première serait de demander aux affiliés de créer leur propre description inspirée de vos contenus, la deuxième consisterait à exiger de leur part l’intégration d’une balise canonique pour signifier à Google que votre page est bel et bien la page maîtresse dans ce cas de figure. La première solution semble cependant la meilleure d’un point de vue technique et de faisabilité de mise en place.

  • Qu’en est-il des contenus dupliqués à votre insu ?

Enfin et dans le cadre d’un contenu dupliqué sur un autre site et ce sans votre accord, vous vous devez absolument de réagir en essayant de contacter l’auteur ou l’hébergeur du site afin que celui-ci retire vos contenus de son site. Dans le cas où vos actions seraient restées sans effet, vous pourrez vous retourner contre l’imitateur directement via Google en demandant la suppression du contenu du site concerné.

Si vous vous retrouvez dans le cas extrême où Google aurait pénalisé votre site injustement en le désindexant complètement des résultats, vous pourrez demander une demande de réexamen après avoir réglé la cause de votre problème de contenu dupliqué. Heureusement, ces cas de figure ne surviennent que très peu souvent, mais n’oubliez pas que les contenus dupliqués ont la capacité d’être gérés et limités, alors autant en profiter pour ne pas s’attirer les foudres de Google ! Le principal ici étant de respecter au maximum les directives du moteur de recherche, comme le résume l’infographie ci-dessous, afin de bénéficier d’un SEO optimisé et efficace pour votre entreprise.

 

Click to rate this post!
[Total: 1 Average: 5]
Add Your Heading Text Here

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Évaluer cette page
Click to rate this post!
[Total: 1 Average: 5]

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

CONTACTEZ-NOUS