La création de contenu fait partie des étapes les plus importantes d’une stratégie SEO. En effet, l’objectif de chaque site est d’apparaître dans les pages de résultats de recherche pour une requête spécifique. Les propriétaires de sites web sont parfois tentés de procéder au copié collé pour générer un maximum de contenu dans les plus brefs délais. On parle également de pages dupliquées ou de duplicate content.
Définition du duplicate content
Le duplicate content consiste à reproduire le contenu d’une page web, que ce soit de manière intégrale ou partielle. Cela fait référence à des contenus identiques accessibles sur des URL différentes. Le duplicate content fait partie des techniques de black hat les plus utilisées.
On distingue deux grandes catégories de contenus dupliqués :
- Le duplicate externe : certains sites concurrents reprennent le contenu d’autres sites externes. Le texte similaire est considéré comme du contenu dupliqué. Ce type de contenu se retrouve dans le cadre d’annuaires, de fiches descriptives produits ou d’une stratégie de netlinking mal gérée.
- Le duplicate interne : les contenus dupliqués internes sont des blocs de textes identiques présents sur un même site. Ces problèmes de duplicate content souvent dûs à des paramétrages d’un Content Management System (CMS) de sites e-commerce comportant des des doubles titres ou des contenus similaires à 70%. Ils font également référence aux sites générant des URL automatiques.
Afin de détecter les contenus dupliqués, les moteurs de recherche ont mis en place la notion de pourcentage de similarité. Google peut tolérer une similarité jusqu’à 30 %. Au-delà de ce seuil, des actions manuelles peuvent être appliquées, selon l’ampleur de la situation.
Les sanctions de Google face au duplicate content
L’algorithme de Google n’a aucun intérêt à indexer des contenus similaires. C’est pourquoi il met en place des stratégies efficaces pour détecter le contenu dupliqué et privilégier la création de contenu originale. Il n’existe pas de sanction concrète en cas de contenu dupliqué. En revanche, votre stratégie de référencement naturel risquerait d’être fortement pénalisé.
Le principe est simple : sur plusieurs contenus similaires, Google ne proposera qu’un seul article sur la première page de résultat. Celui-ci sera bien évidemment la version originale. Si les robots d’indexation ont pu détecter le duplicate content dans l’une de vos pages internet, celles-ci verront leur classement chuter dans les SERP. Toutefois, Google impose des pénalités plus sévères comme la désindexation dans des cas extrêmes.
Comment éviter le duplicate content interne et externe ?
Vous pouvez adopter les mesures suivantes:
- Utilisez des URL uniques pour chaque page sur votre site internet.
- Configurez la balise canonical pour indiquer la page préférée aux moteurs de recherche.
- Evitez la publication de contenu en double en utilisant des redirections 301.
- Assurez-vous de ne pas publier de pages sous différents URL.
- Surveillez régulièrement les sources de duplicate content.
- Contactez les propriétaires de sites web qui utilisent votre contenu sans autorisation.
- Évitez de publier du contenu qui est déjà largement disponible en ligne.
- Utilisez des descriptions uniques pour chaque page dans les balises « meta description ».
- Évitez la duplication de titres de page dans les balises « title ».
- Utilisez des outils pour détecter et surveiller le duplicate content.
- Demander aux moteurs de recherche de supprimer les pages dupliquées de leurs index.
Comment éviter le contenu dupliqué pour des sites multilingues et de traduction ?
- Utilisez des URL uniques pour chaque langue et pour chaque page.
- Configurez la balise « hreflang » pour indiquer à Google la langue et la version locale de chaque page.
- Évitez de traduire le contenu mot à mot.
- Utilisez des outils de traduction automatique avec précaution.
- Assurez-vous de ne pas publier de pages sous différents URL pour chaque langue.
- Configurez l’URL canonique pour indiquer la version préférée aux moteurs de recherche.
- Vérifiez régulièrement le contenu dupliqué en utilisant des outils d’analyse de contenu, ex Siteliner, Duplichecker.
Investissez dans la rédaction de contenus uniques et originaux. Vous pouvez par exemple faire appel à une agence SEO.