volume de mots et contenu dupliqué
Benjamin Bar
Benjamin Bar

Consultant SEO Freelance depuis 2010.

Facebook
Twitter
LinkedIn

Peut-on quantifier le contenu dupliqué ?

A partir de quel volume de mots, un texte identique entre 2 pages pourrait-il être considéré comme contenu dupliqué par les moteurs de recherche ? 

Mettons nous dans le contexte suivant : vous avez un site internet tout ce qu’il y a de plus basique. Mais deux de vos pages présentant votre entreprise ont pour ainsi dire le même contenu. En tout cas à première vue. 

C’est en comptant les mots, que l’on se rend compte que la page A présente plus de mots que la page B. Mais dans leur composition sémantique et grammaticale, les deux textes semblent identiques pour tout ou partie. 

Disons que 80% du texte de la page B soit la réplique du texte de la page A. 

Peut-on en déduire que le contenu de la page B est un contenu dupliqué de la page A d’un point de vue moteur de recherche ? 

Difficile de répondre à cette question car à mon sens et de ce que j’ai appris du sujet, il n’y a jamais eu de réponse concrète de donnée. 

Le contenu dupliqué est difficile à quantifier

Quand je parle de réponse concrète, je veux dire par là qu’il n’y a pas de proportions ou de chiffrage clair et prononcé par Google et les autres moteurs de recherche. Les recommandations de Google sur le contenu dupliqué sont très vagues : 

Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques dans la même langue ou sensiblement similaires

https://developers.google.com/search/docs/advanced/guidelines/duplicate-content?hl=fr#:~:text=Par%20contenu%20en%20double%2C%20on,pas%20trompeurs%20%C3%A0%20l’origine.

Google donne par la suite quelques exemples qui correspondent clairement à des pages dupliquées plutôt qu’à des textes comme on a tendance à s’occuper. 

Combien de texte alors est considéré comme contenu dupliqué ? 

Pour répondre à cette question, on va plutôt mettre en pratique notre logique. Si deux pages présentent exactement le même contenu alors on est certain qu’il s’agit de contenu dupliqué. De même que si sur ces mêmes pages le contenu a beaucoup de similitudes. 

Si vous présentez des circuits touristiques à Paris et Bordeaux, il y a de fortes chances que les contenus impliquent le même vocabulaire. La différence se fera sur l’usage d’entités comme les noms de monuments, de lieux etc… 

En revanche la notion de contenu dupliqué est plus subtile si deux pages n’ont qu’un paragraphe d’identique. 

Je considère aussi qu’une attention particulière est à apporter en fonction du type de page. Une fiche technique d’un écrou sera difficilement unique par rapport à une fiche technique d’un autre écrou. Le contenu dupliqué sera “logique” car attendu. 

Ce principe de logique est pour moi le meilleur indicateur de contenu dupliqué. Il nous oblige à considérer le texte que l’on rédige comme un élément plus précieux vis à vis des internautes à qui on l’adresse. 

D’ailleurs Google nous tend un peu la perche à ce sujet en expliquant que : 

Si de nombreuses pages de votre site sont similaires, développez chacune d’entre elles ou regroupez-les pour n’en faire qu’une seule

https://developers.google.com/search/docs/advanced/guidelines/duplicate-content?hl=fr#:~:text=Par%20contenu%20en%20double%2C%20on,pas%20trompeurs%20%C3%A0%20l’origine.

Pour conclure cet article sur des réponses peut-être un peu plus claires, je vous donnerai bien l’estimation que je fais du contenu dupliqué. j’ai tendance à me dire que si 70% d’un texte est identique à un autre alors il faut le modifier. 

Bien entendu ce ratio est personnel et surtout dépendant du volume de mots d’un texte. Une page dont le texte dupliqué comporte 200 mots devra être réécrit dans son intégralité. Si ces même 200 mots identiques sont noyés parmi 1000 autres, j’estime qu’il n’y a juste qu’un réajustement sémantique à faire.

Facebook
Twitter
LinkedIn

More to explorer

Osez prendre la parole

Osez prendre la parole

Je vois le web d’aujourd’hui comme une immense basse-cour dans laquelle il est difficile pour certain de s’exprimer tant il y a

Submit your response

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *