indexation et seo
Benjamin Bar
Benjamin Bar

Consultant SEO Freelance depuis 2010.

Facebook
Twitter
LinkedIn

C’est quoi l’indexation pour un moteur de recherche ?

L’indexation d’une page web fait partie des 3 étapes de fonctionnement de la recherche. L’indexation est l’étape qui suit l’exploration que l’on connaît aussi sous le nom de crawl et précède le traitement et le classement des pages web.

L’indexation requiert une attention particulière si l’on veut mieux positionner une page web sur les moteurs de recherche. C’est pour ça que j’ai décidé d’articuler cet article autour d’elle et de vous expliquer un peu plus en détail quel est son intérêt, pour le moteur de recherche et pour vous propriétaires de site internet. 

Dans cet article je vous donnerai la définition de l’indexation, je vous dirai pourquoi elle est importante dans une stratégie seo et comment vérifier si ses pages sont bien présentes dans l’index de Google.

Définition de l’indexation dans un moteur de recherche

L’indexation se définit par une page web qui a été explorée par un robot d’exploration et dont le contenu a été analysé, puis stocké dans l’index du moteur de recherche. Une url qui a été indexée peut être affichée sur les pages de résultats de recherche en réponse à une requête effectuée par un internaute. 

L’indexation est une étape importante d’une prestation SEO dans laquelle le consultant va se donner comme objectifs de faire indexer un maximum de pages web d’un même site internet.

Pourquoi faire entrer une page web dans l’index du moteur de recherche est important ?

Si plusieurs pages web sont indexées, c’est à dire présentes dans l’index du moteur de recherche, elles pourront espérer être affichées dans les pages de résultats de recherche, en réponse à un besoin d’information émis par un internaute sous la forme d’une requête (d’un mot-clé ou d’une expression de recherche).  

Une page web indexée est une page qui a suscité un premier intérêt. Toutes les pages web ne sont pas automatiquement indexées. Il existe des critères de pertinences auxquels doivent répondre les urls avant d’être indexées.

Pour résumer : 

  • une page qui n’est pas explorée, ne peut pas être indexé et classée dans les pages de résultats de recherche de Google.
  • une page qui est explorée mais ne répond pas à plusieurs critères de pertinence, ne peut pas être indexée, ni classée (positionnée).
  • une page qui est explorée et répond aux critères de pertinence est indexée et classée. 

Aujourd’hui, l’indexation fait plutôt référence aux procédures et actions visant à garantir que les pages d’un site internet sont correctement prises en compte par les moteurs de recherche, en employant des tactiques comme le Sitemap XML, l’organisation du site et le maillage interne. Historiquement, cette terminologie désignait l’étape d’enregistrement d’un site web dans les divers « index » des moteurs de recherche.

Qu’est-ce qu’un robot d’exploration?

Ces robots, également connus sous le nom de spiders, crawler, bots, explorent l’internet à travers les liens de chaque page afin d’indexer le plus grand nombre de pages de site web possible. Si l’on ne veut pas indexer certaines pages d’un site web, on peut notifier directement Google via la Google Search Console. Le fichier robots.txt est utilisé pour signaler aux robots d’indexation qu’une certaine page ne devrait pas être indexée dans les résultats de recherche organiques.

Savoir si son site ou une url de son site est indexé

Vous avez la possibilité de savoir si une ou plusieurs url de votre site existent dans la base de données de l’index de Google. Pour ça, rendez-vous sur la recherche Google

Et entrez la commande Google suivante : site:l’url que vous souhaitez analyser

Si votre page ou les pages de votre site sont dans les bases de données de Google il vous fournira un nombre de résultats correspondant, auquel cas vous ne verrez rien.

Peut-on s’assurer que ses pages vont être présentes dans l’index de Google ?

La certitude qu’une page ne soit jamais présente dans l’index de Google n’existe pas. Et inversement. Toutefois, le référencement naturel permet d’augmenter la garantis de faire indexer une ou plusieurs urls de son site internet. Pour ça, il faut jouer sur les éléments qui vont jouer sur l’indexation.

Créer un sitemap

Le sitemap est un fichier xml (un sitemap peut aussi être au format html mais c’est de moins en moins courant) qui reprends l’intégralité des urls au sein d’un site internet et leurs relations. A l’intérieur du sitemap vous trouverez donc toutes les pages html mais aussi les urls des images, les urls des vidéos, des pdfs si vous en avez.

L’intérêt du sitemap.xml est qu’il permet aux robots d’exploration, d’explorer bien plus rapidement et facilement les pages de votre site. Mon avis est que si le sitemap est très utile pour des sites volumineux, son impact est un peu moindre pour des petits sites de quelques dizaines de pages.

Rédiger une excellente balise title

La balise title est un des éléments html les plus importants quand on souhaite améliorer le seo de son site. Il permet aux robots d’exploration de comprendre la thématique générale de la page avant de lire son contenu.

Si vous rédigez une balise title dans les normes : c’est à dire une title relativement courte (entre 50 et 60 caractères maximum pour un affichage en entier sur les pages de résultats de recherche) et incluant au moins une expression de recherche en lien avec le contenu de la page, vous aurez plus d’assurance que votre url soit prise en compte dans l’index.

Des contenus de qualité

Les contenus au sein de votre page doivent respecter les règles sémantiques et lexicales applicables au langage naturel. Des phrases courtes de préférence et construites en respectant une rédaction en triple RDF. Vos contenus doivent intégrer non pas plusieurs fois le même mot-clé mais des entités et des types d’entité qui peuvent être associé pour former une phrase.

Exemple de triple RDF impliquant deux types d’entité + un attribut : La voiture est de couleur rouge

Ici « voiture » = entité, « est de couleur » = attribut (ce qui caractérise l’entité), « rouge » = valeur(qui peut aussi être une entité)

Maillage interne et passage du PageRank

Un site a plus de chance de se voir indexer ses pages si ses dites pages sont liées entre elles. Plus une page reçoit de liens provenant d’autres pages interne ayant une similarité ou une proximité sémantique et lexicale forte, plus cette page aura de chance d’être dans l’index de Google.

Un lien = un vote.

SI une page reçoit 3 liens de 3 pages différentes alors elle reçoit 3 votes. Elle est donc considérée par les bots des moteurs de recherche comme factuellement plus importante qu’une page ne recevant aucun lien/vote.

Popularité de la page

Une page qui reçoit des liens provenant de pages extérieures au site est aussi un plus grand gage d’indexation. Encore faut-il que les liens proviennent :

  • d’une page indexée
  • d’une page ayant une similarité sémantique et lexicale forte
  • d’une page étant maillée avec d’autres pages du même site
  • d’une page bénéficiant de liens extérieurs

L’indexation d’une page web n’est pas quelque chose d’anondin qu’il convient de négliger quand on pratique le SEO. Elle doit être surveiller comme le lait sur le feu.

Facebook
Twitter
LinkedIn

More to explorer

sitemap en seo

Qu’est ce qu’un fichier sitemap ?

Le sitemap est un fichier XML ou HTML qui contient tous les formats d’informations présents sur vos pages de site. Le sitemap

Submit your response

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *