Benjamin Bar
Benjamin Bar

Consultant SEO Freelance depuis 2010.

Facebook
Twitter
LinkedIn

L’indexation, petite partie de cache-cache avec les moteurs de recherche

Pour être tout à fait honnête avec vous, je n’ai pas choisi le sujet le plus accessible pour parler SEO. Mais comme j’ai dans l’idée de vous envoyer au visage tout ce qui pourrait vous être utile à l’avenir, il faut bien commencer quelque part. 

C’est donc avec le principe d’indexation que je vais démarrer mon chemin de croix éditorial sur le SEO. 

Cet article m’est venu en tête après avoir une énième fois entendu siffler à mes oreilles la fameuse expression : “je tape mon mot-clé mais je ne me vois pas sur Google”

La belle affaire. 

Plus sérieusement, cette remarque amène dans la majorité des cas (d’après mon seul point de vue) la même considération pour un souci de qualité de contenu. 

Et même si cette idée est loin d’être illogique ou mauvaise, elle n’en reste pas moins secondaire. 

A mon sens il est plus judicieux de voir du côté d’un problème d’indexation lorsque “l’on ne se voit pas sur Google”. 

Alors je comprends aussi tout à fait que la technique d’un site web n’est pas la partie la plus excitante de notre affaire. Mais s’ il faut en passer par là pour remettre le train sur de bons rails, il ne reste plus qu’à trouver son courage, se retrousser les manches et y aller.

Je suis conscient d’aborder un sujet plus que nébuleux pour beaucoup d’entre vous. C’est pour cette raison que je souhaite passer en revue les questions les plus communes à propos de l’indexation. 

Une bonne manière de vous faire comprendre le procédé d’indexation des moteurs de recherche, tout en douceur. 

L’indexation, une mécanique plutôt bien huilée des moteurs de recherche

Pour la faire simple, lorsqu’une page web, peu importe sa forme, est créée, il n’y a pas une place à son nom réservée d’avance. Le moteur de recherche va devoir traiter cette page en envoyant ses représentants de commerce : les robots (aussi appelés crawler et spider) trouver ladite page web.  

Le rôle de ces robots est bien défini puisqu’ils ont pour mission de parcourir l’immensité du web en suivant chaque lien qui se trouve sur leur route. Les tonnes de contenus qu’ils vont rencontrer vont alors être indexés et organisés.  

Toutes les données collectées en cours de route sont stockées dans l’index du moteur de recherche, prêtes à être utilisées. 

C’est à ce moment que la magie opère, ces quelques secondes où nous, internautes lambda allons faire une recherche d’information. Nous engageons le moteur de recherche dans une dynamique particulière mais bien connue des SEO : 

  • Analyser la requête pour évaluer au mieux l’intention de l’internaute.
  • Filtrer l’index en fonction de l’intention déduite.
  • Sélectionner toutes les pages jugées appropriées (en tenant compte d’un grand nombre de facteurs).
  • Les présenter à l’utilisateur par ordre de pertinence décroissant.

Les pages étant régulièrement mises à jour, leur qualité et leur pertinence par rapport à des sujets particuliers augmentant ou diminuant, les robots d’exploration doivent retourner régulièrement sur les sites indexés. 

La régularité de l’exploration d’un site dépend de la fréquence de ses modifications, de l’autorité dont il jouit et de nombreux autres paramètres.

Y a t-il des pages qui n’ont pas d’intérêt à être indexées ?

On a tendance à croire que les moteurs de recherche s’amusent, si je puis dire, à analyser et indexer tout ce qu’ils trouvent. C’est archi faux et ce pour 2 raisons évidentes :

  1. Premièrement parce qu’un moteur de recherche est conçu uniquement pour fournir des résultats de recherches valables. On est d’accord que toutes les pages indexées sur le web ne se valent pas en termes de contenu. Celles dont le contenu est considéré sans rapport avec l’intention de recherche, sont difficilement admises dans l’index.
  2. Deuxièmement, le moteur de recherche n’est pas très friand non plus des pages avec des soucis techniques. Dans le lot on peut citer les pages qui se chargent très lentement ou celles qui affichent une ergonomie au ras des pâquerettes. 

Je pourrais aussi ajouter – c’est un avis personnel –  que l’indexation est une responsabilité entre nos mains, propriétaires de sites. Car c’est aussi de notre responsabilité de faire le tri entre ce qui nous paraît une bonne page et une moins bonne. 

C’est aussi notre responsabilité d’aider en quelque sorte les moteurs de recherche, à avoir des index moins pollués, en leur proposant peut-être peu de pages mais qui auront une réelle valeur ajoutée pour les recherches d’informations des internautes. 

Est-ce compliqué de vérifier qu’une page a été indexée ?

Vous n’avez pas forcément 36 000 moyens de savoir si l’une de vos pages est indexée. Soit vous le faites à la main, soit vous utilisez des outils qui vont vous le dire pour vous. 

Ce qu’il faut retenir c’est que l’une n’est pas mieux que l’autre. Elles sont même complémentaires. J’ai pris pour habitude de vérifier l’indexation de pages “à la mano” et d’aller par dessus la vérifier par l’intermédiaire d’un outil. 

Je vais vous montrer les deux méthodes, c’est ce qui me semble le plus logique. Vous ferez ensuite votre choix de la manière dont vous voulez gérer la chose. 

Vérifier à la main si une page est indexée 

Quoi de mieux que d’aller sonner les cloches du moteur de recherche pour savoir si il a bien indexé une de nos pages (ou carrément tout notre site). 

L’opération est littéralement un jeu d’enfant. En quelques secondes vous allez être fixé. 

  1. Placez vous sur la page de recherche d’accueil de Google

    page de recherche google
  2. Rentrez l’url que vous souhaitez vérifier, précédé de la commande site: (ou votre nom de domaine si vous voulez faire une vérification globale)

    recherche url google
  3. Google va ensuite vous retourner comme seul résultat votre propre url – si celle-ci est indexée.

    page indexee par le moteur de recherche
    Dans le cas contraire, vous obtiendrez cela en réponse.

    aucune page indexee

Vérifier si une page est indexé via la search console

Là aussi, il n’y a rien de bien compliqué. Si votre site est couplée à la Google Search Console, vous êtes à deux clics de savoir quelles sont les pages de votre site qui sont indexées par Google et celles qui ne le sont pas. 

  1. Rendez-vous déjà la page d’accueil de la search console

    page accueil de la google search console
  2. Cliquez ensuite sur l’intitulé “couverture” pour ouvrir la section 

    page de couverture de la search console
  3. La section “valide” correspond aux pages qui ont bien été crawlées et indexées par le moteur de recherche.

    pages indexées sur la search console
  4. La section “exclues” correspond aux pages qui ont donné quelques difficultés au moteur, soit à cause d’erreurs 404, de redirection et bien entendu les pages qui aux yeux du moteur de méritent pas d’être indexées. 

    pages non indexees

D’ailleurs la search console indique bien deux expressions qui résume la situation :

  • Explorée actuellement non indexée : Google vous indique que ses robots d’explorations ont bien visité la page mais qu’elle n’apporte rien au moteur.

    pages explorees non indexees
  • Détectée, actuellement non indexée :  Google vous indique que votre page n’a pas encore été explorée et qu’elle ne peut pas être indexée. Ce qui veut dire que les bots iront peut-être prochainement visiter votre page.

    detectee et page non indexee

Est-ce qu’il y a des raisons valables pour qu’une page ne soit pas indexée par le moteur de recherche ? 

L’article serait interminable si je commençais à résumer les raisons qui poussent un moteur de recherche à ne pas vouloir indexer une page. J’aime bien écrire mais je ne me risquerai pas dans cette aventure. En revanche, je peux vous donner quelques pistes sur les facteurs les plus communs à une non-indexation.

Pas de sitemap en vue 

Même si je considère que le sitemap n’est pas un élément obligatoire à la conception d’un site, je dois quand même avouer qu’il peut donner un coup de pouce pour ce qui est de l’indexation. 

Dans les cas où un site internet ne dispose pas de plan de site (que vous pouvez trouver généralement dans le répertoire racine de votre site à : votredomainegénial.fr/sitemap.xml, il est fort probable que le moteur ne puisse pas retrouver quelques pages de votre site.

La directive “noindex”

Une cause qui me fait souvent sourire parce qu’elle est à mes yeux la plus évidente. Et oui, parfois, vos pages ou certaines d’entre elles sont configurées de telle sorte qu’on indique à Google de ne pas les indexer… Ou comment se tirer une balle dans le pied. 

meta no index

Cette directive noindex reste valide, même si votre dite page reçoit du jus de backlinks ou de liens internes. 

La page est bloquée dans le fichier robots.txt

Si votre page n’est pas indexée c’est qu’elle est peut-être bloquée par une directive dans le fichier robots.txt. Pour la faire courte et simple, chaque serveur Web fournit un fichier appelé robot.txt qui contient des instructions pour les robots. Si un fichier robots.txt interdit à tous les crawlers d’indexer le site, c’est évidemment un énorme problème. 

La page est étiquetée “label mauvaise qualité”

Si la qualité de votre page est à revoir, c’est fort possible que le moteur de recherche décide de s’en passer. Ce défaut de qualité peut avoir plusieurs visages, des backlinks spammy, des contenus trop pauvres ou inexistants, une page sur-optimisée… 

Les causes à la non indexation d’une ou plusieurs de vos pages dépend encore une fois de pas mal de facteurs qu’il faut prendre le temps d’étudier. Mais dans la majorité des cas, l’une des causes énumérées au-dessus expliquerait le pourquoi du comment. 

Quels risques encourt-on à avoir des problèmes d’indexation ? 

La non indexation de tout ou partie de votre site n’est pas une chose anodine. Même si ça peut dans une forte proportion se résoudre en quelques coups de cuillère à pot, les risques existent bel et bien. 

En fait, les conséquences encourues vont dépendre de la nature et l’ampleur des dégâts et surtout des pages concernées par cette non indexation. 

Une fiche produit aura plus d’intérêt à être indexée qu’une page souhaitant la bonne année.

Et pour les sites e-commerce, l’indexation est encore plus importante. Le trafic organique est de loin la forme de trafic la plus rentable pour les pages produits, car il coûte moins d’apparaître dans les résultats de recherche, contrairement à la publicité. 

Imaginez vous une seconde les répercussions sur votre chiffre d’affaires s’ il advenait que la moitié de votre catalogue produit ne soit pas indexé… les pertes seraient gigantesques. 

Peut-on savoir quand une page sera indexée

J’ai bien peur que non. Mais de ce que j’ai pu constater sur les différents sites que j’ai pu gérer (les miens comme ceux de mes clients), j’ai rarement vu une page ne pas s’indexer après 7 jours. 

L’indexation reste toutefois à la seule décision du moteur de recherche. Étant donné que les index de recherche englobent des millions et des millions de pages du monde entier et qu’ils doivent constamment actualiser leurs recherches pour garantir des informations à jour, votre page peut être indexée demain, la semaine prochaine ou dans quelques mois.

Existe-t-il des moyens de s’assurer d’une bonne indexation ? 

Pas de miracle, que du travail et de la matière grise. Si vous voulez vous assurez que les pages importantes de votre site soient indexées et que les “pommes pourries” soient exclues, je vous recommande de consacrer du temps et de la ressources à la question de l’indexation. 

Rien de mieux que de commencer par revoir des basiques sur votre site web. Tentez de répondre à ces quelques questions et vous verrez que l’avenir sera plus clair pour vous : 

  • Votre site est-il fonctionnel ? 
  • Votre hébergement est-il bien paramétré ? 
  • L’architecture de l’information de votre site facilite-t-elle la navigation au sein de ses pages ? 
  • Toutes vos pages importantes intègrent-elles le contenu nécessaire pour répondre à une intention de recherche ? (texte, vidéo, graphiques, statistiques, pdf, fichiers audios…)
  • Vos contenus sont-ils de première fraîcheur ? 

Si vous n’avez pas les compétences pour répondre à ces questions, ou que vous préférez qu’on vous aide à y répondre, le mieux est encore de faire appel à un consultant SEO. L’idée ici est de vous familiariser avec des notions et concepts SEO et plus globalement informatique. 

Quelle place donner à l’indexation dans votre stratégie SEO ? 

Ce qui est dommage avec le SEO, en tout cas la communication qu’on lui fait, c’est qu’on a tendance à retenir le côté clinquant. L’aspect facile. Donc on parle généralement du SEO en évoquant les stratégies de contenus, la recherche de mots-clés mais on va aussi évoquer d’autres sphères marketing comme les réseaux sociaux ou les stratégies d’e-mailing. 

Pour être honnête avec vous, je vais dans le sens de l’opinion qui veut que le SEO n’est pas au centre d’une stratégie mais bien un élément parmi d’autres. 

Le problème c’est qu’en limitant les champs du SEO à ses aspects les plus accessibles, on arrive à négliger des fondamentaux techniques. La technique pour le SEO, c’est comme les fondations d’un bâtiment. Si c’est bancal dès le début, au premier coup de vent, c’est la tragédie. 

Ce que je veux dire par là c’est que le budget que vous allez allouer pour améliorer le référencement naturel de votre site, devra impérativement prendre en compte du temps pour des observations et des optimisations techniques. 

Le mot de la fin 

Il est absolument primordial que vous vous assuriez que vous n’êtes pas freiné par un problème technique comme le fait que des pages importantes de votre site ne soient pas indexées.

Nous avons vu ce qu’est l’indexation, pourquoi elle est si importante et comment vous pouvez prendre des mesures pour identifier les problèmes d’indexation courants. 

Le reste dépend soit de vous, soit du consultant SEO qui va vous accompagner.

Facebook
Twitter
LinkedIn

More to explorer

Osez prendre la parole

Osez prendre la parole

Je vois le web d’aujourd’hui comme une immense basse-cour dans laquelle il est difficile pour certain de s’exprimer tant il y a

Submit your response

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *