Balises noindex nofollow 

balises noindex nofollow méta

Parfois, il est préférable de ne pas indexer certaines pages, notamment celles qui n’ont aucun intérêt pour votre stratégie SEO. Pour ce faire, il est important de signaler le robot d’exploration à travers la balise meta robots ou encore le fichier robots.txt. C’est à ce moment là que la balise noindex être en jeu.

Définition de l’attribut noindex

L’attribut NoIndex est un élément situé dans le code HTML d’une page de votre site. Lorsque vous utilisez la balise noindex, celle-ci indique aux crawlers que le webmaster ne souhaite pas que la page web en question soit indexée. D’où l’appellation « Noindex » qui signifie « pas d’index » en français.

Cette balise se présente généralement sous la forme suivante : meta name googlebot content x,y. Dans cette ligne de code, le X fait référence à Noindex pour indiquer si la page doit être indexée ou non. En revanche, le Y représente le code Nofollow. On parle également de liens nofollow pour indiquer les liens à ne pas observer.

Quelle est la différence entre noindex et nofollow ?

Bien qu’il s’agisse de deux attributs de la section head, No Index et No Follow sont des balises tout à fait différentes. Comme énoncé plus haut, la commande rel= »nofollow » concerne les liens hypertextes dans le contenu d’une page. Elle n’aura aucun impact sur le jus de lien. Par ailleurs, l’attribut content= »noindex » situé dans l’en tête href http sert à bloquer l’exploration d’une ressource.

La balise meta robots a-t-elle une syntaxe particulière ?

Oui, la balise meta robots a une syntaxe particulière. Voici un exemple de syntaxe typique pour la balise meta robots :

<meta name= »robots » content= »directives »>

Dans cette balise, « directives » est remplacé par une liste de valeurs qui indiquent aux robots des moteurs de recherche comment explorer et indexer le contenu de la page web.

Les directives les plus courantes sont « index », qui indique aux robots d’indexer le contenu de la page, et « noindex », qui indique aux robots de ne pas indexer le contenu de la page. Les autres directives courantes incluent « follow » et « nofollow », qui indiquent aux robots si les liens sur la page doivent être suivis ou non, et « noarchive », qui indique aux robots de ne pas conserver une copie en cache de la page.

Il est important de noter que la syntaxe exacte de la balise meta robots peut varier légèrement en fonction des recommandations et des exigences de chaque moteur de recherche. Il est donc conseillé de consulter la documentation officielle des moteurs de recherche pour vous assurer que vous utilisez la syntaxe appropriée pour votre site web.

Combiner les attributs noindex et nofollow

Il est tout à fait possible de réaliser différentes combinaisons à partir de ces balises. Cela vous permettra de donner 4 types de commandes :

  • Meta name robots content noindex, follow : cela signifie que l’URL Google ne peut être indexée, mais les liens peuvent être pris en compte ;
  • Meta name robots content noindex, nofollow : cette ligne de code signifie que la page web ne peut être indexée et que les liens ne peuvent être explorés ;
  • Meta name robots content index, nofollow : c’est à dire que la page peut être indexée, mais qu’il ne faudra pas suivre les liens sortants ;
  • Meta name robots content index follow : cela veut dire que les moteurs de recherche peuvent prendre en compte à la fois la page et les liens.

Quel type de lien ou de page est-il intéressant de ne pas indexer ?

Il existe de nombreuses raisons pour lesquelles il est important d’empêcher l’indexation de certaines pages.

  • Les pages avec un contenu pauvre, voire inexistant : cela concerne par exemple les pages dédiées aux commentaires de blogs ou celles qui affichent uniquement une couleur. Ce type de page est qualifié comme étant de faible qualité ;
  • Les pages contenant du duplicate content : dans certaines situations, il est impossible d’échapper au contenu dupliqué. En bloquant l’indexation de ce type de page, vous éviterez de subir des actions manuelles de Google.
  • Des pages qui sont en cours de développement ou qui ne sont pas pertinentes pour le référencement, comme des pages de politique de confidentialité ou des pages d’erreur 404.
  • Des liens vers des pages qui n’ont pas d’importance pour le référencement, comme les liens vers des pages d’aide ou de connexion.

Il est important d’utiliser ces balises avec prudence, car une utilisation incorrecte ou excessive peut avoir un impact négatif sur le référencement d’un site. Par exemple, si trop de pages importantes sont marquées avec la balise noindex, cela peut entraîner une baisse de classement dans les résultats de recherche. Il est donc recommandé de consulter un expert en référencement pour déterminer la meilleure stratégie d’utilisation de ces balises pour votre site web.