Robots.txt vs meta tags

En règle générale, robots.txt est un bon moyen pour permettre de contrôler l’accès à un site, et meta tags permet de son côté d’avoir un contrôle plus fin sur des dossiers individuels. Il peut parfois arriver que l’un ou l’autre de ces outils permettent de résoudre des problèmes différents :

Comment puis-je être sûr que ma page est indexée mais pas les images qu’elle contient ?

L’une des options consiste à bloquer l’accès à l’extension « images » via robots.txt. Les lignes suivantes indiqueront à Google de ne pas indexer les dossiers qui se terminent par *.jpg ou *.jpeg :

User-agent : Googlebot

Disallow : /*.jpg$

Disallow: /*.jpeg$

( ndt: le signe “dollar” est en fait écrit en tout petit en haut à droite de jpg, mais je n’ai pas su le restituer ainsi).

Une autre alternative : si votre CMS (Content Management System) stocke les images dans un répertoire séparé, vous pouvez exclure le répertoire entier de tous les moteurs de recherche en faisant comme suit :

User-agent : *

Disallow : /images/

Une autre option consiste à inclure un tag NOINDEX à chaque dossier qui inclue une image.

Toutes ces approches vous permettent de faire en sorte que vos images ne soient pas indexées ; la seule question à se poser est, jusqu’où voulez-vous qu’aille cette exclusion.

Contrôler les caches et les extraits

Les résultats de recherches montrent généralement un lien en cache et un résumé. Ci-dessous par exemple voici le premier des résultats quand on cherche « Canard Mallard » :

Canard Mallard « Le canard Mallard est l’espèce de canard la plus commune d’Amérique du Nord. La femelle est d’un brun terne, alors que le mâle a des plumes marrons,… » library.thinkquest.org/04/00228/mallard.html - 3k - Cached - Similar pages

Snippet/Résumé: ce qui est entre guillemets; un extrait de la page. Cached link (cached, en gris) : ce lien emmène l’utilisateur vers une copie de la page stockée par Google. Pourquoi avoir un extrait ? Les utilisateurs sont plus enclins à visiter un site qui présente un extrait dans les résultats de recherches. Ces résumes permettent aux utilisateurs de vérifier rapidement la pertinence du résultat de leur recherche. Si un utilisateur ne peut rapidement vérifier l’information, il passera rapidement au résultat suivant.

Pourquoi avoir un lien en cache ? C’est utile dans bon nombres de cas ; soit le site est temporairement inaccessible, ou son accès est rendu difficile par une affluence inhabituelle, ou bien il est accidentellement supprimé. L’autre avantage, c’est que Google révèle ainsi les mots utilisés par l’utilisateur dans sa recherche, ce qui permet une rapide évaluation de la pertinence de la page. La plupart des éditeurs de contenu veulent utiliser les deux. Mais il peut cependant y avoir des cas où l’on ne souhaite ni l’un ni l’autre, ou seulement l’un des deux : Mon journal possède un contenu qui change plusieurs fois par jour. Googlebot ne peut suivre la mise à jour en temps réel. Il est alors possible que le lien en cache renvoie à un contenu déjà obsolète. Comment puis-je faire pour que Google ne crée pas de lien en cache ?

On peut dans ce cas ajouter un tag NOARCHIVE à la page :

< META NAM=’’GOOGLEBOT’’ CONTENT’’NOARCHIVE’’>

Pour les extraits : < META NAME=’’GOOGLEBOT’’ CONTENT’’NOSNIPPET’’>

Nota : ajouter le tag NOSNIPPET a aussi pour effet d’empêcher la création d’un lien en cache, donc, si vous l’activer vous activez automatiquement le tag NOARCHIVE.

Votre site possède-t-il un contenu unique et utile ?

Une fois que votre site est indexable, la question finale est de se demander si l’on produit un contenu unique et utile. Tout d’abord, jettez un œil d’ensemble à vos textes : Votre titre et votre texte sont-ils descriptifs ? Votre texte est-il rédigé de façon fluide, claire et intuitive ?

De la même façon qu’un livre est organisé en chapitres, avec des thèmes spécifiques, chaque page web devrait être focalisée sur un sujet précis. Les mots clés et les phrases apparaissent naturellement dans ce type de textes, et les utilisateurs préféreront bien plus rester sur ce genre de pages.

Faites en sorte en tout cas que les phrases que vous écrivez puissent correspondre à celles que les visiteurs cherchent. Par exemple, si votre site est dédié à un club enthousiaste consacré au MG, arrangez-vous pour les mots « MG » et « voitures » apparaissent bien dans le texte (dans la copie ?), plutôt que « Automobiles britanniques ».

Accroître votre visibilité : les meilleurs usages

Ceux qui ont des sites demandent souvent comment faire pour accroître leur visibilité dans nos résultats de recherche. Notre réponse est simple : « Pensez comme un utilisateur, car c’est ainsi que nous essayons de penser ».

Qu’est-ce que cela veut dire concrètement ? Surtout faites en sorte que les visiteurs obtiennent l’information qu’ils recherchent, car la pertinence est ce qui apportera du monde à votre site, et ce qui lui fera une audience. Beaucoup cherchent comment fonctionne leur Page Rank, mais le « ranking » est le fruit de plus de 200 critères de sélection à l’outil Page Rank. Il est bien plus utile de vous concentrer sur la qualité de votre contenu et son accessibilité, plutôt que de chercher des « trucs » pour entrer dans les algorithmes des moteurs de recherches. Si un site ne rentre pas dans nos critères qualitatifs il risque fort de ne pas être indexé.

Que faire :

1. Produire un contenu pertinent et accessible ; les visiteurs arrivent sur votre site via des liens différents, aussi assurez-vous que chaque page retiendra leur attention.

2. Impliquez les utilisateurs : pouvez-vous ajouter une section « commentaire » à votre blog ou à votre site ? Construire une communauté aide à un usage et une fréquentation régulière. Des visiteurs impliqués vous rendent plus visibles, et donnent de fidèles lecteurs.

3. Visualisez votre site : utilisez l’outil Webmaster Central afin de voir par exemple quelles demandes emmènent les visiteurs vers votre site.

4. Viser des liens de grande qualité ( ? « Aim for high-quality, inbound links »).

5. Fournissez des liens-textes clairs: placez les au bon endroit et faites en sorte qu’ils contiennent des termes qui décrivent le sujet.

Que faut-il éviter :

1. Ne remplissez pas vos pages avec des listes de mots clés.

2. Ne tentez pas de truffer vos pages de texte qui ne peut être vu par les utilisateurs mais seulement par les moteurs de recherches.

3. Ne produisez pas de pages ou de liens destinée uniquement à tromper les ordinateurs des moteurs de recherche.

4. N’utilisez pas d’images pour afficher/mettre en avant des noms importants, des contenus ou des liens, les moteurs ne peuvent pas « lire » les images.

5. Ne créez pas des copies multiples de vos pages sous différents URLs dans l’idée d’orienter les moteurs de recherches.

Quand vous avez un doute, consultez notre guide pour Webmasters, qui est disponible à l’adresse suivante : ggogle.com/webmasters/guidelines.html.

L’outil Webmaster Central : google.com/webmasters.

Fin

Nota: le Guide du référencement Google contient encore, une explication du fonctionnement de l’outil Webmaster Central, ainsi qu’un glossaire des principaux termes et outils employés dans ce texte.