Introuvable 404

Attention:  cet article date du 1 septembre 2004
Ce qu'il contient est peut être encore valable...
... ou complètement obsolète!

On pourrait croire à une annonce classée, mais il n’en est rien. La page sur lequel les internautes tombent le plus s’appelle 404 error, c’est à dire page non trouvée.
Explications.

Room 404

L’histoire raconte que c’est au 4ème étage d’un bureau du CERN (le bureau 404) que deux ou trois personnes transféraient aux internautes les fichiers dont ceux-ci avaient besoin, manuellement et au fur et à mesure des demandes. Il faut dire qu’à l’époque le Web tenaient sur quelques disques durs…

Au fur et à mesure de la croissance du Net, le nombre d’erreurs augmentait. Entre autre, les internautes demandaient des fichiers en se trompant dans l’orthographe des noms, et le fameux bureau répondait Room 404: file not found.

Le code d’erreur 404 était donc né, signifiant une impossibilité de fournir un document car celui ci s’avère introuvable…

Plusieurs erreurs possibles

Plusieurs cas de figure sont possibles :

  • l’internaute se trompe en tapant une adresse dans son navigateur, et la page n’existe donc pas ;
  • l’internaute ne se trompe pas en tapant l’adresse, mais le site a été changé. Les pages ne portent plus le même nom, et sont donc introuvable ;
  • il a tapé un mot clef dans le moteur de recherche, qui a mémorisé une vieille adresse de page qui a depuis changé de nom ;
  • il visitait un site différent, qui pointe vers le votre ; mais votre site à changé depuis et le site d’origine n’a pas répercuté les modifications
  • l’internaute a cliqué sur un menu de votre site, les fichiers ont été renommés, mais les liens n’ont pas été mis à jour.

Dans les deux premiers cas, l’internaute tape directement l’adresse et il est difficile de gérer la chose (mais pas impossible, voir plus loin).

Les cas 3 & 4 sont effectivement plus difficile à gérer, puisque c’est un site extérieur qui stocke une erreur. Dans le cas d’un moteur de recherche (cas 3), celui ci repasse régulièrement sur les sites et mettra à jour sa base – l’erreur disparaîtra automatiquement au bout d’un moment. Dans le cas d’un site (cas 4), il peut être bon de prévenir le webmaster dudit site pour lui demander de faire la mise à jour (une analyse des logs du serveur permet de connaître les sites qui vous apporte des erreurs).

Le dernier cas ne devrait jamais arriver – un webmaster consciencieux qui modifie des noms de fichier n’oublie jamais de modifier également les liens dans les menus…

Pas de ça chez moi…

Il est fréquent (et conseillé) qu’un site se refasse une beauté de temps à autre, change de look mais également de structure, d’arborescence (et de contenu…).

Entre autres conséquences d’une refonte, les pages peuvent changer de nom (grand classique lorsque vous passez d’un site statique des années 2000 à un site dynamique actuel), et donc entraîner le risque de l’erreur 404. Et de perdre des visiteurs, du référencement dans les moteurs de recherche…

Sur le Net, une erreur qui est gérée n’existe pas pour vos visiteurs

Selon la taille du site, vous créez autant de page de redirection que vous aviez de page (petits sites), ou vous automatisez au moyen de diverses méthodes (url rewriting entre autre).

Dans le pire des cas (impossibilité d’automatiser) il est impératif de personnaliser votre page d’erreur 404 pour qu’elle redirige vers la page d’accueil, affiche le plan du site, ou propose un moteur de recherche…

Et les liens qui partent ?

Votre site peut également regorger de liens qui partent vers l’extérieur, sous diverses formes. Grand classique, la liste des coups de coeur, liens vers des partenaires, mais également références bibliographiques…

Là encore, il est possible d’automatiser la vérification de validité des liens qui partent de chez vous. S’ils sont en base de données, la chose est très simple, sinon il vous faudra sans doute utiliser des outils d’aspiration / vérification de site (produits du marché ou développé selon vos besoins et la structure propre de votre site).

Laisser une réponse