Internet Archive lance son extension Chrome pour retrouver les pages web introuvables

https://cdn2.nextinpact.com/images/bd/wide-linked-media/15114.jpg

Internet Archive lance son extension Chrome afin de proposer une alternative pour certains liens cassés sur Internet. En cas d’erreur 404 (et bien d’autres codes), elle va chercher une sauvegarde dans la Wayback Machine afin de la proposer à l’internaute.

En août de l’année dernière, Mozilla lançait un nouveau Test Pilot pour Firefox avec No More 404s. Le principe est simple : lorsque vous tombez sur une erreur 404, ce qui signifie que la page demandée n’existe pas ou plus, cet outil va piocher dans la Wayback Machine du site Archive.org afin d’en trouver une version sauvegardée, si elle existe bien évidemment.

Mais Firefox n’est pas le seul et il existe déjà de nombreuses alternatives du genre, que ce soit via la base de données d’Internet Archive ou bien via le cache de Google par exemple. Aujourd’hui, c’est au tour d’Internet Archive de lancer son extension officielle pour Chrome.

Une recherche automatisée dans la Wayback Machine

Elle « détecte les codes d’erreur 404, 408, 410, 451, 500, 502, 503, 504, 509, 520, 521, 523, 524, 525 et 526, et elle vérifie alors si une version archivée de l’URL demandée est disponible dans la machine Wayback » explique Internet Archive. Le cas échéant, l’extension affiche alors un message afin d’informer l’utilisateur, en lui laissant la possibilité de consulter cette copie archivée.

Les codes d’erreur HTTP ciblés sont relativement larges puisque cela va de l’incontournable 404 ou récent 451 pour la censure en ligne, en passant par les 52x qui sont des codes étendus pour Cloudflare. Pour rappel, la liste complète des codes HTTP et de leur signification est disponible par ici.

La question de la confidentialité et de l’historique de navigation 

Sur son blog, Internet Archive indique que « la confidentialité de nos utilisateurs est d’une importance cruciale » et ajoute que « nous essayons de ne pas enregistrer d’adresses IP ». L’organisme à but non lucratif affirme au passage que l’utilisation de cette extension « n’exposera pas votre historique de navigation ». Il travaille également avec Google afin d’ajouter une couche de protection supplémentaire via un serveur proxy.

Actuellement, Internet Archive revendique avoir sauvegardé plus 279 milliards de pages web différentes provenant de plus de 361 millions de sites, ce qui représente plus de 15 Po de stockage. 

 

Internet