Por @Alvy — 29 de Junio de 2007

Inside the Intenet Archive es un antiguo pero no por ello menos interesante artículo sobre las interioridades de The Internet Archive (más conocido como Archive.org) – a veces llamado «la Biblioteca de Alejandría de la Web» o también «la mayor colección de pornografía del mundo, en una sola habitación». Desde 1996 cientos de ordenadores rastrean y guardan «copias» de todo el contenido posible de la Web, o al menos lo que se puede rastrear, se va almacenando para el futuro, como en una gran biblioteca. Esta organización sin ánimo de lucro con el tiempo ha ido creciendo en cuanto a medios y tecnología, y desarrollando servicios prácticos para los usuarios. Uno de ellos es la popular Wayback Machine, que permite ver una «fotografía» de cómo era una web concreta en distintas épocas, con sólo teclear su dirección. Diversas empresas patrocinan y colaboran con el proyecto, en especial Alexa Internet que es una subsidiaria de Amazon.

Internet Archive (circa 2002)
Algunos de los servidores del Archivo Internet, en su ubicación original en San Francisco, hacia 2002.

Los datos del artículo son espectaculares y eso que datan de 2002: 10.000 millones de páginas archivadas, 250 gigabytes nuevos de datos que se añaden cada día, más de 200 servidores. Según la entrada en la Wikipedia del Archivo Internet ya en 2006 los archivo ocupaban dos petabytes (2.000 terabytes = dos millones de gigabytes) y se añadían 20 terabytes cada mes. Al ritmo actual, los nuevos sitios web tardan entre 6 y 12 meses en ser incluídos.
Compartir en Flipboard Publicar / Tuitear