Para nadie es misterio que la cantidad de información generada en Internet es gigantesca, mucha de la cual es bastante útil para la humanidad y merece ser guardada para la posteridad. El conocimiento humano se ha almacenado históricamente a través de enciclopedias y textos, ¿pero qué ocurre con lo digital? Investigadores de la Old Dominion University en Estados Unidos han intentado responder esta pregunta, consiguiendo resultados poco exactos pero llegando a una conclusión interesante.
El primer obstáculo que encontraron para saber cuánto de la Internet se ha guardado, fue el intentar descubrir todas las direcciones web URL existentes. Rápidamente se dieron cuenta que no se podía, catalogando tal labor como “imposible”, por lo que tomaron un apronte más estadístico y decidieron sacar como muestra 1.000 sitios web desde diversas fuentes, como Open Directory Project (DMOZ), Delicio.us, Bit.ly y por supuesto, los buscadores Google, Bing y Yahoo!
Luego, buscaron si estos 1.000 sitios estaban almacenados para la posteridad en algún lado, buscando en las bases de datos históricas más populares. ¿El resultado? Varía según la fuente desde donde provienen las muestras. Los links desde Delicio.us y DMOZ están guardados en un 90%, mientras que los de bit.ly junto con los de los buscadores web muestran apenas un 35%, siendo los de memoria más volátil.
¿La conclusión? Es que es muy difícil saber cuánto de la Internet está almacenada, pues el sólo iniciar una investigación es complicado (por el tema de las URL) y los resultados obtenidos son demasiado variables, por lo que los investigadores tendrán que buscar otros métodos en el futuro.
Link: Computer Scientists Measure How Much of the Web is Archived (MIT Technology Review)