Cuando Megaupload desapareció por orden judicial, millones de personas se quedaron sin un lugar donde descargar muchos de sus archivos, sobre todo archivos como películas o series. Los clientes de Megaupload que pagaban su suscripción usando el sitio legalmente, perdieron sus archivos, hasta que el FBI devuelva sus servidores a la ahora renombrada MEGA.
Por eso casi el 99% de los servicios para subir archivos “en la nube” se cubren las espaldas declarando que cualquier archivo con copyright pueda ser bloqueado e investigado. Es un sistema bueno para la mayoría de usuarios que usan estos sistemas de almacenamiento con archivos (en su mayoría) legales y propios.
Pero esta semana pasada, Dropbox se ha vuelto envuelta en un problema de comunicación, ante la acusación de bloqueo de una carpeta compartida que contenía vídeo con copyright. La acusación es comprensible, tienes un archivo bajo copyright compartiendo, pero te lo bloquean ¿quiere decir que alguien ha comprobado que tus archivos son lícitos? ¿Está Dropbox revisando los archivos que se creen tiene copyright? En realidad no.
Esta es una buena historia que demuestra en gran parte como estas empresas, las mismas que almacenan nuestra vida digital, tienen que gestionar miles y miles de archivos que algunas empresas, propietarios y gestores de derechos demandan sean eliminados o bloqueados.
La respuesta de Dropbox es clara, los avisos por material bajo copyright que se piden sean retirados según El Acta de Derechos de Autor Digitales del Milenio (DMCA), incluso en la política de copyright de Dropbox se indica claramente.
¿Pero como puede Dropbox revisar que esos archivos tienen un copyright que el usuario que los comparte no tiene? Gracias a las funciones hash. Estos hash son una serie de letras y números que identifican el contenido del archivo, aunque en ocasiones también la hora de creación o el nombre del archivo.
Cuando compartes un archivo, se comprueba que sea “legal”
Seguramente lo has visto más de una vez sin darte cuenta de qué es. Por ejemplo, se suele usar para comprobar que un archivo tiene lo que se publicita. Imagina que vas a descargar Ubuntu 13.10 para escritorio, en su versión i386. Encontrarás por internet miles de archivos con diferentes nombres y formatos, aunque el oficial sea ubuntu-13.10-desktop-i386.iso. Lo importante es que el hash MD5 del archivo que descargues sea el auténtico, en este caso “d0508f909c2c71d96aeac5efb0329b33”.
Este funcionamiento es idéntico en cualquier archivo que puedas encontrar. Dropbox lo hace automáticamente cada vez que se comparten archivos.
El sistema de Dropbox permite calcular el hash de cada archivo que se comparte, para que cuando pulsas sobre crear un enlace para compartirlo públicamente, comprueba que ese archivo no está en una lista de archivos que deben bloquearse por derechos de autor.
No existen dos archivos idénticos en Dropbox
Lo que es quizá más interesante, es que Dropbox gestiona los archivos usando los “hashes” para evitar contenido duplicado.
El sistema de Dropbox gestiona cada archivo de una forma que intenta evitar que se dupliquen en sus sistemas. Una forma de ahorrar espacio en los servidores de la empresa.
Automáticamente indentifica el hash de un archivo, de tal forma que de ese archivo puede solo existir una sola copia. Si subo un archivo descargado de internet, como en el ejemplo anterior “ubuntu-13.10-desktop-i386.iso”, otro usuario que suba el mismo archivo verá su carga mucho más rápida que el original, porque identifica que es el mismo archivo y en realidad, diferentes usuarios están compartiendo un archivo almacenado en la red de servidores.
Link: TechCrunch, Arstechnica