¿Hacia una era digital oscura?
Buena parte de la información generada en esta era será inaccesible para las generaciones futuras por el deterioro de los datos, la obsolescencia tecnológica o las leyes del 'copyright'
Miguel Ángel Criado, El País
En las pocas décadas que la humanidad lleva inmersa en la era digital ha creado datos como para llenar la memoria de tantos iPad que, apilados, casi llegarían a la Luna. El ritmo de creación de información es tal que, según un estudio de la corporación EMC y la consultora IDC, se dobla cada dos años. Para antes de que acabe la década, habrá 44 zettabytes de datos (un ZB es igual a un billón de gigabytes) y el montón de tabletas habrá ido y vuelto al satélite más de tres veces. Lo paradójico es que buena parte de esa información se perderá para las generaciones futuras.
El vicepresidente de Google y uno de los padres de internet, Vinton Cerf, alertaba en una conferencia de la Asociación Estadounidense para el Avance de la Ciencia hace unos días del peligro de que lo creado por esta generación no deje apenas rastro. En la creencia de su eternidad, el homo digitalis ya no imprimen fotos, las guarda en formato digital, no escribe cartas, sino que envía email, no almacena discos, sube las canciones a la nube. Una creciente parte de su vida se desarrolla en la red: juega en línea, publica selfies en Facebook y comparte sus pasiones en tuits. Pero lo digital no es tan eterno.
El deterioro de los soportes donde se almacena la información, la desaparición de los programas para interpretarla o las limitaciones impuestas por el copyright harán que, para los humanos del futuro, sea inaccesible. De hecho, ni siquiera habrá que esperar a que los arqueólogos del futuro descubran que, como decía Cerf al Financial Times, los comienzos del siglo XXI son "un agujero negro de información". Los primeros efectos de lo que los anglosajones llaman era digital oscura ya se están notando.
El caso de los disquetes ejemplifica el problema planteado por el vicepresidente de Google en toda su complejidad. Fueron el sistema de almacenamiento básico en los años 80. En ellos cabían tanto las fotos familiares como el trabajo hecho para la clase o los documentos del trabajo. La mayor parte de toda esa información ya se ha perdido. Y si aún queda algún disquete, es cuando empiezan de verdad los problemas: Habrá que encontrar una disquetera que lo lea, rezar para que los datos no se hayan corrompido por el paso del tiempo para que, probablemente, descubrir que el programa para abrir el archivo hace años que no existe.
"Conservo viejos disquetes de 3,5 pulgadas que alojan archivos de texto escritos con un programa que ya no existe y que funcionaba con un Macintosh de 1986", dice el consultor tecnológico Terry Kuny. Este archivista digital canadiense fue el primero en hablar de este tiempo como una posible edad digital oscura hace ya casi 20 años. "¿Qué opciones tengo de que yo, o cualquiera, pueda acceder a esos datos hoy? Incluso si consigo una vieja disquetera, conseguir el sistema operativo y los programas no sería nada fácil en la actualidad. Y si uno no está para decirle a quien lo intente qué hay en esos discos y en qué formato está, el problema ya sería enorme", añade.
En 1997, cuando la actual era digital apenas comenzaba, cuando los ordenadores personales solo estaban al alcance los más pudientes e internet era para una casta, cuando aún no existía Google y muchos menos Facebook o Twitter, y Microsoft dominaba el mundo con su Windows 95, Kuny, entonces asesor de la Biblioteca Nacional de Canadá dio una conferencia para la Federación Internacional de Asociaciones de Bibliotecas. Su título era premonitorio: ¿Una era digital oscura? Retos para la conservación de la información electrónica. La visión de Kuny, como la actual de Cerf, está más vigente que nunca.
"No creo que exista un riesgo de que la información de nuestro tiempo vaya a quedar inaccesible, creo que es una certeza. Ya está pasando, cada día, en todo tipo de organización, para todas las clases de datos", afirma Kuny. De hecho, cree que todo lo relacionado con la conservación digital está yendo a peor. "Hay mucha más información nacida digital que antes y apenas hay unas pocas instituciones públicas o privadas que estén activamente implicadas en lidiar con este problema".
Enemigos de la memoria digital
El primer reto tiene que ver con la física. Cualquiera con una edad que haya intentado ver la cinta VHS con el vídeo de su boda sabe del deterioro de los soportes donde se almacenan los datos. La grabación magnética de la información ha sido la dominante en las primeras décadas de la era digital. Aún hoy, los discos duros guardan los datos jugando con la polaridad de las partículas y, por esas cosas del magnetismo, los datos acaban por perderse.
Si le pasó a la NASA, ¿por qué no iba a pasar con el vídeo de la boda? La agencia espacial estadounidense vio como buena parte de las imágenes tomadas por las sondas de la Misión Viking enviadas a Marte en los años 70 eran irrecuperables. Aunque la NASA transfirió los datos desde las cintas magnéticas originales a soportes ópticos, hasta el 20% del material no se pudo recuperar.
Solo en 2014 la industria ha cerrado los servidores para jugar en línea a 65 juegos
El caso de las sondas Viking ilustra otro de los peligros de que este tiempo se convierta en una edad digital oscura. El 80% de la información enviada desde Marte se pudo salvar, pero se guardó en un formato y con unos programas que ya no existen. Solo hace un par de años, una empresa canadiense pudo volver a extraer las imágenes. Hay formatos que parecen que van a durar toda la vida y después de ella. Es el caso de las imágenes guardadas en formato JPEG o la música en mp3. Pero ¿y si aparece un nuevo formato mejor y los anteriores caen en desuso?
Y es que confiar la preservación de los datos a la buena fe de las compañías que los crean tiene sus peligros. Como denunció el mes pasado la Fundación Fronteras Electrónicas (EFF, por sus siglas en inglés) gigantes de los juegos como Electronic Arts cierran los servidores para jugar en línea con sus títulos en apenas un año y medio si el juego no ha tenido el éxito que esperaban. Solo en 2014, la industria abandonó 65 juegos. Pero, al mismo tiempo, las leyes de copyright impiden que los jugadores mantengan sus propios servidores.
Pero el mayor riesgo de que la información de este tiempo desaparezca en el futuro está en internet. Como muestra el estudio de IDC sobre el universo digital de 2014, la mayor parte de los datos son alojados en la red. Desde los millones de selfies hasta cada minuto de vídeo subido a YouTube, pasando por los comentarios en Facebook, cada vez más, la mayor parte de la vida de una persona se encuentra en algún servidor de alguna empresa y no ya en su álbum familiar de fotografías.
El 20% de los mensajes en Twitter ya han desaparecido
Se supone que ni Google ni Facebook van a cerrar mañana. Incluso cuando cierran algún servicio, como hizo el buscador con Wave, dan un tiempo razonable para que sus usuarios se descarguen todo lo que allí tenían. Google, por ejemplo, cuenta con Takeout, un sencillo sistema para hacer una copia de todos los datos creados y alojados en sus servicios. Pero no siempre es así.
A comienzos de la década pasada, había una red social mucho más importante y conocida que Facebook. Se llamaba Friendster y en su mejor momento llegó a tener 100 millones de usuarios. Sin embargo, errores propios y la popularidad de otras alternativas, hicieron que Friendster se hundiera y, con ella, todas las historias, conversaciones, amores y momentos que compartieron sus usuarios. Hoy, la empresa languidece como plataforma de juegos en el sudeste asiático.
"Tuvimos mucha suerte de que Internet Archive reaccionara a tiempo y capturara una copia de toda la información pública en Friendster justo antes de que la desactivaran", comenta el experto en redes sociales de la de la Escuela Técnica Federal de Zúrich (ETH), el español David García. La relevancia que tienen las redes sociales en la vida de hoy, las ha convertido para los científicos sociales en herramientas fundamentales para estudiar las sociedades humanas. Solo esa copia ha servido a García y otros investigadores estudiar fenómenos sociales que afectan a la privacidad, por ejemplo.
Uno de esos investigadores sociales es Alan Mislove, de la Universidad Northeastern (EE UU). Mislove ha estudiado a fondo Twitter. En un artículo publicado el año pasado, comprobó que casi el 20% de los tuits publicados en esta red social se habían esfumado. "Es difícil proyectar que pasará con los tuits perdidos en el futuro", aclara. Para Mislove, "los datos de sitios como Twitter y Facebook ofrecen a los investigadores una capacidad sin precedentes para estudiar la sociedad a una escala y granularidad que simplemente eran imposibles antes".
Luces contra la edad digital oscura
Si existen tantos riesgos, ¿qué se está haciendo para afrontarlos? Las soluciones son tanto tecnológicas como organizativas y hasta legislativas. Lo más urgente parece ser el problema de la longevidad de los datos, cómo conservarlos para los que vengan después.
Las tecnologías de almacenamiento no han variado mucho en todo este tiempo. O se graba la información en soportes magnéticos o, con la ayuda del láser, en discos ópticos. Aunque pudiera parecer que el DVD o el Blu-ray son las mejores alternativas, el futuro seguirá siendo magnético.
"La primavera pasada, IBM y FUJIFILM lograron una densidad de almacenamiento sobre cinta de 85,9 gigabytes por pulgada cuadrada lo que permitiría una capacidad de 154 terabytes [un terabyte son 1.000 gigabytes] en un cartucho que cabe en la palma de la mano. Eso es el texto de 154 millones de libros", recuerda el responsable de tecnologías avanzadas de cinta de IBM Research, Mark Lantz.
Quizá por eso de que IBM es la única empresa tecnológica con más de un siglo de vida, saben de la importancia de la preservación de los datos. Para Lantz, la cinta magnética no está muerta ni muchos menos. "En nuestro laboratorio de Zúrich estamos trabajando sobre una tecnología de cinta para la preservación de los datos a largo plazo", asegura. Con el mantenimiento y conservación adecuados, la grabación en soportes magnéticos mantiene la información intacta durante décadas.
Otra cuestión es la de poder reproducirlos con el paso del tiempo. Ese es el mayor temor que expresó Vinton Cerf en su conferencia. Sin las herramientas adecuadas que den contexto a los datos, aunque se conservaran, estos serían ilegibles. Cerf mencionó como solución un proyecto en el que también participa IBM. El gigante informático, junto a la universidad Carnegie Mellon tiene en marcha el proyecto Olive. Su objetivo es crear una especie de imágenes que incluyan todo, los datos del archivo, el programa con el que se creó y hasta el código. Por medio de máquinas virtuales, el contenido se podría ejecutar en cualquier sistema que apareciera en el futuro.
A iniciativas como esta ayudaría lo que está pidiendo la EFF a las autoridades de EE UU: que en la legislación sobre copyright se incluya una excepción que obligue a las empresas que crearon un programa o un juego a liberar su código cuando lo abandonen o, al menos, permitir su obtención mediante ingeniería inversa.
Pero el mayor reto es conservar toda la información acumulada en algo tan grande y dinámico como es la web. Internet Archive es el mayor intento que hay para conservar la memoria de la red. Los robots de esta organización rastrean periódicamente la web haciendo copias de las páginas que encuentra y las van guardando. Así, si alguna página desaparece, siempre habrá la posibilidad de recordar como fue.
En España, la Biblioteca Nacional ha venido haciendo lo mismo con la ayuda de Internet Archive desde hace años. Pero el año pasado fue el primero que, con su propio robot, empezaron a escanear la red española. Ya han copiado 140 terabytes entre recursos, páginas web, blogs... Sin embargo, La BNE está a la espera de la aprobación de un reglamento sobre el depósito legal de publicaciones electrónicas que le permita conservar todo lo que la tecnología permita de la internet en español.
Pero evitar que esta sea una edad digital oscura es cosa de cada uno. "Todos nosotros debemos convertirnos en nuestros propios bibliotecarios. Cada uno deber ser el responsable de su vida digital. No podremos salvarlo todo y las cosas que decidamos salvar, deberemos hacerlo con cuidado", alerta Terry Kuny, el mismo que ya lo hacía hace 20 años, mucho antes que Vinton Cerf.
Miguel Ángel Criado, El País
En las pocas décadas que la humanidad lleva inmersa en la era digital ha creado datos como para llenar la memoria de tantos iPad que, apilados, casi llegarían a la Luna. El ritmo de creación de información es tal que, según un estudio de la corporación EMC y la consultora IDC, se dobla cada dos años. Para antes de que acabe la década, habrá 44 zettabytes de datos (un ZB es igual a un billón de gigabytes) y el montón de tabletas habrá ido y vuelto al satélite más de tres veces. Lo paradójico es que buena parte de esa información se perderá para las generaciones futuras.
El vicepresidente de Google y uno de los padres de internet, Vinton Cerf, alertaba en una conferencia de la Asociación Estadounidense para el Avance de la Ciencia hace unos días del peligro de que lo creado por esta generación no deje apenas rastro. En la creencia de su eternidad, el homo digitalis ya no imprimen fotos, las guarda en formato digital, no escribe cartas, sino que envía email, no almacena discos, sube las canciones a la nube. Una creciente parte de su vida se desarrolla en la red: juega en línea, publica selfies en Facebook y comparte sus pasiones en tuits. Pero lo digital no es tan eterno.
El deterioro de los soportes donde se almacena la información, la desaparición de los programas para interpretarla o las limitaciones impuestas por el copyright harán que, para los humanos del futuro, sea inaccesible. De hecho, ni siquiera habrá que esperar a que los arqueólogos del futuro descubran que, como decía Cerf al Financial Times, los comienzos del siglo XXI son "un agujero negro de información". Los primeros efectos de lo que los anglosajones llaman era digital oscura ya se están notando.
El caso de los disquetes ejemplifica el problema planteado por el vicepresidente de Google en toda su complejidad. Fueron el sistema de almacenamiento básico en los años 80. En ellos cabían tanto las fotos familiares como el trabajo hecho para la clase o los documentos del trabajo. La mayor parte de toda esa información ya se ha perdido. Y si aún queda algún disquete, es cuando empiezan de verdad los problemas: Habrá que encontrar una disquetera que lo lea, rezar para que los datos no se hayan corrompido por el paso del tiempo para que, probablemente, descubrir que el programa para abrir el archivo hace años que no existe.
"Conservo viejos disquetes de 3,5 pulgadas que alojan archivos de texto escritos con un programa que ya no existe y que funcionaba con un Macintosh de 1986", dice el consultor tecnológico Terry Kuny. Este archivista digital canadiense fue el primero en hablar de este tiempo como una posible edad digital oscura hace ya casi 20 años. "¿Qué opciones tengo de que yo, o cualquiera, pueda acceder a esos datos hoy? Incluso si consigo una vieja disquetera, conseguir el sistema operativo y los programas no sería nada fácil en la actualidad. Y si uno no está para decirle a quien lo intente qué hay en esos discos y en qué formato está, el problema ya sería enorme", añade.
En 1997, cuando la actual era digital apenas comenzaba, cuando los ordenadores personales solo estaban al alcance los más pudientes e internet era para una casta, cuando aún no existía Google y muchos menos Facebook o Twitter, y Microsoft dominaba el mundo con su Windows 95, Kuny, entonces asesor de la Biblioteca Nacional de Canadá dio una conferencia para la Federación Internacional de Asociaciones de Bibliotecas. Su título era premonitorio: ¿Una era digital oscura? Retos para la conservación de la información electrónica. La visión de Kuny, como la actual de Cerf, está más vigente que nunca.
"No creo que exista un riesgo de que la información de nuestro tiempo vaya a quedar inaccesible, creo que es una certeza. Ya está pasando, cada día, en todo tipo de organización, para todas las clases de datos", afirma Kuny. De hecho, cree que todo lo relacionado con la conservación digital está yendo a peor. "Hay mucha más información nacida digital que antes y apenas hay unas pocas instituciones públicas o privadas que estén activamente implicadas en lidiar con este problema".
Enemigos de la memoria digital
El primer reto tiene que ver con la física. Cualquiera con una edad que haya intentado ver la cinta VHS con el vídeo de su boda sabe del deterioro de los soportes donde se almacenan los datos. La grabación magnética de la información ha sido la dominante en las primeras décadas de la era digital. Aún hoy, los discos duros guardan los datos jugando con la polaridad de las partículas y, por esas cosas del magnetismo, los datos acaban por perderse.
Si le pasó a la NASA, ¿por qué no iba a pasar con el vídeo de la boda? La agencia espacial estadounidense vio como buena parte de las imágenes tomadas por las sondas de la Misión Viking enviadas a Marte en los años 70 eran irrecuperables. Aunque la NASA transfirió los datos desde las cintas magnéticas originales a soportes ópticos, hasta el 20% del material no se pudo recuperar.
Solo en 2014 la industria ha cerrado los servidores para jugar en línea a 65 juegos
El caso de las sondas Viking ilustra otro de los peligros de que este tiempo se convierta en una edad digital oscura. El 80% de la información enviada desde Marte se pudo salvar, pero se guardó en un formato y con unos programas que ya no existen. Solo hace un par de años, una empresa canadiense pudo volver a extraer las imágenes. Hay formatos que parecen que van a durar toda la vida y después de ella. Es el caso de las imágenes guardadas en formato JPEG o la música en mp3. Pero ¿y si aparece un nuevo formato mejor y los anteriores caen en desuso?
Y es que confiar la preservación de los datos a la buena fe de las compañías que los crean tiene sus peligros. Como denunció el mes pasado la Fundación Fronteras Electrónicas (EFF, por sus siglas en inglés) gigantes de los juegos como Electronic Arts cierran los servidores para jugar en línea con sus títulos en apenas un año y medio si el juego no ha tenido el éxito que esperaban. Solo en 2014, la industria abandonó 65 juegos. Pero, al mismo tiempo, las leyes de copyright impiden que los jugadores mantengan sus propios servidores.
Pero el mayor riesgo de que la información de este tiempo desaparezca en el futuro está en internet. Como muestra el estudio de IDC sobre el universo digital de 2014, la mayor parte de los datos son alojados en la red. Desde los millones de selfies hasta cada minuto de vídeo subido a YouTube, pasando por los comentarios en Facebook, cada vez más, la mayor parte de la vida de una persona se encuentra en algún servidor de alguna empresa y no ya en su álbum familiar de fotografías.
El 20% de los mensajes en Twitter ya han desaparecido
Se supone que ni Google ni Facebook van a cerrar mañana. Incluso cuando cierran algún servicio, como hizo el buscador con Wave, dan un tiempo razonable para que sus usuarios se descarguen todo lo que allí tenían. Google, por ejemplo, cuenta con Takeout, un sencillo sistema para hacer una copia de todos los datos creados y alojados en sus servicios. Pero no siempre es así.
A comienzos de la década pasada, había una red social mucho más importante y conocida que Facebook. Se llamaba Friendster y en su mejor momento llegó a tener 100 millones de usuarios. Sin embargo, errores propios y la popularidad de otras alternativas, hicieron que Friendster se hundiera y, con ella, todas las historias, conversaciones, amores y momentos que compartieron sus usuarios. Hoy, la empresa languidece como plataforma de juegos en el sudeste asiático.
"Tuvimos mucha suerte de que Internet Archive reaccionara a tiempo y capturara una copia de toda la información pública en Friendster justo antes de que la desactivaran", comenta el experto en redes sociales de la de la Escuela Técnica Federal de Zúrich (ETH), el español David García. La relevancia que tienen las redes sociales en la vida de hoy, las ha convertido para los científicos sociales en herramientas fundamentales para estudiar las sociedades humanas. Solo esa copia ha servido a García y otros investigadores estudiar fenómenos sociales que afectan a la privacidad, por ejemplo.
Uno de esos investigadores sociales es Alan Mislove, de la Universidad Northeastern (EE UU). Mislove ha estudiado a fondo Twitter. En un artículo publicado el año pasado, comprobó que casi el 20% de los tuits publicados en esta red social se habían esfumado. "Es difícil proyectar que pasará con los tuits perdidos en el futuro", aclara. Para Mislove, "los datos de sitios como Twitter y Facebook ofrecen a los investigadores una capacidad sin precedentes para estudiar la sociedad a una escala y granularidad que simplemente eran imposibles antes".
Luces contra la edad digital oscura
Si existen tantos riesgos, ¿qué se está haciendo para afrontarlos? Las soluciones son tanto tecnológicas como organizativas y hasta legislativas. Lo más urgente parece ser el problema de la longevidad de los datos, cómo conservarlos para los que vengan después.
Las tecnologías de almacenamiento no han variado mucho en todo este tiempo. O se graba la información en soportes magnéticos o, con la ayuda del láser, en discos ópticos. Aunque pudiera parecer que el DVD o el Blu-ray son las mejores alternativas, el futuro seguirá siendo magnético.
"La primavera pasada, IBM y FUJIFILM lograron una densidad de almacenamiento sobre cinta de 85,9 gigabytes por pulgada cuadrada lo que permitiría una capacidad de 154 terabytes [un terabyte son 1.000 gigabytes] en un cartucho que cabe en la palma de la mano. Eso es el texto de 154 millones de libros", recuerda el responsable de tecnologías avanzadas de cinta de IBM Research, Mark Lantz.
Quizá por eso de que IBM es la única empresa tecnológica con más de un siglo de vida, saben de la importancia de la preservación de los datos. Para Lantz, la cinta magnética no está muerta ni muchos menos. "En nuestro laboratorio de Zúrich estamos trabajando sobre una tecnología de cinta para la preservación de los datos a largo plazo", asegura. Con el mantenimiento y conservación adecuados, la grabación en soportes magnéticos mantiene la información intacta durante décadas.
Otra cuestión es la de poder reproducirlos con el paso del tiempo. Ese es el mayor temor que expresó Vinton Cerf en su conferencia. Sin las herramientas adecuadas que den contexto a los datos, aunque se conservaran, estos serían ilegibles. Cerf mencionó como solución un proyecto en el que también participa IBM. El gigante informático, junto a la universidad Carnegie Mellon tiene en marcha el proyecto Olive. Su objetivo es crear una especie de imágenes que incluyan todo, los datos del archivo, el programa con el que se creó y hasta el código. Por medio de máquinas virtuales, el contenido se podría ejecutar en cualquier sistema que apareciera en el futuro.
A iniciativas como esta ayudaría lo que está pidiendo la EFF a las autoridades de EE UU: que en la legislación sobre copyright se incluya una excepción que obligue a las empresas que crearon un programa o un juego a liberar su código cuando lo abandonen o, al menos, permitir su obtención mediante ingeniería inversa.
Pero el mayor reto es conservar toda la información acumulada en algo tan grande y dinámico como es la web. Internet Archive es el mayor intento que hay para conservar la memoria de la red. Los robots de esta organización rastrean periódicamente la web haciendo copias de las páginas que encuentra y las van guardando. Así, si alguna página desaparece, siempre habrá la posibilidad de recordar como fue.
En España, la Biblioteca Nacional ha venido haciendo lo mismo con la ayuda de Internet Archive desde hace años. Pero el año pasado fue el primero que, con su propio robot, empezaron a escanear la red española. Ya han copiado 140 terabytes entre recursos, páginas web, blogs... Sin embargo, La BNE está a la espera de la aprobación de un reglamento sobre el depósito legal de publicaciones electrónicas que le permita conservar todo lo que la tecnología permita de la internet en español.
Pero evitar que esta sea una edad digital oscura es cosa de cada uno. "Todos nosotros debemos convertirnos en nuestros propios bibliotecarios. Cada uno deber ser el responsable de su vida digital. No podremos salvarlo todo y las cosas que decidamos salvar, deberemos hacerlo con cuidado", alerta Terry Kuny, el mismo que ya lo hacía hace 20 años, mucho antes que Vinton Cerf.