Las empresas de tecnología habitualmente crean centros de datos en expansión para almacenar todas las fotos de bebés, transacciones financieras, videos divertidos de gatos y mensajes de correo electrónico que sus usuarios acumulan.
Pero una nueva técnica desarrollada por investigadores de la Universidad de Washington y Microsoft podría reducir el espacio necesario para almacenar datos digitales que hoy llenarían un supercentro Walmart hasta el tamaño de un terrón de azúcar.
El equipo de informáticos e ingenieros eléctricos ha detallado uno de los primeros sistemas completos para codificar, almacenar y recuperar datos digitales utilizando moléculas de ADN, que pueden almacenar información millones de veces más compacta que las tecnologías de archivo actuales.
En un experimento descrito en un documento presentado en abril en la Conferencia Internacional de ACM sobre Soporte Arquitectónico para Lenguajes de Programación y Sistemas Operativos, el equipo codificó exitosamente datos digitales de cuatro archivos de imagen en las secuencias de nucleótidos de fragmentos de ADN sintético.
Más significativamente, también pudieron revertir ese proceso: recuperaron las secuencias correctas de un conjunto más grande de ADN y reconstruyeron las imágenes sin perder un solo byte de información.
El equipo también ha codificado y recuperado datos que autentican archivos de video de archivo de las voces de la UW del proyecto del Tribunal de Ruanda que contienen entrevistas con jueces, abogados y otro personal del tribunal de crímenes de guerra de Ruanda.
"La vida ha producido esta fantástica molécula llamada ADN que almacena eficientemente todo tipo de información sobre sus genes y cómo funciona un sistema vivo; es muy, muy compacta y muy duradera", dijo el coautor Luis Ceze, profesor asociado de la Universidad de Washington.Ciencia computacional e ingeniería.
"Básicamente, lo estamos reutilizando para almacenar datos digitales imágenes, videos, documentos, de manera manejable durante cientos o miles de años".
Se espera que el universo digital, todos los datos contenidos en nuestros archivos de computadora, archivos históricos, películas, colecciones de fotos y el volumen explosivo de información digital recopilada por empresas y dispositivos en todo el mundo, alcance los 44 billones de gigabytes para 2020.
Eso es un aumento de diez veces en comparación con 2013, y representará datos suficientes para llenar más de seis pilas de tabletas de computadora que se extienden hasta la luna. Si bien no es necesario guardar toda esa información, el mundo está produciendo datos más rápido que la capacidad paraGuárdalo.
Las moléculas de ADN pueden almacenar información muchos millones de veces más densamente que las tecnologías existentes para el almacenamiento digital: unidades flash, discos duros, medios magnéticos y ópticos. Esos sistemas también se degradan después de unos años o décadas, mientras que el ADN puede preservar de manera confiable la información parasiglos. El ADN es el más adecuado para las aplicaciones de archivo, en lugar de las instancias donde los archivos deben ser accedidos de inmediato.
El equipo del Laboratorio de Sistemas de Información Molecular ubicado en el Edificio de Ingeniería Eléctrica UW, en estrecha colaboración con Microsoft Research, está desarrollando un sistema de almacenamiento basado en ADN que se espera que pueda abordar las necesidades mundiales de almacenamiento de archivos.
Primero, los investigadores desarrollaron un enfoque novedoso para convertir las largas cadenas de unos y ceros en datos digitales en los cuatro componentes básicos de las secuencias de ADN: adenina, guanina, citosina y timina.
"Cómo pasas de unos y ceros a As, Gs, Cs y Ts realmente importa porque si usas un enfoque inteligente, puedes hacerlo muy denso y no obtienes muchos errores", dijo el coautorGeorg Seelig, profesor asociado de ingeniería eléctrica de la UW y de ciencias de la computación e ingeniería: "Si lo haces mal, obtienes muchos errores".
Los datos digitales se cortan en pedazos y se almacenan sintetizando una cantidad masiva de pequeñas moléculas de ADN, que pueden deshidratarse o conservarse para su almacenamiento a largo plazo.
Los investigadores de UW y Microsoft son uno de los dos equipos en todo el país que también han demostrado la capacidad de realizar un "acceso aleatorio", para identificar y recuperar las secuencias correctas de este gran conjunto de moléculas de ADN al azar, que es una tarea similar al reensamblajeun capítulo de una historia de una biblioteca de libros rotos.
Para acceder a los datos almacenados más tarde, los investigadores también codifican el equivalente de los códigos postales y las direcciones de calles en las secuencias de ADN. El uso de técnicas de reacción en cadena de la polimerasa PCR, comúnmente utilizadas en biología molecular, les ayuda a identificar más fácilmente el código postalcódigos que están buscando. Utilizando técnicas de secuenciación de ADN, los investigadores pueden "leer" los datos y convertirlos nuevamente a un archivo de video, imagen o documento utilizando las direcciones de las calles para reordenar los datos.
Actualmente, la barrera más grande para el almacenamiento de ADN viable es el costo y la eficiencia con la que el ADN puede sintetizarse o fabricarse y secuenciarse o leerse a gran escala. Pero los investigadores dicen que no hay una barrera técnica para lograr esas ganancias siincentivos adecuados están en su lugar.
Los avances en el almacenamiento de ADN dependen de técnicas iniciadas por la industria de la biotecnología, pero también incorporan nuevos conocimientos. El enfoque de codificación del equipo, por ejemplo, se basa en esquemas de corrección de errores comúnmente utilizados en la memoria de la computadora, que no se habían aplicado al ADN.
"Este es un ejemplo en el que tomamos prestado algo de la naturaleza - ADN - para almacenar información. Pero estamos usando algo que sabemos de las computadoras - cómo corregir errores de memoria - y aplicarlo de nuevo a la naturaleza,"dijo Ceze.
"Este enfoque multidisciplinario es lo que hace que este proyecto sea emocionante. Nos basamos en un conjunto diverso de disciplinas para ampliar los límites de lo que se puede hacer con el ADN. Y, como resultado, crear un sistema de almacenamiento con una densidad y durabilidad sin precedentes,"dijo Karin Strauss, investigadora de Microsoft y profesora asociada afiliada a la UW de ciencias de la computación e ingeniería.
La investigación fue financiada por Microsoft Research, la National Science Foundation y la David Notkin Endowed Graduate Fellowship.
Los coautores incluyen al estudiante de doctorado en ciencias de la computación e ingeniería de la UW James Bornholt, el estudiante de doctorado en bioingeniería de la UW Randolph Lopez y Douglas Carmean, arquitecto asociado de Microsoft Research y profesor afiliado de ciencias de la computación e ingeniería de la UW.
Fuente de la historia :
Materiales proporcionado por Universidad de Washington . Original escrito por Jennifer Langston. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :