Investigadores de la Universidad Estatal de Carolina del Norte han desarrollado nuevas técnicas para etiquetar y recuperar archivos de datos en sistemas de almacenamiento de información basados en ADN, abordando dos de los obstáculos clave para la adopción generalizada de tecnologías de almacenamiento de datos de ADN.
"Los sistemas de ADN son atractivos debido a su potencial densidad de almacenamiento de información; en teoría podrían almacenar mil millones de veces la cantidad de datos almacenados en un dispositivo electrónico convencional de tamaño comparable", dice James Tuck, co-autor corresponsal de un artículo sobre eltrabajo y profesor asociado de ingeniería eléctrica e informática en NC State.
"Pero dos de los grandes desafíos aquí son: ¿cómo identifica las cadenas de ADN que contienen el archivo que está buscando? Y una vez que identifica esas cadenas, ¿cómo las elimina para que puedan leerse? Yhacerlo sin destruir los hilos? "
"El trabajo anterior había creado un sistema que agrega secuencias cortas de ADN de 20 monómeros de largo llamadas secuencias de unión de cebador a los extremos de las cadenas de ADN que almacenan información", dice Albert Keung, co-autor corresponsal del artículoy un profesor asistente de ingeniería química y biomolecular en el estado de Carolina del Norte. "Podría usar un pequeño cebador de ADN que coincida con la secuencia de unión del cebador correspondiente para identificar las cadenas apropiadas que comprenden su archivo deseado. Sin embargo, solo hay un estimado de 30,000 de estossecuencias de unión disponibles, lo cual es insuficiente para el uso práctico. Queríamos encontrar una manera de superar esta limitación ".
Para abordar estos problemas, los investigadores desarrollaron dos técnicas que, en conjunto, llaman Enriquecimiento de ADN y Separación Anidada, o DENSe.
Los investigadores abordaron el desafío de la identificación de archivos mediante el uso de dos secuencias de unión de cebadores anidadas. El sistema primero identifica todas las cadenas que contienen la secuencia inicial de la carpeta. Luego realiza una segunda "búsqueda" de ese subconjunto de cadenas para seleccionar esashebras que contienen la segunda secuencia de aglutinante.
"Esto aumenta el número de nombres de archivo estimados de aproximadamente 30,000 a aproximadamente 900 millones", dice Tuck.
Una vez identificado, el archivo aún necesita ser extraído. Las técnicas existentes utilizan la reacción en cadena de la polimerasa PCR para hacer muchas y muchas copias de las cadenas de ADN relevantes, luego secuenciar la muestra completa. Debido a que hay tantas copias delas cadenas de ADN objetivo, su señal abruma al resto de las cadenas de la muestra, lo que permite identificar la secuencia de ADN objetivo y leer el archivo.
"Esa técnica no es eficiente, y no funciona si está tratando de recuperar datos de una base de datos de alta capacidad, simplemente hay demasiado ADN en el sistema", dice Kyle Tomek, Ph.D.estudiante en NC State y coautor principal del artículo.
Entonces, los investigadores adoptaron un enfoque diferente para la recuperación de datos, uniendo cualquiera de varias etiquetas moleculares pequeñas a los cebadores que se utilizan para identificar cadenas de ADN objetivo. Cuando el cebador encuentra el ADN objetivo, utiliza PCR para hacer una copia del ADN relevante- y la copia se adjunta a la etiqueta molecular.
Los investigadores también utilizaron microperlas magnéticas recubiertas con moléculas que se unen específicamente a una etiqueta determinada. Estas microperlas funcionalizadas "agarran" las etiquetas de las cadenas de ADN objetivo. Las microperlas pueden recuperarse con un imán, trayendo el ADN dirigido con ellas.
"Este sistema nos permite recuperar las cadenas de ADN asociadas con un archivo específico sin tener que hacer muchas copias de cada cadena, al mismo tiempo que conservamos las cadenas de ADN originales en la base de datos", dice Keung.
"Hemos implementado el sistema DENSe experimentalmente usando archivos de muestra, y hemos demostrado que puede usarse para almacenar y recuperar archivos de texto e imagen", agrega Keung.
"Estas técnicas, cuando se usan en conjunto, abren la puerta al desarrollo de sistemas de almacenamiento de datos basados en ADN con capacidades modernas y capacidades de acceso a archivos", dice Tomek.
"Los siguientes pasos incluyen ampliar esto y probar el enfoque DENSe con bases de datos más grandes", dice Tuck. "Un gran desafío es el costo".
El documento, "Impulsando la escalabilidad de los sistemas de almacenamiento de información basados en el ADN", se publica en la revista Biología Sintética ACS . El coautor principal del artículo es Kevin Volkel, un estudiante de doctorado en NC State. El documento fue escrito en coautoría por Alexander Simpson, un ex estudiante de posgrado en NC State; y Austin Hass y Elaine Indermaur, ambosestudiantes universitarios en NC State.
El trabajo se realizó con el apoyo de la National Science Foundation con el número de subvención 1650148.
Fuente de la historia :
Materiales proporcionado por Universidad Estatal de Carolina del Norte . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :