por Swati Khandelwal

03 Marzo 2017

del Sitio Web TheHackerNews

traducción de Adela Kaufmann
Versión original en ingles

 

 

 Swati Khandelwal 
escritora técnica, Bloguera de Seguridad y Analista del TI. Ella es una entusiasta de la tecnología con un ojo en el ciberespacio y otros acontecimientos relacionados con la tecnología.

 

 

 

 


 ¿Sabías que 1 gramo de ADN

puede almacenar 1,000,000 terabytes de datos

durante más de 1000 años?

 

 


Apenas el año pasado, Microsoft compró 10 millones de hebras de ADN sintético de una síntesis de ADN de San Francisco llamada Biociencia de torsión y colaboró con investigadores de la Universidad de Washington para centrarse en el uso de ADN como medio de almacenamiento de datos. 

 

Sin embargo, en los últimos experimentos, un par de investigadores de la Universidad de Columbia y el Centro del Genoma de Nueva York (NYGC) han llegado con una nueva técnica para almacenar grandes cantidades de datos en el ADN, y los resultados son maravillosos. 

 

El dúo ha almacenado exitosamente alrededor de 2 MB de datos, codificando un total de seis archivos, que incluyen:

  • Un completo sistema operativo de computadora
     

  • Una película francesa de 1895 "La llegada de un tren a La Ciotat"
     

  • Una tarjeta de regalo de Amazon de $ 50
     

  • Un virus informático
     

  • Una placa Pioneer
     

  • Un estudio de 1948 por el teórico de la información Claude Shannon

La nueva investigación (DNA Fountain Enables a Robust and Efficient Storage Architecture), que viene por cortesía de Yaniv Erlich y Dina Zielinski, ha sido publicada en la revista Science.
 

 

 

 

Pero ¿cómo almacenaron los investigadores datos digitales en el ADN?

 

 

 

Película almacenados y recuperada

de las moléculas de ADN

 

Una copia de esta película francesa de 1895, "La llegada de un tren a La Ciotat," fue codificada en moléculas de ADN sintético y más tarde recuperada mediante una nueva estrategia de codificación desarrollada por Yaniv Erlich y Dina Zielinski en la Universidad de Columbia y el Nuevo Centro del Genoma en Nueva York.

 

 

Llamando a su proceso "Una Fuente de ADN", los investigadores comprimieron primero todos los datos en un solo archivo maestro, que fue dividido en cadenas cortas de dígitos binarios, formados por unos y ceros. 

Paso siguiente, el dúo utiliza un "algoritmo llamado códigos fuente de borrado de corrección" para agrupar al azar las cuerdas en gotas. Cada gota contiene un código de barras en la secuencia que ayudó a los investigadores volver a montar el archivo.
 

Luego, los investigadores,

"mapeó los unos y los ceros en cada gotita para las cuatro bases de nucleótidos en el ADN: A, G, C y T,"

... y terminó con una lista digital de 72,000 hebras de ADN que contenían los datos codificados. 

Este código fue entonces enviado en un archivo de texto a Twist Biosciences, el mismo inicio de la síntesis de ADN a partir del cual Microsoft compró 10 millones de hebras de ADN sintético del año pasado, que luego convirtió esa información digital en ADN biológico.

"Dos semanas más tarde, recibieron un vial sosteniendo una mota de moléculas de ADN.

 

Para recuperar sus archivos, ellos utilizaron tecnología moderna de secuenciación para leer las hebras de ADN, seguidas de software para traducir el código genético de nuevo en binario.

 

Ellos recuperaron sus archivos con cero errores", se lee la revista.

 

 

 

"El Dispositivo de almacenamiento de datos de la más alta densidad jamás creada"

Los investigadores creen que el ADN es el medio de almacenamiento perfecto - ya que es ultra compacto y puede durar cientos de miles de años si se mantiene fresco y seco - y sugiere que este es el,

"dispositivo de almacenamiento de más alta densidad de datos que jamás se haya creado."

Puesto que el universo digital es grande y para el año 2020 se espera que contenga casi tantos bits digitales como estrellas hay en el universo, los datos llegan a 44 zettabytes o 44 trillones de gigabytes. 

Por lo tanto, el almacenamiento de datos de ADN podría ayudar a las organizaciones grandes a almacenar una enorme cantidad de información de una manera que uno puede todavía ser capaz de leerla en un centenar de años.

Sin embargo, el costo sigue siendo un problema.

 

Los investigadores gastaron alrededor de 7,000 $ para sintetizar los 2 MB de datos y otros $ 2.000 para leer los datos. Sin embargo, con el tiempo esto va a cambiar, así que no espere que esta técnica se popularice cualquier momento en la corriente principal