por Swati
Khandelwal
03 Marzo 2017
del Sitio Web TheHackerNews
traducción de
Adela Kaufmann
Versión
original en ingles
Swati
Khandelwal
escritora técnica, Bloguera de Seguridad y Analista del
TI. Ella es una entusiasta de la tecnología con un ojo
en el ciberespacio y otros acontecimientos relacionados
con la tecnología.
|
¿Sabías
que 1 gramo de ADN
puede almacenar 1,000,000 terabytes de datos
durante más
de 1000 años?
Apenas el año pasado, Microsoft compró 10 millones de hebras de ADN
sintético de
una síntesis de ADN de San Francisco llamada Biociencia
de torsión
y colaboró con investigadores de la Universidad de Washington para
centrarse en el uso de ADN como medio de almacenamiento de datos.
Sin embargo, en los últimos experimentos, un par de investigadores
de la Universidad de Columbia y el Centro del Genoma de Nueva
York (NYGC)
han llegado con una nueva técnica para almacenar grandes cantidades
de datos en el ADN, y los resultados son maravillosos.
El dúo ha almacenado exitosamente alrededor de 2 MB de datos,
codificando un total de seis archivos, que incluyen:
-
Un completo sistema operativo de computadora
-
Una película francesa de 1895 "La llegada de un tren a La
Ciotat"
-
Una tarjeta de regalo de Amazon de $ 50
-
Un virus informático
-
Una placa Pioneer
-
Un estudio de 1948 por el teórico de la información Claude
Shannon
La nueva investigación (DNA
Fountain Enables a Robust and Efficient Storage Architecture),
que viene por cortesía de Yaniv Erlich y Dina Zielinski,
ha sido publicada en la revista Science.
Pero ¿cómo almacenaron los investigadores datos
digitales en el ADN?
Película almacenados y recuperada
de las moléculas de ADN
Una copia de esta película francesa de 1895, "La
llegada de un tren a La Ciotat," fue codificada
en moléculas de ADN sintético y más tarde
recuperada mediante una nueva estrategia de
codificación desarrollada por Yaniv Erlich y
Dina Zielinski en la Universidad de Columbia y
el Nuevo Centro del Genoma en Nueva York.
Llamando a su proceso "Una Fuente de ADN", los investigadores
comprimieron primero todos los datos en un solo archivo maestro, que
fue dividido en cadenas cortas de dígitos binarios, formados por
unos y ceros.
Paso siguiente, el dúo utiliza un "algoritmo llamado códigos fuente
de borrado de corrección" para agrupar al azar las cuerdas en
gotas. Cada gota contiene un código de barras en la secuencia que
ayudó a los investigadores volver a montar el archivo.
Luego, los investigadores,
"mapeó los unos y los ceros en cada gotita para las cuatro bases
de nucleótidos en el ADN: A, G, C y T,"
... y terminó con una lista digital de 72,000 hebras de ADN que
contenían los datos codificados.
Este código fue entonces enviado en un archivo de texto a Twist
Biosciences, el mismo inicio de la síntesis de ADN a partir del cual
Microsoft compró 10 millones de hebras de ADN sintético del año
pasado, que luego convirtió esa información digital en ADN
biológico.
"Dos semanas más tarde, recibieron un vial sosteniendo una mota
de moléculas de ADN.
Para recuperar sus archivos, ellos utilizaron tecnología moderna
de secuenciación para leer las hebras de ADN, seguidas de
software para traducir el código genético de nuevo en binario.
Ellos recuperaron sus archivos con cero errores", se lee la
revista.
"El Dispositivo de almacenamiento de datos de la más
alta densidad jamás creada"
Los investigadores creen que el ADN es el medio de almacenamiento
perfecto - ya que es ultra compacto y puede durar cientos de miles
de años si se mantiene fresco y seco - y sugiere que este es el,
"dispositivo de almacenamiento de más alta densidad de datos que
jamás se haya creado."
Puesto que el universo digital es grande y para el año 2020 se
espera que contenga casi tantos bits digitales como estrellas hay en
el universo, los datos llegan a 44 zettabytes o 44 trillones de
gigabytes.
Por lo tanto, el almacenamiento de datos de ADN podría ayudar a las
organizaciones grandes a almacenar una enorme cantidad de
información de una manera que uno puede todavía ser capaz de leerla
en un centenar de años.
Sin embargo, el costo sigue siendo un problema.
Los investigadores gastaron alrededor de 7,000 $ para sintetizar los
2 MB de datos y otros $ 2.000 para leer los datos. Sin embargo, con
el tiempo esto va a cambiar, así que no espere que esta técnica se
popularice cualquier momento en la corriente principal
|