ADN para almacenar datos digitales.

 

Los investigadores han decodificado los genomas de los mamuts y un caballo de 700.000 años usando fragmentos de ADN, extraídos de los fósiles en los últimos años. El ADN persiste claramente mucho más tiempo que los cuerpos  que lleva los códigos genéticos.

Los científicos e ingenieros informáticos han pensado durante mucho tiempo con aprovechar  las propiedades del ADN para almacenar datos digitales. La idea es codificar todos los 0 y los 1 en las moléculas A, C, G y T que forman el polímero de ADN en forma de escalera, y los avances de esta década en la síntesis y secuenciación del ADN han desarrollado la tecnología a pasos agigantados . Experimentos recientes indican que algún día podremos codificar toda la información digital del mundo en unos pocos litros de ADN y leerlo después de miles de años.



Un programa convierte este código a las letras A,C,G y T, los cuales corresponden a las cuatro bases químicas que hacen al ADN, el programa rompe las cadenas de letras y los indexa.Una maquina usa el dato, para hacer ADN, el resultado parece una mota de polvo. El ADN entra en una máquina de secuenciación, que lee los fragmentos de ADN como las letras A, C, G y T.   

El ordenador transforma los fragmentos de ADN y los convierte de nuevo en 1 y 0.

La siguiente figura muestra como se codifica de información digital en el ADN. La información digital (a, en azul), los dígitos binarios estan en código ASCII que son parte del soneto de Shakespeare, luego se convertio a base-3 (b, rojo) usando un código de Huffman que substituye cada byte con cinco o seis dígitos base-3 (Trits). Esto a su vez se convirtió en el código de ADN (c, verde).

Mediante la sustitución de cada trit con uno de los tres nucleótidos diferentes del anterior utilizado, asegurando que no se generaron homopolímeros, que son macromoléculas formadas por la repetición de unidades monómeras idénticas. Esto formó la base para un gran número de segmentos superpuestos de una longitud de 100 bases con superposición de 75 bases, creando cuatro redundancia (d, verde y, con segmentos alternos invertidos complementados para mayor seguridad de datos, violeta). Se añadieron códigos de ADN de indización (amarillo), también codificados como nucleótidos de ADN no repetitivos.

Digital information encoding in DNA.




El paso de moléculas individuales a través de poros nanométricos en membranas es central para muchos procesos en biología. Anteriormente, los experimentos se han restringido a los nanopores naturales, pero los avances en la tecnología ahora permiten que los nanopores artificiales de estado sólido sean fabricados en membranas aislantes. Mediante el monitoreo de las corrientes y fuerzas de iones a medida que las moléculas pasan a través de un nanoporo de estado sólido, es posible investigar una amplia gama de fenómenos que involucran el ADN, el ARN y las proteínas. El nanopore de estado sólido demuestra ser una nueva y sorprendentemente versátil herramienta de una sola molécula para la biofísica y la biotecnología.


Nanopores

Solid-state nanopores

Differentiation of short, single-stranded DNA homopolymers in solid-state nanopores.

Nanopore technology

Toward practical high-capacity low-maintenance storage of digital information in synthesised DNA

inicio