}

O que nos fai ser, para escribir o que facemos

2023/04/26 Judith Zubia Aranburu Iturria: Elhuyar aldizkaria

O ser humano sempre tivo unha especial paixón por transmitir coñecemento ás xeracións futuras, o que nos levou a descubrir e/ou desenvolver algunhas formas de gardar información. Até o momento sábese que as súas primeiras evidencias atópanse entre os cantiis de fai 40.000 anos. Máis adiante, coa creación das linguas, elaboramos os primeiros textos escritos. Así mesmo, o descubrimento do papel e o desenvolvemento da imprenta, fixeron que durante anos os libros aparecesen como fonte de información.

Cambio de perfil, con todo, XX. produciuse a mediados do século XX, coincidindo coa aparición da electrónica dixital. De feito, os desenvolvementos do transistor e do microchip permitiron, entre outras cousas, o nacemento do almacenamento dixital de datos.

Que é o almacenamento dixital de datos?

O almacenamento dixital de datos consiste en almacenar información dixital por medios electrónicos. Así mesmo, a información dixital é aquela que se expresa a través do sistema binario (utilizando os 0 e 1). Os valores 0 e 1 representan situacións. Por exemplo, o 0 corresponde ao estado “apagado” e o 1 ao estado “aceso”, ou o 0 a unha tensión eléctrica concreta e o 1 a outra tensión. En calquera caso, representan dúas situacións. No sistema binario, cada unha destas unidades de estado recibe o nome de bit e constrúese un byte con 8 bits consecutivos. A partir dela, e a través de miles de bytes, constrúese texto, imaxes, vídeos, audios e outra información dixital.

O almacenamento dixital de datos permite gardar grandes cantidades de información nun espazo físico reducido, así como ler e editar varias veces[1]... A cinta magnética, o disquete, o CD, o DVD e o USB son algúns dos sistemas de almacenamento de información dixital máis característicos das últimas décadas. Con todo, estes medios físicos, ademais de ter unha supervivencia limitada, non facilitan o intercambio de información. Neste sentido, o sistema de almacenamento de datos dominante na actualidade é a nube. Cómodo, rápido, accesible, seguro, ilimitado e sostible, non?

Spoiler: A nube non existe

Pois non. A “nube” está formada por centros de datos xestionados por empresas como Google, Amazon Web Services (AWS), Microsoft, etc. Por tanto, a nube é unha metáfora que se utiliza para resumir a complexidade destas infraestruturas[2]...

Fijémonos un momento na cantidade de datos xerada por día no ano 2022: 8,5 millóns de procuras en Google, 720.000 horas en YouTube, 93 millóns de fotos en Instagram, 867 millóns en Txio Usando e 333 mil millóns de correos electrónicos, entre outros. Así, xeramos e consumido preto de 94 cettabytes no último ano (1 zettabyte = 1 E + 21 bytes). É dicir, se cada bit fose unha moeda dun euro e acumulásemos moedas até formar 1 cettabyte, estariamos a conformar unha distancia de 1.970 anos de luz, suficiente para que Alpha Centauri sol puidese chegar até 225 raios máis próximos ao sistema izar.

Neste sentido, estes centros de datos chegaron a constituír uns xigantescos almacéns de servidores que se organizan nunhas superficies duns 10.000 m², en numerosas columnas e liñas. Estes servidores necesitan, por suposto, un sistema de frío para evitar sobrecalentamientos. Por si isto fose pouco, e para que a “nube” estea operativa en todo momento e non apréciese a influencia de fallos na rede eléctrica, nestas zonas hai xeradores que se alimentan de diesel. Así, unha zona deste tipo consome nun ano unha enerxía equivalente á utilizada por 50.000 vivendas. Ante a tendencia crecente de almacenamento dixital de datos, a enerxía necesaria para manter esta produción dixital chegaría a superar o consumo enerxético actual de todo o planeta a finais deste século.[3]...

Alternativas?

Unha cousa está clara, isto non é o camiño. Debemos cambiar de dirección. Atopar unha alternativa ou varias. Non é fácil, non, pero preguntemos a alguén que sabe máis da supervivencia que nós, a alguén que ten máis experiencia que nós. Preguntemos á natureza.

Como conseguiu a natureza lembrar de xeración en xeración ao ser humano ou á árbore? Como cambiou e ten a natureza a nosa contorna para que en cada época e lugar concreto teñamos unhas características diferenciais? Basicamente, cunha soa molécula: ADN (ácido desoxirribonucleico)[4]...

Cando falamos de ADN vénnos á mente a propia vida, pero non a información nin os computadores. Pois ben, o mesmo ADN é un código de 4 letras para gardar e transmitir información nun organismo. Esta molécula é unha hélice de dobre cadea formada por catro nucleótidos (adenina (A), timina (T), guanina (G) e citosina (C).

Para converter a información dixital en ADN, o primeiro que hai que facer é codificar os datos (ver 1. Imaxe). Existen varias formas de facelo, de forma similar a como existen varias linguaxes para escribir un algoritmo. Unha opción é utilizar a adenina para expresar 00 do sistema binario, 01 guanina, 10 citosina e 11 timina.[5]... Este proceso permite construír unha secuencia de ADN dunha soa cadea cunha eficiencia do 99%. Por que non cunha eficiencia do 100%? Pois ben, no proceso de síntese do ADN hai unha serie de erros que non se poden evitar e, por tanto, a información máxima que pode gardar cada nucleótido no canto de 2 bits é de 1,8 bits. Cabe destacar que este 1% defectuoso pode causar problemas no almacenamento de datos. Por iso, en lugar de crear unha soa cadea, xéranse numerosas copias para garantir que a información se conserva na súa integridade.

1.- Ilustración: Proceso de codificación de datos do sistema binario ao ADN. Ed. Judith Zubia Aranburu

A continuación almacenarase o ADN sintetizado. Aínda que se desenvolveron varios sistemas de almacenamento, pódense considerar dúas estratexias. Unha alternativa sería conxelar e manter o ADN. Esta molécula pode manterse estable durante millóns de anos nestas condicións. Outra posibilidade é encapsular o ADN e integralo noutro material. Esta estratexia baséase na idea de “DNA-of-Things” ou “ADN das cousas” e consiste basicamente en codificar a información ao ADN e almacenala nos obxectos cotiáns. Un exemplo é o traballo realizado en 2019 por investigadores de Suíza e Israel.[6]... Eles codificaron un arquivo dixital ao ADN e o encapsularon nunhas partículas de vidro. Posteriormente estas partículas foron mesturadas co polímero de policaprolactona (PCL) e depositadas nun obxecto por medio da impresión 3d. Por tanto, conseguiron que o obxecto impreso incorporase a información almacenada en devandito ficheiro. Ademais, extraeron o ADN de calquera parte do obxecto impreso e o amplificaron mediante PCR (Polymerase Chain Reaction), demostrando que ese arquivo podía ser almacenado en novos obxectos (ver 2). Imaxe).

2.- Ilustración: Proceso de almacenamento de información dixital por ADN. Ed. Judith Zubia Aranburu

Realidade ou ciencia ficción?

Aínda que o uso do ADN para almacenar datos resúltanos estraño, esta idea cada vez ten menos de ciencia ficción. É unha estratexia que se aliña moi ben cos retos que temos os humanos para este século.

O almacenamento de información por ADN é energéticamente máis eficiente e sostible que os sistemas actuais (ver 3). Imaxe), porque o ADN ben encapsulado pode tardar séculos en temperatura. Ademais, non necesita realizar tarefas de escritura, e os ficheiros así gardados poden copiarse e replicarse facilmente.

3. Ilustración: Supervivencia, capacidade e custo dalgúns sistemas de almacenamento [7]. Ed. Judith Zubia Aranburu

Por si isto fose pouco, este sistema de almacenamento é moi denso, xa que o volume ocupado pola información almacenada mediante ADN é moi reducido. Nun só gramo de ADN pódense meter 215 petabytes (1 petabyte = 1 E + 15 bytes)[8]... Prevese a xeración de 169 cettabytees a nivel mundial para o ano 2025. Se se almacena por ADN, só enchería unha cunca.

No entanto, hai que sinalar que o almacenamento de datos por ADN segue sendo caro, e que deberá transcorrer polo menos un par de décadas desde que os sistemas de sínteses e extracción do ADN baixen os prezos e comecen a utilizarse de forma xeneralizada[9]...

Ademais, a recuperación á velocidade axeitada dos ficheiros almacenados segue sendo un reto. De feito, cada cápsula utilizada para almacenar o ADN leva un código de ADN que corresponde ao seu contido como etiqueta. Por tanto, para seleccionar e extraer un ficheiro concreto, mantendo o resto, hai que engadir o iniciador correspondente a esta etiqueta de ADN. Coa tecnoloxía actual, este proceso é moi longo. O almacenamento de datos por ADN pode, en principio, utilizarse exclusivamente para a realización do denominado “almacenamento frío”. É dicir, utilizar unicamente para almacenar datos inactivos ou moi pouco utilizados[10]...

Unha mirada ao futuro

E agora imaxínache. Imaxinade un futuro como este. Imaxinade que compredes unhas novas lentes e que toda a información sobre a súa gradación, material e proceso de fabricación estea nas mesmas. Imaxinade que fosen facer a compra e que o prezo de cada comida fose o produto, sen o código. O ADN é biodegradable e, por tanto, cara a dentro. Utilizar o que nos imaxinamos para escribir o que facemos.

Pero imaxinade tamén que podería supor isto para a seguridade e a protección de datos. Que consecuencias tería o uso incorrecto desta tecnoloxía? Que podemos chegar a facer? Cal é a responsabilidade dos científicos e enxeñeiros no desenvolvemento desta tecnoloxía? Como todos os avances tecnolóxicos e científicos que levaron a cabo un cambio de misión, este non só vai xerar dilemas éticos senón que vai cuestionar outros temas.

Que cando vén vén vén e vén como vén, polo menos que non nos sorprenda.

 

BIBLIOGRAFÍA

[1] A. Siddiqa, A. Karim and A. Gani, “Big data storage technologies: a survey,” Frontiers of Information Technology & Electronic Engineering, vol. 18, pp. 1040-1070, 2017.

[2] I. Vía, Ou. Ajayi, B. Akanle and R. Ahuja, “An Overview of Data Storage in Cloud Computing,” International Conference on Next Generation Computing and Information Systems (ICNGCIS), pp. 29-34, 2017.

[3] A. A. Khan and M. Zakarya, “Energy, performance and cost efficient cloud datacentres: A survey,” Computer Science Review, vol. 40, 2021.

[4] L. Ceze, J. Nivala and K. Strauss, “Molecular dixital data storage using DNA,” Nature Reviews Genetics, vol. 20, pp. 456-466, 2019.

[5] E. Erlich and D. Zielinski, “DNA Fountain enables a robust and efficient storage architecture,” Science, vol. 355, pp. 950-954, 2017.

[6] J. Koch, S. Gantenbein, K. Masania, W. J. Stark, E. Erlich and R. N. Grass, “A DNA-of-things storage architecture to create materials with embedded memory,” Nature Biotechnology, vol. 38, pp. 39-43, 2019.

[7] L. C. Meiser, B. H. Nguyen, E.-J. Chen, J. Nivala, K. Strauss, L. Ceze and R. N. Grass, “Synthetic DNA applications in information technology,” Nature Communications, vol. 13, ez. 352, 2022.

[8] R. Heckel, “An arquive written in DNA,” Nature Biotechnology, vol. 36, pp. 236-237, 2018.

[9] P. M. Church, E. Gao and S. Kosuri “Next-Generation Dixital Information Storage in DNA,” Science, vol. 337, p. 1628, 2018.

[10] C. Matange, J. M. Tuck and A. J. Keung, “DNA stability: a central design consideration for DNA data storage systems,” Nature Communications, vol. 12, ez. 1358, 2021.

 

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia