Engenharia Ensaios em Engenharia, Ciência e Sustentabilidade

26/10/2021 | domtotal.com

O DNA e o Big Data

Não é um banco de dados de DNA, mas o DNA como um banco de dados

As combinações do DNA, se transferidas para o armazenamento de dados, são uma promissora tecnologia
As combinações do DNA, se transferidas para o armazenamento de dados, são uma promissora tecnologia (Furiosa-L / Pixabay)

José Antonio de Sousa Neto*

A extraordinária molécula de dupla hélice que torna a vida possível, conhecida como DNA, é o principal portador de nosso código genético. Nele estão armazenadas as instruções necessárias para a existência dos organismos vivos. E esta extraordinária estrutura da natureza é mais de 1 milhão de vezes mais eficaz em salvar informações do que até mesmo nossos melhores esforços de alta tecnologia em armazenamento de dados. E os dados estão no centro de toda a revolução tecnológica e científica que estamos vivenciando e de todas as implicações humanas e sociais dela resultante. E é inegável que o crescimento dos dados está ultrapassando a escalabilidade das soluções de armazenamento de hoje, uma vez que tudo o que fazemos gira em torno de dados - e capturar, armazenar, processar e minerar leva à criação de ainda mais dados.

O universo digital pode adicionar cerca de 175 zetabytes de dados por ano até 2025, de acordo com a empresa de análise de mercado IDC. Isso é 175 com 21 zeros depois. Essa quantidade de informações exigirá enormes centros de dados e vastos recursos de energia para manter. Um relativamente pequeno, mas crescente número de pesquisadores e de grupos de pesquisa defende o DNA como uma alternativa / substituto sustentável e estável para este enorme desafio. E embora devamos reconhecer melhorias surpreendentes em densidade, tamanho e capacidade total para a questão dos dados, os principais desafios permanecem para as tecnologias de armazenamento de hoje, quando consideradas em escala de zetabyte e a longa duração de armazenamentos.

Existem ainda inúmeros desafios tecnológicos a serem vencidos, mas, na verdade, é de fato possível codificar dados binários em DNA sintético. Vale a pena e eu recomento ao leitor assistir a este breve vídeo de apenas 5 minutos do TED Ed (é só alterar a legenda para português no YouTube). Para aqueles que estão tomando conhecimento do tema através deste breve texto, não tenho dúvida de que será uma agradável surpresa e uma oportunidade de um flash sobre um futuro com um potencial inimaginável.

E como é essa tecnologia? De forma bem simplificada, o DNA é formado por quatro bases orgânicas: adenina (A), guanina (G), citosina (C) e timina (T). A sequência específica destas bases em combinações de três delas de cada vez dá às nossas células as instruções para fabricar cada uma das proteínas do nosso corpo. Ao traduzir a combinação de 1 (um) e 0 (zero) ao longo do código binário da computação tradicional (por exemplo 11101010) para a sequência da combinação de três bases orgânicas (são possíveis 64 combinações), dados digitais podem ser programados dentro de DNAs sintéticos. Em outras palavras, os dados podem ser tanto gravados como depois decodificados para retornarem a sua forma original.

O fato de que, até agora, no atual estágio de desenvolvimento tecnológico, as velocidades de leituras e gravações ao longo do processo ainda o tornam inadequado para aplicativos do mundo real não turva a esperança do que pode ser este futuro. E os cientistas estão trabalhando atualmente na busca por descobertas que proponham técnicas mais rápidas para codificar dados para fitas sintetizadas de DNA. Se eles tiverem sucesso, o mundo pode entrar em uma nova era de armazenamento digital de dados e de uma reação em cadeia de saltos tecnológicos que inevitavelmente virão como consequência.

Esses esforços aumentaram em passado recente, quando uma coalizão de empresas de computação e biotecnologia, incluindo Microsoft, Twist Bioscience, Illumina e Western Digital, anunciaram que estavam formando a DNA Data Storage Alliance (DDSA). Xavier Godron, diretor de tecnologia da DNA Script, uma desenvolvedora de sintetizadores de DNA, resume que a intenção é "organizar a indústria e pensar em como construir todo o ecossistema para armazenamento de dados em DNA". Como explica Karin Strauss, "a DDSA se formou em resposta à massa crítica e à comunidade que se aglutinava em torno da tecnologia e que até recentemente era amplamente teórica. O que parecia ficção científica há cinco anos, agora está realmente começando a acontecer".

O processo de armazenamento de dados de DNA combina a síntese de DNA, sequenciamento de DNA e um algoritmo de codificação e decodificação para empacotar informações no DNA de forma mais duradoura e em densidade mais alta do que é possível nos meios convencionais. Isso alcança até 17 exabytes por grama. Obtendo sucesso no desenvolvimento tecnológico, poderíamos armazenar todos os dados digitais do planeta em apenas algumas centenas de quilos de DNA, economizando uma quantidade enorme de espaço e energia. Imaginem todos os dados do mundo armazenados em uma única sala!

Sendo menor do que um microchip, o DNA pode atingir uma densidade de 215 petabytes por grama e durar mais de 100 anos. E essas são significativas vantagens de longo prazo no armazenamento de dados. Por exemplo, em 2019, os pesquisadores já conseguiram realizar um feito relevante no contexto de nossa tecnologia atual ao armazenar toda a Wikipedia em inglês (apenas o texto) em DNA sintético. E mesmo com relação às limitações impostas pela velocidade do processo de armazenamento luzes no fim do túnel podem estar surgindo.

Cientistas da Northwestern University, em Illinois, na busca para superar os desafios ainda existentes no armazenamento de dados, propuseram uma nova técnica para registrar informações no DNA que leva apenas alguns minutos em vez de várias horas ou mesmo dias para terminar. Eles publicaram suas descobertas no Journal of the American Chemical Society, no artigo "Recording Temporal Signals with Minutes Resolution Using Enzymatic DNA Synthesis".

Pensando no acelerado aumento do poder computacional ao longo das últimas décadas, nos esforços e passos iniciais com a computação quântica, na revolução de dados e dos algoritmos, e em tecnologias que finalmente e sabiamente começam a imitar e aprender cada vez mais com a própria natureza (começando a dar a ela seu devido valor) ficamos imaginando até onde vamos chegar.

Fontes e leituras adicionais:

*José Antonio de Sousa Neto é professor da Dom Helder Tech

O texto reflete a opinião pessoal do autor, não necessariamente do Dom Total. O autor assume integral e exclusivamente responsabilidade pela sua opinião.



Comentários
Newsletter

Você quer receber notícias do domtotal em seu e-mail ou WhatsApp?

* Escolha qual editoria você deseja receber newsletter.

DomTotal é mantido pela EMGE - Escola de Engenharia e Dom Helder - Escola de Direito.

Engenharia Cívil, Ciência da Computação, Direito (Graduação, Mestrado e Doutorado).

Saiba mais!