Inteligência artificial prevê formas de moléculas desconhecidas

A DeepMind conferiu estruturas tridimensionais a 350 mil proteínas — entre elas, todas as produzidas pelos seres humanos — prometendo um trunfo para a medicina e a fabricação de drogas

PUBLICIDADE

Por Cade Metz
Atualização:

Já há alguns anos, John McGeehan, biólogo e diretor do Centro para Inovação em Enzimas, em Portsmouth, Inglaterra, procura uma molécula capaz de decompor as 150 milhões de toneladas de garrafas de refrigerantes e outros resíduos plásticos despejados no planeta.

Trabalhando com pesquisadores de ambos os lados do Oceano Atlântico, ele descobriu algumas boas opções. Mas sua tarefa é similar à de um chaveiro: localizar compostos químicos que, por conta própria, reagem até entrar em um formato microscópico capaz de se encaixar perfeitamente nas moléculas de uma garrafa de plástico e, dessa maneira, desagregá-las, da mesma maneira que uma chave abre uma fechadura.

As proteínas pertencentes a uma mosca da fruta são formadas pela I.A. da DeepMind. Foto: DeepMind via The New York Times

PUBLICIDADE

Determinar os exatos componentes químicos de qualquer enzima é bem mais simples nos dias de hoje. Mas identificar sua forma tridimensional pode envolver anos de experimentos bioquímicos. Então, depois de ler que um laboratório de inteligência artificial em Londres chamado DeepMind tinha fabricado um sistema que prevê automaticamente as formas de enzimas e outras proteínas, McGeehan pediu ao laboratório que o ajudasse em seu projeto.

Ao longo de uma semana de trabalho, ele enviou à DeepMind uma lista de sete enzimas. Na segunda-feira seguinte, o laboratório retornou com as formas de todas. “Isso nos fez avançar um ano em relação a onde estávamos, talvez dois”, afirmou McGeehan.

Agora, qualquer bioquímico pode acelerar seu trabalho em grande parte da mesma maneira. Na quinta-feira, a DeepMind publicou formas que previu para 350 mil proteínas — os mecanismos microscópicos que orientam o comportamento de bactérias, vírus, do corpo humano e de todas as outras criaturas vivas. Essa nova base de dados inclui as estruturas tridimensionais de todas as proteínas produzidas pelo genoma humano, assim como proteínas que aparecem em 20 outros organismos, incluindo ratos, moscas de fruta e bactérias E. coli.

Esse vasto e detalhado mapa biológico — que agrega aproximadamente 250 mil formas  às previamente conhecidas — pode acelerar nossa capacidade de entender doenças, desenvolver novos medicamentos e determinar novos usos a drogas conhecidas. Também pode nos levar a novos tipos de ferramentas biológicas, tais como enzimas que decomponham de maneira eficiente garrafas de plástico e as converta em materiais facilmente reutilizáveis e recicláveis.

Rich Evans, um pesquisador da DeepMind, trabalhando no projeto no escritório da empresa em Londres. Foto: DeepMind via The New York Times

“Isso pode nos fazer avançar para o futuro — influenciar a maneira que pensamos a respeito dos nossos problemas e ajudar-nos a resolvê-los mais facilmente”, afirmou Gira Bhabha, professora assistente do departamento de biologia celular da Universidade de Nova York. “Você pode estudar qualquer campo da biologia, isso pode ser útil da neurociência à imunologia.”

Publicidade

Esse novo conhecimento funciona como uma chave em si: se os cientistas conseguem determinar a forma de uma proteína, conseguirão determinar como outras moléculas se conectam a ela. Isso pode revelar, digamos, a maneira como bactérias resistem a antibióticos — e como combater essa resistência. Bactérias resistem a antibióticos produzindo certas proteínas; se os cientistas conseguem identificar as formas dessas proteínas, podem desenvolver novos antibióticos e novos medicamentos pata sumprimi-las.

No passado, determinar a forma de uma proteína era um trabalho que exigia meses, anos ou até décadas de experimentos de tentativa e erro, envolvendo raios-x, microscópios e outras ferramentas de laboratório. Mas a DeepMind pode diminuir significativamente esse tempo com sua tecnologia de inteligência artificial, conhecida como AlphaFold.

Quando McGeehan mandou à DeepMind sua lista de sete enzimas, ele disse ao laboratório que já tinha identificado as formas de duas delas, mas não disse quais. Foi uma maneira de testar se o sistema da empresa funcionava bem; o AlphaFold passou no teste, prevendo corretamente ambas as formas.

O mais notável, afirmou McGeehan, foi que as previsões chegaram a ele em poucos dias. Eles soube depois que, na verdade, o AlphaFold tinha completado a tarefa em apenas algumas horas.

Uma proteína expressa pela bactéria E. coli. Foto: DeepMind via The New York Times

PUBLICIDADE

O AlphaFold prevê estruturas de proteínas usando a chamada rede neural, um sistema matemático capaz de solucionar tarefas a partir da análise de vastas quantidades de dados — nesse caso, milhares de proteínas conhecidas e suas formas físicas — e extrapolando-os para o desconhecido.

É a mesma tecnologia que identifica os comandos de voz que você usa em seu smartphone, que reconhece rostos em fotos que você posta no Facebook e que realiza traduções no Google Translate e outras ferramentas. Mas muitos especialistas acreditam que o AlphaFold é uma das mais poderosas aplicações dessa tecnologia.

“Isso mostra que inteligência artificial é capaz de produzir coisas úteis em meio à complexidade do mundo real”, afirmou Jack Clark, um dos autores do AI Index, um esforço para rastrear o progresso de tecnologias de inteligência artificial ao redor do mundo.

Publicidade

Conforme constatou McGeehan, o AlphaFold pode ser notavelmente preciso. A tecnologia consegue prever a forma de uma proteína com uma precisão comparável à de experimentos empíricos em cerca de 63% das vezes, de acordo com testes de referência que comparam suas previsões a estruturas conhecidas de proteínas. A maioria dos especialistas pensava que uma tecnologia tão poderosa ainda tardaria anos para ser desenvolvida.

“Eu achava que levaria ainda uns 10 anos”, afirmou Randy Read, professor da Universidade de Cambridge. “Isso foi uma completa reviravolta.”

Mesmo antes de a DeepMind começar a divulgar sua tecnologia e dados, o AlphaFold já alimentava uma vasta gama de projetos. Pesquisadores da Universidade do Colorado estão usando a tecnologia para entender a maneira que bactérias como E. coli e salmonelas desenvolvem resistência a antibióticos; e como combatê-la. Na Universidade da Califórnia, em São Francisco, pesquisadores usaram a ferramenta para melhorar seu entendimento a respeito do coronavírus.

O coronavírus causa estragos em nosso organismo por meio de 26 proteínas diferentes. Com a ajuda do AlphaFold, os pesquisadores aumentaram seu entendimento a respeito de uma das principais proteínas e esperam que a tecnologia possa ajudá-los a compreender as outras 25.

Mesmo que isso ocorra tarde demais para surtir efeito na atual pandemia, poderá nos ajudar a enfrentar a próxima. “Um entendimento melhor dessas proteínas vai nos ajudar a combater não somente este vírus”, afirmou Kliment Verba, um dos pesquisadores de São Francisco.

Há uma quantidade imensa de possibilidades. Depois de o DeepMind mostrar a McGeehan as formas de sete enzimas capazes de potencialmente livrar o mundo dos resíduos plásticos, ele enviou uma lista com outras 93 proteínas para o laboratório. “Estão trabalhando nisso, agora”, afirmou.

Esta reportagem foi publicada originalmente em The New York Times. / TRADUÇÃO DE AUGUSTO CALIL

Publicidade

The New York Times Licensing Group - Todos os direitos reservados. É proibido todo tipo de reprodução sem autorização por escrito do The New York Times

Comentários

Os comentários são exclusivos para assinantes do Estadão.