Uma equipe de pesquisadores recentemente marcou um avanço significativo no campo da biologia sintética graças à inteligência artificial. Com essa IA, eles conseguiram antecipar a evolução natural.
Eles usaram um modelo de linguagem generativa, ESM3, para projetar uma proteína fluorescente totalmente nova, abrindo perspectivas inéditas na engenharia de proteínas.
Imagem de ilustração Pixabay
ESM3 se destaca por sua capacidade de integrar sequência, estrutura e função das proteínas, oferecendo uma abordagem holística inédita. Este modelo, treinado com bilhões de dados proteicos, permite simular evoluções biológicas em escalas de tempo gigantescas, de até 500 milhões de anos.
A criação dessa proteína fluorescente, cuja sequência genética difere radicalmente de todas as proteínas conhecidas, ilustra o potencial do ESM3. Este sucesso abre caminho para diversas aplicações, desde a medicina até a despoluição ambiental, passando pela concepção de materiais inovadores.
ESM3 está acessível em versão beta pública através de uma API, permitindo que cientistas explorem essa ferramenta para a engenharia de proteínas. Essa acessibilidade promove uma maior colaboração entre pesquisadores e acelera as descobertas no campo.
O treinamento do ESM3 em um vasto corpus de dados proteicos, incluindo sequências, estruturas e anotações funcionais, permitiu alcançar uma precisão sem precedentes. Este modelo, capaz de gerenciar até 98 bilhões de parâmetros, representa um avanço significativo na modelagem de proteínas.
As implicações dessa tecnologia são vastas, oferecendo ferramentas poderosas para explorar a imensa diversidade das proteínas. O ESM3 permite não apenas compreender melhor as proteínas naturais, mas também criar proteínas com propriedades únicas para aplicações específicas.
Essa inovação, publicada na
Science, marca um ponto de virada no uso da IA para a biologia sintética. Ela demonstra como os modelos de linguagem generativa podem transformar nossa abordagem na concepção de proteínas, simulando processos evolutivos complexos para gerar moléculas com funcionalidades inéditas.
Como o ESM3 modela as proteínas?
O ESM3 utiliza uma abordagem inovadora para modelar proteínas, integrando sequência, estrutura e função em um modelo de linguagem generativa. Diferentemente dos modelos anteriores, o ESM3 representa esses três aspectos através de alfabetos de tokens discretos, permitindo uma geração mais precisa e holística das proteínas.
O modelo é treinado em um vasto conjunto de dados, incluindo bilhões de sequências proteicas, milhões de estruturas e anotações funcionais. Essa riqueza de dados permite ao ESM3 simular processos evolutivos complexos, oferecendo uma compreensão aprofundada das proteínas naturais e a capacidade de projetar proteínas novas.
O ESM3 pode gerenciar até 98 bilhões de parâmetros, o que o torna um dos modelos mais poderosos para a modelagem de proteínas. Essa capacidade permite simulações precisas e detalhadas, abrindo novas perspectivas para a pesquisa em biologia sintética.
Quais são as aplicações potenciais do ESM3?
O ESM3 abre perspectivas inéditas em diversos campos, incluindo a medicina, onde poderia permitir a concepção de proteínas terapêuticas com propriedades únicas. No meio ambiente, poderia contribuir para a despoluição ao criar enzimas capazes de degradar poluentes específicos.
No campo dos materiais, o ESM3 poderia ser usado para projetar proteínas com propriedades mecânicas ou ópticas particulares, úteis para a criação de novos materiais. Essas aplicações ilustram o potencial transformador do ESM3 para a ciência e a tecnologia.
A acessibilidade do ESM3 através de uma API em versão beta pública facilita sua adoção pela comunidade científica. Isso permite uma maior colaboração e acelera as descobertas, oferecendo uma ferramenta poderosa para a engenharia de proteínas a uma ampla gama de pesquisadores.
Fonte: Science