Adrien - Miércoles 29 Enero 2025

Una IA adelantada: ha generado lo que la evolución aún no ha concebido 🧬

Un equipo de investigadores ha logrado recientemente un avance significativo en el campo de la biología sintética gracias a la inteligencia artificial. Con esta IA, han podido adelantarse a la evolución natural.

Han utilizado un modelo de lenguaje generativo, ESM3, para diseñar una proteína fluorescente completamente nueva, abriendo perspectivas inéditas en la ingeniería de proteínas.


Imagen de ilustración Pixabay

ESM3 se distingue por su capacidad para integrar secuencia, estructura y función de las proteínas, ofreciendo un enfoque holístico sin precedentes. Este modelo, entrenado con miles de millones de datos proteicos, permite simular evoluciones biológicas en escalas de tiempo gigantescas, de hasta 500 millones de años.

La creación de esta proteína fluorescente, cuya secuencia genética difiere radicalmente de todas las proteínas conocidas, ilustra el potencial de ESM3. Este éxito abre el camino a diversas aplicaciones, desde la medicina hasta la descontaminación ambiental, pasando por el diseño de materiales innovadores.


ESM3 está disponible en versión beta pública a través de una API, permitiendo a los científicos aprovechar esta herramienta para la ingeniería de proteínas. Esta accesibilidad fomenta una mayor colaboración entre investigadores y acelera los descubrimientos en el campo.

El entrenamiento de ESM3 con un vasto corpus de datos proteicos, incluyendo secuencias, estructuras y anotaciones funcionales, ha permitido alcanzar una precisión sin precedentes. Este modelo, capaz de manejar hasta 98 mil millones de parámetros, representa un avance significativo en la modelización de proteínas.

Las implicaciones de esta tecnología son amplias, ofreciendo herramientas poderosas para explorar la inmensa diversidad de proteínas. ESM3 no solo permite comprender mejor las proteínas naturales, sino también crear proteínas con propiedades únicas para aplicaciones específicas.

Esta innovación, publicada en Science, marca un hito en el uso de la IA para la biología sintética. Demuestra cómo los modelos de lenguaje generativo pueden transformar nuestro enfoque en el diseño de proteínas, simulando procesos evolutivos complejos para generar moléculas con funcionalidades inéditas.

¿Cómo modela ESM3 las proteínas?


ESM3 utiliza un enfoque innovador para modelar proteínas, integrando secuencia, estructura y función en un modelo de lenguaje generativo. A diferencia de los modelos anteriores, ESM3 representa estos tres aspectos a través de alfabetos de tokens discretos, permitiendo una generación más precisa y holística de proteínas.

El modelo está entrenado con un vasto conjunto de datos, incluyendo miles de millones de secuencias proteicas, millones de estructuras y anotaciones funcionales. Esta riqueza de datos permite a ESM3 simular procesos evolutivos complejos, ofreciendo una comprensión profunda de las proteínas naturales y la capacidad de diseñar proteínas nuevas.

ESM3 puede manejar hasta 98 mil millones de parámetros, lo que lo convierte en uno de los modelos más potentes para la modelización de proteínas. Esta capacidad permite simulaciones precisas y detalladas, abriendo nuevas perspectivas para la investigación en biología sintética.

¿Cuáles son las aplicaciones potenciales de ESM3?



ESM3 abre perspectivas inéditas en diversos campos, especialmente en la medicina, donde podría permitir el diseño de proteínas terapéuticas con propiedades únicas. En el ámbito ambiental, podría contribuir a la descontaminación creando enzimas capaces de degradar contaminantes específicos.

En el campo de los materiales, ESM3 podría utilizarse para diseñar proteínas con propiedades mecánicas u ópticas particulares, útiles para la creación de nuevos materiales. Estas aplicaciones ilustran el potencial transformador de ESM3 para la ciencia y la tecnología.

La accesibilidad de ESM3 a través de una API en versión beta pública facilita su adopción por la comunidad científica. Esto permite una mayor colaboración y acelera los descubrimientos, ofreciendo una herramienta poderosa para la ingeniería de proteínas a una amplia gama de investigadores.

Fuente: Science
Ce site fait l'objet d'une déclaration à la CNIL
sous le numéro de dossier 1037632
Informations légales