Proteínas humanas dibujadas por Inteligencia Artificial
El laboratorio de investigación de IA DeepMind ha creado el mapa más completo de proteínas humanas hasta la fecha utilizando inteligencia artificial. La compañía, una subsidiaria de Alphabet, matriz de Google, está publicando los datos de forma gratuita, y algunos científicos comparan el impacto potencial del trabajo con el del Proyecto Genoma Humano, un esfuerzo internacional para mapear cada gen humano.
Las proteínas son moléculas largas y complejas que realizan numerosas tareas en el cuerpo, desde la construcción de tejidos hasta la lucha contra las enfermedades. Su propósito está dictado por su estructura, que se pliega como el origami en formas complejas e irregulares. Comprender cómo se pliega una proteína ayuda a explicar su función, lo que a su vez ayuda a los científicos con una variedad de tareas, desde realizar investigaciones fundamentales sobre cómo funciona el cuerpo hasta diseñar nuevos medicamentos y tratamientos.”LA CULMINACIÓN DE TODA LA VIDA ÚTIL DE MÁS DE 10 AÑOS DE DEEPMIND”
Anteriormente, la determinación de la estructura de una proteína se basaba en experimentos costosos y que requerían mucho tiempo. Pero el año pasado DeepMind demostró que puede producir predicciones precisas de la estructura de una proteína utilizando un software de inteligencia artificial llamado AlphaFold. Ahora, la compañía está dando a conocer al público cientos de miles de predicciones hechas por el programa.
“Veo esto como la culminación de los más de 10 años de vida de DeepMind”, dijo el director ejecutivo y cofundador de la compañía, Demis Hassabis . “Desde el principio, esto es lo que nos propusimos hacer: lograr avances en IA, probar eso en juegos como Go y Atari, [y] aplicar eso a problemas del mundo real, para ver si podemos acelerar los avances científicos y usar los que benefician a la humanidad “.
Actualmente hay alrededor de 180.000 estructuras de proteínas disponibles en el dominio público, cada una producida mediante métodos experimentales y accesibles a través del Protein Data Bank. DeepMind está publicando predicciones para la estructura de unas 350.000 proteínas en 20 organismos diferentes, incluidos animales como ratones y moscas de la fruta, y bacterias como E. coli . (Existe cierta superposición entre los datos de DeepMind y las estructuras de proteínas preexistentes, pero exactamente cuánto es difícil de cuantificar debido a la naturaleza de los modelos). Lo más significativo es que la publicación incluye predicciones para el 98 por ciento de todas las proteínas humanas, alrededor de 20.000 diferentes. estructuras, que se conocen colectivamente como el proteoma humano. No es el primer conjunto de datos públicos de proteínas humanas., pero es el más completo y preciso.
Si lo desean, los científicos pueden descargar todo el proteoma humano por sí mismos, dice el líder técnico de AlphaFold, John Jumper. “Existe un HumanProteome.zip efectivamente, creo que tiene un tamaño de 50 gigabytes” . “Puede guardarlo en una unidad flash si lo desea, ¡aunque no le serviría de mucho sin una computadora para el análisis!”
LOS BENEFICIOS DEL PLEGAMIENTO DE PROTEÍNAS
Comprender la estructura de una proteína es útil para los científicos en una variedad de campos. La información puede ayudar a diseñar nuevos medicamentos, sintetizar nuevas enzimas que descomponen los materiales de desecho y crear cultivos resistentes a los virus o al clima extremo. Las predicciones de proteínas de DeepMind ya se están utilizando para la investigación médica , incluido el estudio del funcionamiento del SARS-CoV-2 , el virus que causa el COVID-19.”DEFINITIVAMENTE TENDRÁ UN GRAN IMPACTO PARA LA COMUNIDAD CIENTÍFICA”
Los nuevos datos acelerarán estos esfuerzos, pero los científicos señalan que aún llevará mucho tiempo convertir esta información en resultados del mundo real. “No creo que vaya a ser algo que cambie la forma en que se trata a los pacientes durante el año, pero definitivamente tendrá un gran impacto para la comunidad científica”, dijo Marcelo C. Sousa, profesor del departamento de bioquímica de la Universidad de Colorado. , le dijo a The Verge .
Los científicos tendrán que acostumbrarse a tener esa información al alcance de la mano, dice la científica investigadora principal de DeepMind, Kathryn Tunyasuvunakool. “Como biólogo, puedo confirmar que no tenemos un libro de jugadas para mirar incluso 20.000 estructuras, por lo que esta [cantidad de datos] es enormemente inesperada. Analizar cientos de miles de estructuras es una locura”.
Sin embargo, en particular, el software de DeepMind produce predicciones de estructuras de proteínas en lugar de modelos determinados experimentalmente, lo que significa que en algunos casos se necesitará más trabajo para verificar la estructura. DeepMind dice que pasó mucho tiempo construyendo métricas de precisión en su software AlphaFold, que clasifica la confianza que tiene para cada predicción.
“El acuerdo cuando nos adquirieron es que estamos aquí principalmente para avanzar en el estado de las tecnologías AGI e IA y luego usarlo para acelerar los avances científicos”, dice Hassabis. “[Alphabet] tiene muchas divisiones enfocadas en ganar dinero”, agrega, señalando que el enfoque de DeepMind en la investigación “trae todo tipo de beneficios, en términos de prestigio y buena voluntad para la comunidad científica. Hay muchas formas de obtener valor “.
Hassabis predice que AlphaFold es una señal de lo que vendrá, un proyecto que muestra el enorme potencial de la inteligencia artificial para manejar problemas complicados como la biología humana.
“Creo que estamos en un momento realmente emocionante”, dice. “En la próxima década, nosotros, y otros en el campo de la IA, esperamos producir avances asombrosos que realmente aceleren las soluciones a los grandes problemas que tenemos aquí en la Tierra”.