News Release 

DeepMind y el EMBL publican la base de datos más completa de predicciones de estructuras 3D de proteínas humanas hasta la fecha

Los dos socios han utilizado AlphaFold, el sistema de inteligencia artificial reconocido el año pasado como una solución al problema de determinar cómo se pliegan las proteínas, para dar a conocer a la comunidad científi

European Molecular Biology Laboratory - European Bioinformatics Institute

Research News

IMAGE

IMAGE: Protein structures to represent the data obtained via AlphaFold view more 

Credit: Karen Arnott/EMBL-EBI

LONDRES, 22 de julio de 2021 - DeepMind ha anunciado hoy su colaboración con el Laboratorio Europeo de Biología Molecular (EMBL), el principal laboratorio europeo en ciencias de la vida, para proporcionar de manera libre y abierta a la comunidad científica la base de datos de los modelos de predicciones de las estructuras del proteoma humano más completa y precisa hasta la fecha. Esto incluirá alrededor de 20,000 proteínas expresadas por el genoma humano. La base de datos y el sistema de inteligencia artificial brindan a los biólogos estructurales nuevas y poderosas herramientas para examinar la estructura tridimensional de las proteínas, y ofrecen un tesoro de datos que podría abrir el camino a futuros avances y presagiar una nueva era para la biología basada en la inteligencia artificial.

En diciembre de 2020, los organizadores de la evaluación comparativa Critical Assessment of Protein Structure Prediction (CASP) reconocieron AlphaFold como una solución al gran desafío de más de 50 años de predecir la estructura de proteínas, lo que significó un logro asombroso en el campo. La base de datos de estructura de proteínas AlphaFold (AlphaFold Protein Structure Database) se basa en esta innovación y en los descubrimientos de generaciones de científicos y científicas, desde los pioneros y las pioneras de la cristalografía y el análisis de estructura de las proteínas , hasta los miles de especialistas en predicción y biólogos y biólogas estructurales que han pasado años experimentando con proteínas desde entonces y que han compartido sus resultados de forma abierta. La base de datos explota y amplía drásticamente el conocimiento acumulado sobre las estructuras de proteínas, más que duplicando el número de estructuras de proteínas humanas con predicciones de alta precisión disponibles para los investigadores. Avanzar en la comprensión de estos componentes básicos de la vida, que sustentan los procesos biológicos en todos los seres vivos, permitirá a los investigadores de una gran variedad de campos acelerar su trabajo.

La semana pasada se publicó en la revista Nature la metodología de la última e innovadora versión de AlphaFold, el sofisticado sistema de inteligencia artificial anunciado en diciembre pasado que impulsa estas predicciones de estructura, y su código fuente abierto. El anuncio de hoy coincide con un segundo artículo de Nature que proporciona la imagen más completa de las proteínas que componen el proteoma humano, y la publicación de las proteínas de 20 organismos adicionales que son importantes para la investigación biológica.

"Nuestro objetivo en DeepMind siempre ha sido construir inteligencia artificial y utilizarla como una herramienta para ayudar a acelerar el ritmo del descubrimiento científico, y mejorar así el conocimiento del mundo que nos rodea", dijo el fundador y director ejecutivo de DeepMind, el Dr. Demis Hassabis. "Hemos utilizado AlphaFold para generar la imagen más completa y precisa del proteoma humano. Creemos que esta es la contribución más significativa que ha hecho la inteligencia artificial al avance del conocimiento científico hasta la fecha, y es un gran ejemplo de los tipos de beneficios que la inteligencia artificial puede aportar a la sociedad".

AlphaFold ya está ayudando a los científicos a acelerar sus descubrimientos

La capacidad de predecir computacionalmente la forma de una proteína a partir de su secuencia de aminoácidos, en lugar de tener que determinarla experimentalmente con técnicas minuciosas, laboriosas, y a menudo costosas, ya está ayudando a los científicos a lograr en meses lo que antes requería años de trabajo.

"La base de datos AlphaFold es un ejemplo perfecto del círculo virtuoso de la ciencia abierta", dijo la directora general del EMBL, Edith Heard. "AlphaFold ha sido entrenado utilizando datos de recursos públicos creados por la comunidad científica, por lo que tiene sentido que sus predicciones sean públicas. Compartir las predicciones de AlphaFold de forma abierta y gratuita permitirá a los investigadores de todo el mundo obtener nuevos conocimientos e impulsar nuevos descubrimientos. Creo que AlphaFold es una verdadera revolución para las ciencias de la vida, así como fue la genómica hace varias décadas y estoy muy orgullosa de que el EMBL haya podido ayudar a DeepMind a permitir el acceso abierto a este recurso extraordinario".

AlphaFold ya está siendo utilizado por socios como la Iniciativa de Medicamentos para Enfermedades Desatendidas (DNDi, por sus siglas en inglés), que ha avanzado en su investigación sobre curas que salvan vidas para enfermedades que afectan de manera desproporcionada a las zonas más pobres del mundo, o el Centro de Innovación Enzimática (CEI) que utiliza AlphaFold para ayudar a diseñar enzimas más rápidas para reciclar algunos de los plásticos más contaminantes de un solo uso. AlphaFold ha ayudado a acelerar la investigación de aquellos científicos y científicas que trabajan en la determinación experimental de la estructura de las proteínas. Por ejemplo, un equipo de la Universidad de Colorado en Boulder utiliza las predicciones de AlphaFold para estudiar la resistencia a los antibióticos, mientras que un grupo de la Universidad de California en San Francisco las ha utilizado para estudiar la biología del SARS-CoV-2.

La base de datos de estructura de proteínas AlphaFold (AlphaFold Protein Structure Database)

La base de datos de estructura de proteínas AlphaFold* [el enlace se activará cuando se levante el embargo] está basada en muchas contribuciones de la comunidad científica internacional, así como en las refinadas innovaciones algorítmicas de AlphaFold y en las décadas de experiencia del Instituto Europeo de Bioinformática del EMBL (EMBL-EBI) compartiendo datos biológicos mundiales. DeepMind y el EMBL-EBI están dando libre acceso a las predicciones de AlphaFold para que cualquiera pueda usar el sistema con el fin de permitir y acelerar la investigación y explorar nuevas vías de conocimiento científico.

"Este será uno de los conjuntos de datos más importantes desde el mapa del Genoma Humano", ha dicho el Director General Adjunto del EMBL y el director del EMBL-EBI, Ewan Birney. "Hacer que las predicciones de AlphaFold sean accesibles a la comunidad científica internacional abre muchas nuevas vías de investigación, desde enfermedades desatendidas hasta nuevas enzimas para la biotecnología y mucho más. Esta es una nueva y gran herramienta científica, que complementa las tecnologías existentes y nos permitirá ampliar los límites de nuestra comprensión del mundo ".

Entre las primeras más de 350.000 estructuras publicadas en la base de datos, además del proteoma humano, están las proteínas de 20 organismos biológicamente significativos como E. coli, la mosca de la fruta, el ratón, el pez cebra, el parásito de la malaria y las bacterias de la tuberculosis. Se han realizado muchas investigaciones importantes sobre estos organismos, y tener estas estructuras a disposición permitirá a muchos investigadores de campos muy diferentes, desde la neurociencia hasta la medicina, acelerar su trabajo.

El futuro de AlphaFold

La base de datos y el sistema serán actualizados periódicamente a medida que se continúe invirtiendo en mejoras futuras de AlphaFold, y en los próximos meses se planea expandir enormemente la cobertura a casi todas las proteínas secuenciadas conocidas por la ciencia: más de 100 millones de estructuras que incluyen la mayoría de UniProt, la base de datos referencia.

Para más detalles, se pueden consultar los artículos de Nature que describen el método completo y el proteoma humano*, y leer las notas de los autores aquí*. Para ver el funcionamiento del sistema, se puede ver el código de fuente abierta para AlphaFold, y el cuaderno Colab* para ejecutar secuencias individuales. Para explorar las estructuras, se puede visitar la base de datos de búsqueda* del EMBL-EBI, abierta y gratuita para todo el mundo.

###

Entrecomillados desde el EMBL:

Prof. Dame Janet Thornton, directora emérita del EMBL-EBI

"En la base de las predicciones de AlphaFold está el poder de la inteligencia artificial, que a su vez se basa en datos recopilados por científicos de todo el mundo durante los últimos 50 años. La puesta a disposición de estos modelos indudablemente impulsará a los investigadores de la estructura de las proteínas, tanto experimentales como teóricos a aplicar este nuevo conocimiento en sus propias áreas de investigación y a abrir nuevas áreas de interés. Esto contribuirá a nuestro conocimiento y comprensión de los sistemas vivos, con todas las oportunidades para la humanidad que esto desbloqueará".

Sameer Velankar, PhD, Section Head at EMBL-EBI

"Veinte años después de la revolución del genoma humano, AlphaFold es un avance significativo en la investigación biológica. La función de las proteínas está dictada por su estructura, y la base de datos de estructuras de proteínas AlphaFold entregará millones de estructuras de proteínas, acelerando el proceso de descubrimiento. La escala sin precedentes de esta publicación desatará una nueva ola de innovaciones para ayudarnos a abordar desafíos que van desde la salud hasta el cambio climático".

Notes to Editors

Media contacts

DeepMind: press@deepmind.com

EMBL: media@embl.org

Sobre DeepMind

DeepMind es una empresa de descubrimiento científico, comprometida con "resolver inteligencia para hacer avanzar la ciencia y la humanidad". Resolver la inteligencia requiere un equipo diverso e interdisciplinario que trabaje en estrecha colaboración, desde científicos y diseñadores hasta ingenieros y especialistas en ética, para ser pioneros en el desarrollo de inteligencia artificial avanzada.

Los avances de la compañía incluyen AlphaGo, AlphaFold, más de mil artículos de investigación publicados (incluidos más de una docena en Nature and Science), asociaciones con organizaciones científicas y cientos de contribuciones a los productos de Google (en todo, desde la eficiencia de la batería de Android hasta el asistente de texto a discurso).

Sobre el EMBL (Laboratorio Europeo de Biología Molecular)

El EMBL el principal laboratorio europeo en ciencias de la vida, un organismo intergubernamental establecido en 1974 y formado por 27 estados miembros, 2 futuros estados miembros y 1 estado miembro asociado.

El EMBL realiza investigación básica en biología molecular, estudiando la historia de la vida. Ofrece servicios para la comunidad científica, formando a la próxima generación de científicos y esforzándose para integrar las ciencias de la vida por toda Europa.

Es un organismo internacional, interdisciplinario y con una alta capacidad innovadora. Actualmente trabajan más de 1800 personas de más de 80 países, repartidos entre Barcelona (España), Grenoble (Francia), Hamburgo y Heidelberg (Alemania), Hinxton (Reino Unido) y Roma (Italia). Los científicos del EMBL trabajan en grupos independientes, realizando sus investigaciones y ofreciendo sus servicios en todas las áreas de la biología molecular.

Los investigadores del EMBL impulsan el desarrollo de nuevas tecnologías y métodos en ciencias de la vida, y trabajan para transferir el conocimiento para el beneficio de la sociedad.

Sobre el Instituto Europeo de Bionformática del EMBL (EMBL-EBI)

El Instituto Europeo de Bioinformática (EMBL-EBI) es líder mundial en el almacenamiento, análisis y difusión de grandes conjuntos de datos biológicos. Ayudamos a los científicos a darse cuenta del potencial de los macrodatos, mejorando su capacidad para explotar información compleja para hacer descubrimientos que beneficien a la humanidad.

Estamos a la vanguardia de la investigación en biología computacional, con un trabajo que abarca métodos de análisis de secuencia, análisis estadístico multidimensional y descubrimiento biológico basado en datos, desde la biología vegetal hasta el desarrollo y la enfermedad de mamíferos. Somos parte de EMBL y estamos ubicados en el Wellcome Genome Campus, una de las concentraciones más grandes del mundo de experiencia científica y técnica en genómica.

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.