News Release

CORNETO: aprendizaje automático para descifrar datos ómicos complejos

Una nueva herramienta combina conocimiento biológico con aprendizaje automático para ayudar a los investigadores a extraer información significativa de datos ómicos complejos

Peer-Reviewed Publication

European Molecular Biology Laboratory

image: 

CORNETO: machine learning to decode complex omics data 

view more 

Credit: Karen Arnott/EMBL-EBI

Resumen

  • CORNETO es una nueva herramienta computacional que permite a los investigadores combinar distintos tipos de datos biológicos con datos y conocimiento biológico previo para mapear cómo interactúan moléculas como genes y proteínas dentro de las células.

  • Al analizar múltiples muestras de forma conjunta, CORNETO revela qué procesos biológicos son comunes y cuáles son específicos según el tipo celular o las condiciones experimentales.

  • Los investigadores han utilizado CORNETO para identificar rutas compartidas y específicas en estudios sobre enfermedades, por ejemplo, para detectar vías de señalización asociadas con la resistencia a la quimioterapia en pacientes con cáncer de ovario.

Científicos del EMBL-EBI, en colaboración con la Universidad de Heidelberg, han desarrollado CORNETO, una nueva herramienta computacional que emplea técnicas de aprendizaje automático para extraer información significativa de datos biológicos complejos. CORNETO permite a los usuarios reconstruir redes moleculares, que son mapas de interacciones entre genes, proteínas y vías de señalización, combinando datos experimentales de distintas muestras y condiciones con datos biológicos ya conocidos, como redes de señalización o metabolismo. Esto facilita la comprensión de los mecanismos que determinan si una célula está sana o enferma.

Comprender cómo interactúan las moléculas dentro de nuestras células es fundamental para identificar los mecanismos que pueden fallar y conducir a enfermedades. Sin embargo, a medida que aumentan el volumen y la complejidad de los datos ómicos disponibles, los investigadores enfrentan dificultades para extraer patrones útiles y con sentido biológico. CORNETO  - acrónimo de Constrained Optimisation for the Recovery of NETworks from Omics -  combina técnicas de aprendizaje automático y conocimiento biológico previo para analizar simultáneamente múltiples tipos de datos ómicos, como transcriptómica, proteómica y metabolómica.

“Queríamos resolver un desafío común en la biología de sistemas: cómo interpretar los datos ómicos cuando se dispone de tantos datos complejos al mismo tiempo”, explica Julio Saez-Rodriguez, Director de Investigación en EMBL-EBI y profesor en excedencia en la Universidad de Heidelberg. “CORNETO ayuda combinando estos datos complejos con información previa proveniente de bases de datos biológicas, para identificar patrones que sean consistentes, interpretables y con relevancia biológica”.

Análisis ómico unificado
Tradicionalmente, los científicos analizan los datos de un tipo a la vez - por ejemplo, comparando células sanas con células enfermas - y construyen redes de interacción separadas para cada caso. Sin embargo, este enfoque puede pasar por alto la visión global. CORNETO utiliza aprendizaje automático para analizar múltiples muestras o condiciones de forma conjunta, destacando los procesos biológicos compartidos entre conjuntos de datos y señalando las diferencias específicas. Además, está diseñado para ser personalizable y adaptable a casos de uso específicos o a nuevos tipos de datos.

“Utilizar CORNETO es como encontrar los hilos comunes en una red enmarañada”, afirma Pablo Rodríguez-Mier, investigador postdoctoral en la Universidad de Heidelberg. “Ayuda a los investigadores a identificar los procesos biológicos clave que ocurren en muchas muestras y a entender qué es igual o distinto en cada una”.

Aplicaciones reales
CORNETO resulta especialmente útil en campos como la investigación oncológica, donde existen similitudes entre pacientes, pero ningún paciente es exactamente igual a otro. Para demostrar su utilidad, los investigadores utilizaron CORNETO para analizar datos de expresión génica de múltiples pacientes con cáncer, con el fin de descubrir qué vías de señalización intracelular estaban funcionando de manera anómala.

Utilizando únicamente datos transcriptómicos, CORNETO identificó quinasas clave desreguladas - enzimas que regulan la señalización celular - que también fueron detectadas de manera independiente mediante fosfoproteómica. Las redes resultantes revelaron tanto rutas compartidas como diferencias específicas de cada paciente, un avance hacia el tipo de conocimientos que podrían respaldar tratamientos personalizados en el futuro.

Actualmente, CORNETO también se está utilizando en el proyecto europeo DECIDER para identificar vías de señalización desreguladas asociadas con la resistencia a la quimioterapia en pacientes con cáncer de ovario.

Los investigadores también aplicaron CORNETO al análisis de rutas metabólicas en cepas de levadura con diferentes genes inactivados. En este caso, CORNETO fue capaz de identificar los procesos clave que las células de levadura utilizaban para sobrevivir y crecer. Comprender estos procesos esenciales podría ayudar a diseñar cepas de levadura más eficientes para la producción de biocombustibles y otros productos en aplicaciones industriales.

Código abierto y listo para usar
CORNETO está disponible como software de código abierto en GitHub. Allí también se pueden encontrar tutoriales, conjuntos de datos de ejemplo y un código modular que permite adaptar la herramienta a distintas necesidades.

Financiación

Este trabajo ha sido financiado por el programa Horizon 2020 de la Unión Europea bajo el acuerdo de beca No 951773 (PerMedCoE) y No 965193 (DECIDER). 

 


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.