News Release 6-Aug-2021

Crean un nuevo algoritmo de aprendizaje automático ultrarrápido y de bajo consumo para el procesamiento de grandes volúmenes de datos

La nueva solución mejora de manera espectacular uno de los métodos de referencia para la clasificación de datos mediante técnicas de Machine Learning. El trabajo acaba de publicarse en la revista ‘IEEE Transactions on Pattern Analysis and Machine In

Peer-Reviewed Publication

CiTIUS

Ultrarrápido y de máxima eficiencia — image: Científicos del Centro de Investigación CiTIUS, en España, han creado un nuevo algoritmo que mejora las máquinas de vectores de Soporte (SVM), un método de referencia para clasificar conjuntos de datos con una precisión prácticamente idéntica a la humana. view more

Credit: Andrés Ruiz / CiTIUS

A casi nadie se le escapa ya que la Inteligencia Artificial (y más concretamente el ‘Aprendizaje automático’ o Machine Learning), viven su momento de máximo esplendor. La investigación desarrollada en este campo en los últimos años, unida a la enorme potencia de cálculo alcanzada por los ordenadores y la ingente cantidad de datos disponible para entrenar los algoritmos, ha revolucionado nuestras vidas y todos los sectores de la economía.

Nada de ello habría sido posible sin la curiosidad y el esfuerzo de la comunidad científica, que a lo largo de las últimas décadas ha contribuido a la progresiva sofisticación de las técnicas de aprendizaje automático, un área de investigación cada vez más precisa, que permite entrenar a las máquinas para que resuelvan problemas muy diversos sin programarlas específicamente para ello.

Las estrategias propuestas para lograrlo son muchas; una de las más conocidas y potentes hoy en día son las denominadas ‘Máquinas de Vectores de Soporte’ (Support Vector Machines, SVM), creadas por los científicos Isabelle Guyon, Bernhard Schölkopf y Vladimir Vapnik en la década de los 90. Se trata de una aportación de importancia capital, reconocida entre otros galardones con el Premio ‘Fronteras del Conocimiento’ de la Fundación BBVA en 2020.

Esencialmente, las Máquinas de Vectores de Soporte (SVM) son un método para clasificar conjuntos de datos, con una precisión prácticamente idéntica a la humana; y en algunos casos, incluso mayor. Las SVM son uno de los clasificadores con mejores prestaciones en la actualidad, que han demostrado sobradamente su eficacia a la hora de reconocer datos de naturaleza diversa: desde textos, voces y rostros de personas, hasta células cancerosas o usos fraudulentos de una tarjeta de crédito.

Sin embargo, no existe un método infalible ni mejor en todos los casos, o para todas las circunstancias. Así, las SVM se han revelado considerablemente lentas a la hora de abordar problemas en los que el número de datos es muy grande, lo cual resulta particularmente problemático a la hora de trabajar en entornos Big Data; por otra parte, su consumo de memoria resulta en ocasiones inasumible, pudiendo invalidar, en la práctica, este tipo de soluciones.

Ahora, una investigación realizada en el CiTIUS (Centro Singular de Investigación en Tecnologías Inteligentes de la Universidad de Santiago de Compostela – USC), ha permitido superar estas limitaciones con el desarrollo de un nuevo ‘Clasificador Rápido de Vectores de Soporte’ (Fast Support Vector Classifier, FSVC), que presenta numerosas ventajas respecto al método estándar. En primer lugar, es mucho más rápido -entre 10 y 100 veces- que las aproximaciones tradicionales. Además, este nuevo clasificador opera con mucha menos memoria, «gracias a lo cual es capaz de desarrollar soluciones óptimas con ordenadores mucho menos potentes y costosos», explica Manuel Fernández Delgado, director de la investigación.

Los investigadores del CiTIUS destacan esta cuestión como una de las contribuciones esenciales del trabajo: «el ahorro de memoria tiene una gran importancia», asegura Ziad Akram, investigador predoctoral del CiTIUS y primer autor del artículo, «ya que mejorando la eficiencia podemos resolver, con equipos mucho más modestos, problemas para los que normalmente necesitaríamos un supercomputador». «Todo ello se traduce en una reducción enorme del coste y el consumo de energía», subraya su colega Eva Cernadas, investigadora principal del centro y coautora del paper.

Otro de los artífices del trabajo, Senén Barro, puntualiza que «una de las claves es haber conseguido desarrollar una solución analítica para el diseño de clasificadores, lo que evita usar métodos iterativos de aprendizaje sobre conjuntos de datos, la causa principal de la ineficiencia computacional y de consumo de recursos del Aprendizaje automático». El director científico del CiTIUS aclara que «con esta nueva aproximación, es como si pudiésemos memorizar de una vez un conjunto enorme de casos (de caras, por ejemplo), sin necesidad de verlas una y otra vez hasta que queden grabadas en nuestra memoria». «La rapidez y el ahorro en memoria y en capacidad de cómputo es enorme, lo que supone un ahorro en dinero y, aún más importante, en huella de carbono», concluye Barro.

Referencias

Z. A. Ali Hammouri, M. F. Delgado, E. Cernadas and S. Barro, "Fast SVC for large-scale classification problems". IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2021.3085969.

Código en Octave: https://persoal.citius.usc.es/manuel.fernandez.delgado/papers/fsvc
Cápsula en IEEE Ocean: https://codeocean.com/capsule/2827247/tree/v1

Journal

IEEE Transactions on Pattern Analysis and Machine Intelligence

DOI

10.1109/TPAMI.2021.3085969

Method of Research

Literature review

Subject of Research

Not applicable

Article Title

Fast SVC for large-scale classification problems

Article Publication Date

1-Jun-2021

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.