News Release 26-Oct-2017

Un nuevo algoritmo de aprendizaje profundo rompe el sistema generalizado de protección de páginas web

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

New Deep-Learning Algorithm Cracks Website Protection System, With Much Less Training — image: A representation of the letter A. This material relates to a paper that appeared in the 27 Oct.2017, issue of *Science*, published by AAAS. The paper, by D. George at Vicarious AI in Union City, CA, and colleagues was titled, "A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs." view more

Credit: Vicarious AI

Representando un avance crítico en la investigación de la inteligencia artificial, los científicos han creado un modelo informático eficiente en datos que puede "resolver" CAPTCHA, el extendido sistema basado en texto utilizado por los sitios web para verificar si un usuario es humano. Sus hallazgos sugieren la necesidad de emplear técnicas más sólidas para contrarrestar el spam y técnicas de verificación de humano que vayan más allá de lo codificado en el sistema CAPTCHA actual. Los CAPTCHA están diseñados para que no puedan ser descifrados por los algoritmos informáticos, al agrupar numerosas combinaciones de letras diferentes en un millón de estilos diferentes. Si bien los humanos pueden reconocer un objeto de forma natural incluso en capas de superposición o estilos, los ordenadores tienen dificultades para clasificar cada letra en ese revoltijo. Los algoritmos anteriores para resolver CAPTCHA son intensivos en datos y requieren una memoria de millones de ejemplos de imágenes CAPTCHA etiquetadas o reglas codificadas sobre cómo descodificar cada tipo de imagen. En esta ocasión, Dileep George y sus colegas han construido un modelo más eficiente, denominado Red Cortical Recursiva (RCR), que incorpora conocimientos procedentes de la neurociencia para "entrenar" al ordenador para generalizar más allá de lo que se le enseña en un primer momento. La clave del éxito de la RCR, afirman los autores, es que está codificada con fuertes suposiciones que posteriormente utiliza para formar predicciones a partir de entradas con las que nunca se encontró en el entrenamiento. Con esto, la RCR podría resolver textos CAPTCHA, identificar dígitos escritos a mano, delinear objetos complejos en capas y reconocer texto en fotografías de escenarios del mundo real. En comparación con los enfoques de aprendizaje profundo de última generación para la lectura de textos, la RCR superó a su principal adversario, PhotoOCR, en un 1,9 %, utilizando considerablemente menos imágenes de entrenamiento (1406 frente a los 7,9 millones utilizados por PhotoOCR). La RCR también logró mayor precisión y fue 300 veces más eficiente en datos.

###

Journal

Science

DOI

10.1126/science.aag2612

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.