News Release 26-Oct-2017

新型深度学习算法可破解广泛使用的网站保护系统

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

New Deep-Learning Algorithm Cracks Website Protection System, With Much Less Training — image: A representation of the letter A. This material relates to a paper that appeared in the 27 Oct.2017, issue of *Science*, published by AAAS. The paper, by D. George at Vicarious AI in Union City, CA, and colleagues was titled, "A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs." view more

Credit: Vicarious AI

科学家们创建了一个数据-高效性计算机模型，它能“解决”CAPTCHA问题；CAPTCHA是一个广泛应用的基于文本的系统，网站会用该系统来核查用户是否为真人；这代表了人工智能研究取得了关键性的进展。他们的发现提示，需要有更强健的超越当今编码到CAPTCHA系统内的挫败垃圾邮件及核查是否为真人的技术。CAPTCHAs被设计成无法用计算机算法进行破解，因为它会以上百万种不同的方式将许多不同的字母组合在一起。尽管人类能够天然识别某一物体，即使它混在层层叠叠或不同的式样中，但计算机却难以将杂乱堆中的每一字母进行分类。先前破解CAPTCHA的算法属数据密集型，它要求记忆数百万个标记的CAPTCHA图像的实例或如何破解每一类型图像的编码规则。Dileep George及同事在这里构建了一个更为有效的模型，它被称作递归皮层网络（Recursive Cortical Network，RCN）；该模型纳入了神经科学的洞察力来“训练”计算机从事超越其原先被教授过的概括功能。作者说，RCN成功的关键是，它以强力假设进行编码，并接着用它来形成输入预测，而这些输入是其在训练中从未遇到过的。因此，RCN可破解CAPTCHA文本，识别手写数字，描绘复杂分层的物体，识别现实世界场景照片中的文本。与阅读文本的最先进的深度学习方法相比，RCN的表现要优于最有力的竞争者PhotoOCR 达 1.9%，其所用的训练图像要少得多（RCN为1,406 vs PhotoOCR为790万）。RCN还取得了更好的准确度，数据有效性也增加了300倍。

###

Journal

Science

DOI

10.1126/science.aag2612

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.