News Release 26-Oct-2017

広く普及したウェブサイト保護システムを破る新たなディープラーニングアルゴリズム

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

New Deep-Learning Algorithm Cracks Website Protection System, With Much Less Training — image: A representation of the letter A. This material relates to a paper that appeared in the 27 Oct.2017, issue of *Science*, published by AAAS. The paper, by D. George at Vicarious AI in Union City, CA, and colleagues was titled, "A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs." view more

Credit: Vicarious AI

広く普及したテキストベースのシステムであり、利用者が人間であるか確認するためにウェブサイトで使用されるCAPTCHAを「解読」することができる、データ効率の良いコンピュータモデルを科学者達が開発しており、これは人工知能研究における貴重な進歩である。現在のCAPTCHAシステムにコード化されているものを超えて、スパムを排除し、人間であるか確認するより強靭な技術の必要性が、これらの科学者達の発見から示唆される。CAPTCHAは、多数の異なる文字の組み合わせを百万単位の異なる様式で集団化することによって、コンピュータアルゴリズムで破られないように作られている。たとえ重複または様式が層のように重ねられていても、人間は自然に対象を認識することができるが、コンピュータではごちゃ混ぜ状態から個々の文字を分類することが困難である。CAPTCHA を解読する以前のアルゴリズムはデータ集約的であり、数百万のラベル付きCAPTCHA 画像の例または個々の種類の画像を破る方法についてコード化された規則をメモリーに記録することが要求されていた。今回の論文では、Dileep George らがRCN（Recursive Cortical Network）と呼ばれる、より効率的なモデルを開発しており、これには、主に教えられたことを超えて一般化することをコンピュータに「訓練」するというニューロサイエンスから得られた知見が組み込まれている。今回の論文の著者らによると、RCNの成功の鍵は、訓練中に全く出くわさなかった入力を予測するために後に使用される強い仮定によってコード化されていることである。これによって、RCNでは、現実世界のシナリオの中の写真にあるCAPTCHAのテキストを解読し、手書きの数字を識別し、複雑な層に重ねられた対象を描写し、テキストを認識することが可能になる。テキストを読むためのディープラーニングによる最先端のアプローチと比較して、RCN の性能は最有力候補であるPhotoOCRのものより1.9％上回っており、かなり少ない訓練用画像が使用されている（PhotoOCRによって使用される790万枚に対して1,406枚）。RCNではより高い精度も達成されており、300倍データ効率が良い。

###

Journal

Science

DOI

10.1126/science.aag2612

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.