広く普及したテキストベースのシステムであり、利用者が人間であるか確認するためにウェブサイトで使用されるCAPTCHAを「解読」することができる、データ効率の良いコンピュータモデルを科学者達が開発しており、これは人工知能研究における貴重な進歩である。現在のCAPTCHAシステムにコード化されているものを超えて、スパムを排除し、人間であるか確認するより強靭な技術の必要性が、これらの科学者達の発見から示唆される。CAPTCHAは、多数の異なる文字の組み合わせを百万単位の異なる様式で集団化することによって、コンピュータアルゴリズムで破られないように作られている。たとえ重複または様式が層のように重ねられていても、人間は自然に対象を認識することができるが、コンピュータではごちゃ混ぜ状態から個々の文字を分類することが困難である。CAPTCHA を解読する以前のアルゴリズムはデータ集約的であり、数百万のラベル付きCAPTCHA 画像の例または個々の種類の画像を破る方法についてコード化された規則をメモリーに記録することが要求されていた。今回の論文では、Dileep George らがRCN(Recursive Cortical Network)と呼ばれる、より効率的なモデルを開発しており、これには、主に教えられたことを超えて一般化することをコンピュータに「訓練」するというニューロサイエンスから得られた知見が組み込まれている。今回の論文の著者らによると、RCNの成功の鍵は、訓練中に全く出くわさなかった入力を予測するために後に使用される強い仮定によってコード化されていることである。これによって、RCNでは、現実世界のシナリオの中の写真にあるCAPTCHAのテキストを解読し、手書きの数字を識別し、複雑な層に重ねられた対象を 描写し、テキストを認識することが可能になる。テキストを読むためのディープラーニングによる最先端のアプローチと比較して、RCN の性能は最有力候補であるPhotoOCRのものより1.9%上回っており、かなり少ない訓練用画像が使用されている(PhotoOCRによって使用される790万枚に対して1,406枚)。RCNではより高い精度も達成されており、300倍データ効率が良い。
###
Journal
Science