2-Oct-2025
懸念されるタンパク質をコードする遺伝子に対するバイオセキュリティ・スクリーニングの強化
American Association for the Advancement of Science (AAAS)Peer-Reviewed Publication
人工知能支援タンパク質工学の進展により、タンパク質設計の飛躍的進歩が可能になっているが、有害なタンパク質が生産される可能性があるというバイオセキュリティ上の課題も生じている。有害なタンパク質を検出するスクリーニングソフトウェアはあるものの、そのようなソフトウェアを複数月にわたり解析した新たな研究の報告によると、このソフトウェアには脆弱性があり、一部の懸念されるタンパク質は検出を回避する可能性がある。重要な点として、本研究は将来的に懸念されるタンパク質の検出率を向上させる方法の提示も行っている。AI支援タンパク質設計(AIPD)は、医学や生物学を強力に前進させ、それにより研究者らは既存のタンパク質を修飾したり、新たな構造や機能を持つまったく新しいタンパク質を設計したりできるようになっている。しかし、この強力なテクノロジーの乱用により有害なタンパク質が設計される可能性もある。研究所でタンパク質を作るために必要な手順は、タンパク質をコードするDNAを指示することである。これらの合成核酸を提供する企業は、顧客の指示をバイオセキュリティ・スクリーニングソフトウェア(BSS)でスクリーニングし、懸念されるタンパク質をコードする遺伝子を特定し阻止している。ところが、タンパク質配列生成モデルは、制御対象例とは十分異なり検出を回避するアミノ酸配列を持つ機能性変異体を作ることができる。それにもかかわらず、BSSの脆弱性について体系的な評価はこれまで行われておらず、生成的タンパク質設計に伴って生じる可能性のあるバイオセキュリティリスクに関する国際的なガバナンスも不足している。こうした懸念について、ScienceはこれまでにBloomfieldらがPolicy Forumで、およびDavid BakerとGeorge ChurchがEditorialで取り上げていた。
本研究でBruce Wittmannらは、BSSモデルを改善しバイオセキュリティを高めることを目的に、「AIレッドチーミング」アプローチを用いてBSSモデルを評価した。WittmannらはオープンソースのAIタンパク質設計ソフトウェアを用いて、有害なタンパク質の変異体を75,000以上生成し、それらを4つの異なるBSS開発元に提示した。その結果、どのツールもオリジナルの野生型タンパク質のスクリーニングではほぼ完璧な成績が得られた一方で、再構成された変異体を検出する能力には一貫性がなかった。著者らによるとこの結果は、現行のBSSシステムは、改変されていない配列には引き続き有効であるものの、最新の生成AI手法を用いて設計されたタンパク質配列のホモログに直面したときには、類似したシステムであっても一貫した感度は得られないことを示唆している。当初の研究結果を受けてWittmannらは、BSSプロバイダーと協力し、ソフトウェアパッチを開発した。これらは4つのBSSプロバイダーのシステムのうち3つで配布された。この更新により、誤検出を大幅に増加させることなく、AI生成変異体の検出率を改善することができた。だが著者らは、どのツールも完全なカバー率は達成できず、プロバイダー全体で約3%の変異体が機能を維持しながら検出を逃れた可能性が高いと指摘している。「AIの向上は生物学や医学におけるブレイクスルーを促進しているが、新たな力には警戒と慎重なリスク管理の責任が伴う」と、本研究の上席著者でありMicrosoftの最高科学責任者(chief scientific officer)でもあるEric Horvitzは述べた。「この特定の脆弱性の同定と軽減に向けた取り組みだけでなく、われわれは有効なプロセスを開発し実証することを目的としていた。それはすなわち、分野横断的なチームを構築し、厳密な科学的手法を適用し、潜在的リスクを管理しながら科学を進歩させる方法で機密性の高いデータと知見を共有する枠組みを作ることである。」
データやコードの一部は悪用される可能性があるため公開レポジトリで提供すべきではないことを、本研究の著者らはScienceに認識させた。そのため著者らは、データ公開用の階層型アクセス方式を設計している。この方式では、関心のある団体は非営利組織International Biosecurity and Biosafety Initiative for Science(IBBIS)(https://ibbis.bio)の指定担当者に連絡して、制限資料へのアクセスを申請できる。要求者は、自分の身元と所属先、データ使用に関する簡単な説明を提供する必要があり、さらにデータ使用契約に従うことになる。IBBISの委員会が申請を評価し、要求者の提供した情報が正確であり、提案された使用が正当かどうかを判断する。制限データは、情報の危険度に応じて階層別に編成されており(本研究に使用されたコードは最上位の階層に含まれる)、提案された使用の適合性に基づき公開される。Scienceの編集者はScienceのEditorial Policiesにおいて、提案されたこの方式はセキュリティ上の懸念とデータおよびコードの利用可能性の要件を十分にバランスさせていることに同意している。また著者らは、将来的な機密解除やデータ管理の引継ぎについても準備している。この方式によるデータの利用可能性に関して懸念がある場合は、science_data@aaas.orgに連絡して懸念を提起できる。
- Journal
- Science