東京医科歯科大学消化器内科の竹中健人助教と東京医科歯科大学高等研究院の渡辺守特別栄誉教授と東京医科歯科大学病院光学医療診療部の大塚和朗教授のグループは、ソニー株式会社との共同研究で、潰瘍性大腸炎内視鏡画像に基づくコンピューター画像支援システム(DNUC; deep neural network system based on endoscopic images of ulcerative colitis)を開発しました。この研究は「東京医科歯科大学とソニー株式会社の包括連携プログラム」の支援のもとで行われました。また、研究の統計解析については東京医科歯科大学臨床統計学分野と共同で行われました。一連の研究成果は、2020年と2021年にGastroenterology誌、2021年にThe Lancet Gastroenterology and Hepatology誌に掲載されました。将来的に潰瘍性大腸炎に対する内視鏡評価の方法を変えるツールとすべく、今後は実用化にむけて検討を進めます。
【研究の背景と目的】
潰瘍性大腸炎※1は慢性の炎症性腸疾患で、症状の寛解と増悪を繰り返し、日常生活の質に強く影響する病気です。近年の治療の進歩の結果、症状を抑えるだけでなく、病気の炎症そのものをコントロールすることが可能となりました。炎症のコントロールためには症状寛解だけでなく「粘膜治癒」を達成することが重要であり、下部消化管内視鏡※2を行い「内視鏡的な寛解」および「組織学的な寛解」を評価することが必須です。しかしその評価を行うには病気に対する知識や経験が必要であり、医師の主観に基づくため相違が生じる※3ことが問題でした。さらに「組織学的な寛解」評価のためには内視鏡検査で粘膜生検※2を採取する必要があり、採取に伴うコストや合併症が避けられません。
人工知能(AI)技術の進歩により、医療の領域でも様々なコンピューター支援機器の開発が進められています。本研究では深層学習というAI技術を用いることで、潰瘍性大腸炎の内視鏡画像に基づくコンピューター画像支援システム(DNUC)を開発し、その精度を前向き※4に検証することを目的としました。
【研究成果の概要】
以下の3つの研究を行いました。
①内視鏡動画に対するAIシステムの作成
2014年1月から2018年3月までに東京医科歯科大学病院にて潰瘍性大腸炎患者さんに施行した下部消化管内視鏡の画像と粘膜生検を見直し、AI学習に適切と思われるデータ(2012名、40758画像、6885粘膜生検)を収集しました。その後にすべてのデータに対してUCEISスコア※5とGeboesスコア※6を専門医により点数付けしました。本研究ではUCEISスコア0点を「内視鏡的な寛解」、Geboesスコア3.0以下を「組織学的な寛解」と定義しました。このデータセットを学習データとして用い、ソニー株式会社の協力を得てDNUCを開発しました。入力された画像をもとにDNUCはUCEISスコアと「内視鏡的な寛解」と「組織学的な寛解」を出力します。
開発したDNUCの精度は2018年4月から2019年4月までに東京医科歯科大学病院通院中の875名の患者さんを対象に前向きに検証し、DNUCの「内視鏡的な寛解」に対する精度は90.1%、「組織学的な寛解」に対する精度は92.9%でした。
②AIの患者予後予測能の評価
上記の研究の875名の患者さんを対象に、下部消化管内視鏡後の臨床経過(予後)を1年検討しました。するとDNUCが「内視鏡的な寛解」および「組織学的な寛解」と評価した患者さんでは、有意に「再燃」「ステロイド使用」「入院」「手術」の発生率が低いことが分かりました。また、DNUCの予後予測能をハザード比で算出すると、すべての予後について、潰瘍性大腸炎専門医と同等でした。
③DNUCの動画への適応
上記の研究で開発したAIシステムを内視鏡動画へ適応しました。動画からリアルタイムに適切な静止画を選択するアルゴリズムについては、同様にソニー株式会社の協力を得て開発しました。その結果、内視鏡装置とDNUCが搭載されたパソコンをつなぐことで、「リアルタイムな組織学的評価」と「一定の内視鏡スコア算出」が可能となりました。
2019年4月から2020年3月までに東京医科歯科大学病院と大学関連4病院にて、多施設前向き研究を行いこの精度を検証しました。「リアルタイムな組織学的評価」については、臨床的寛解の潰瘍性大腸炎患者さん180名を対象に、生検組織の病理結果とDNUCの結果を比較しました。DNUCは81.0%の生検組織について病理結果を予測可能で、その感度と特異度はそれぞれ97.9%と94.6%でした。「一定の内視鏡スコア算出」については、潰瘍性大腸炎患者さん590名を対象に、潰瘍性大腸炎専門医とDNUCがそれぞれ算出したUCEISスコアを比較しました。スコア算出に関して、専門家とDNUCの間の相関は0.927と非常に高い一致を示しました。
【研究成果の意義】
本研究の意義として2点考えています。
①AIにより潰瘍性大腸炎専門医と同等の一定の内視鏡評価が可能となりました。
DNUCは「内視鏡的な寛解」を高い精度で評価するだけでなく、内視鏡スコアの算出も潰瘍性大腸炎専門医と同様に行うことが可能でした。内視鏡評価は主観的であり医師間でも相違があるため、このシステムが示した精度は、潰瘍性大腸炎内視鏡評価に関する過去の論文結果と比較して十分に高い結果でした。DNUCは同じ動画からは常に同じ内視鏡評価を出力しますので、「いつでも」「どこでも」「だれでも」同様の内視鏡評価が可能となります。DNUCにより将来的には病気の重症度や治療効果を評価する基準となると我々は考えております。
②AIにより粘膜生検を採取しなくても組織学的評価が可能となりました。
DNUCは内視鏡動画からリアルタイムに組織学的評価を行うことが可能でした。組織評価のためには粘膜生検の採取が必要でしたが、DNUCを用いると内視鏡施行中に組織評価が可能となり、必要な粘膜生検の回数を減らすことができると考えており、生検に関連するコストとリスクを無くすことができます。
我々はDNUCが臨床現場で必要となることを強く確信し、臨床応用できることを目指しています。引き続き臨床現場での実現可能性について検討を進め、将来的には世界中で、潰瘍性大腸炎に対する内視鏡評価の方法や基準が変わる可能性を期待しています。
【用語解説】
※1 潰瘍性大腸炎は大腸の粘膜にびらんや潰瘍ができ、腹痛や血便を伴う下痢を起こす原因不明の病気です。症状が強い場合には、日常生活に著しい影響があり、入院や大腸全摘術が必要になることもあります。厚生労働省の難病対策における「指定難病」の一つであり、特定医療費受給者証所持者は2018年度で約12万人います。(資料は難病情報センターより)
※2 下部消化管内視鏡とは肛門から内視鏡を挿入し、主に大腸を評価するための内視鏡です。下部消化管内視鏡検査で大腸の粘膜の状態を評価することで潰瘍性大腸炎の診断や治療効果の判定ができます。また内視鏡の先端から器具を出し、大腸粘膜の生検を採取し、組織学的(顕微鏡的)な炎症や癌の評価をすることも可能です。内視鏡を行い粘膜生検を行った日から病理医の診断までは下記のような処理が必要であり、平均1週間程度必要です。
※3 人による評価は主観的であり医療現場では時に問題となります。評価をするによって評価が異なってしまうことを「評価者間差異」といい、同じ人でも異なる日で評価が異なってしまうことを「評価者内差異」といいます。本システムではAIは常に一定の結果を出力しますので、常に一定の客観的評価を行うことが可能です。
※4 前向き研究とは、研究の評価項目をあらかじめ決め、対象となる患者に研究の目的や方法を説明し同意のうえ、ある時点から将来に向かって研究を進めることを言います。反対の言葉として後向き研究があり、これは過去のデータや患者情報を用いて解析する研究方法です。
※5 UCEISスコアは潰瘍性大腸炎に対する内視鏡スコアで、治験や臨床研究でも用いられ、世界中でスタンダードとなっています。再軽症の0点から最重症の8点まで9段間のスコアです。
※6 Geboesスコアは潰瘍性大腸炎に対する生検組織スコアで、治験や臨床研究でも用いられ、世界中でスタンダードとなっています。再軽症の0点から最重症の5点までの段階があるスコアです。
Journal
The Lancet Gastroenterology & Hepatology
Article Title
Deep neural network for video colonoscopy of ulcerative colitis: a cross-sectional study
Article Publication Date
29-Nov-2021