人間の「注視する」能力は視覚の中でも重要な役割を果たしており、場面に応じた最も優先度の高い情報を選択して解釈することを可能にする。この「注視するプロセス」を高次に運用することで、読影医は医療画像から病変を効率的に検出している。英カーディフ大学の研究グループは、人間の注視機能を再現するAI研究を進めており、読影医を支援する画像解析システムの基礎技術としての発展を狙う。
Neuralcomputingから公表された同研究では、畳み込みニューラルネットワーク(CNN)の設計に「人間の視覚特性」を統合した、新しい顕著性予測モデルを構築している。研究チームはモデルトレーニングに際し、視線追跡ソフトウェアに基づく、人間の「関心領域」を割り当てた画像データベースを利用した。その結果、本AIモデルは「画像のどの部分において人間の注視が最も顕著になるか」を正確に予測できるようになり、既存の画像識別モデルを超えたパフォーマンスが示唆された。構築された顕著性予測モデルは実際、公開ベンチマークやコンペティションにおいて特に優れた結果を示しているとする。
著者でカーディフ大学のHantao Liu氏は「画像の中で人間がどこに注視しているかうまく予測できれば、ロボット工学における目標の自動検出から医療画像診断に至るまで、幅広い応用の可能性がある。このモデルが画像内の病変検出をどう支援していくか、放射線科医との協力で次の検証ステップへと進めたい」と述べた。
関連記事: