大規模言語モデルとインフォデミックリスク

過去5年間、LLMの指数関数的な成長が観察され、多様なタスクの実行が可能となっている。しかし、2017年以前は、ほとんどの自然言語モデルが1つの特定タスクのために訓練されていた。この限界は、Transformerとして知られる「自己注意ネットワークアーキテクチャ」の開発によって克服された。2018年、このコンセプトは2つの革命的なモデル、すなわち「Generative Pretrained Transformer(GPT)」と「Bidirectional Encoder Representations from Transformers(BERT)」の開発につながる。

GPTとBERTの汎化能力を実現するため、教師ありの微調整と教師なしの事前学習の組み合わせが用いられた。このアプローチにより、事前に訓練された言語表現を下流タスクの実行に適用することが可能となった。GPTモデルは急速に進化し、多くのバージョンが発表された。改良バージョンは、大規模なテキストデータとパラメータを含んでおり、例えばGPTの第3バージョン(GPT-3)は、GPT-2の100倍の大きさであり、1750億のパラメータを含んでいる。GPT-3は、幅広い領域をカバーするテキストを生成することができるが、真実ではないものを含め、偏ったテキストを提供することが頻繁に観察される。これは、GPT-3を含む多くのLLMが、インターネット上で入手可能なデータに基づいて次のテキスト要素を予測するように設計されているため、偏りや誤りを再現してしまうことに起因する。人間の価値観や倫理観に沿ったLLMを設計することが大きな課題となっていた。

この問題に対処するため、OpenAIは、人間のフィードバックに基づく強化学習(RLHF)を用いて学習させた13億のパラメータを組み込んだChatGPTを開発した。2021年段階のChatGPTでは、事実確認ができないために誤った文章が高頻度に生成されていたが、GPT-4(総パラメータ数は非公開)をChatGPTに統合することで有意な改善が確認されている。最新のChatGPTは比較的信頼性の高いデータを生成しているが、特に医学研究への応用においては、このツールのあらゆる限界を考慮する必要があることには変わりない。

ChatGPTは、研究者が科学論文を作成するための現実的な実務に活用することができる。研究論文のタイトル提案、原稿執筆、複雑な科学的概念をシンプルで文法的に正しい英語で表現する、などだ。科学界におけるChatGPTへの関心の高さは、このツールに関する研究論文の数が急速に増加している事実からもうかがい知ることができる。一方、2023年の機械学習国際会議(ICML)では、投稿原稿にLLMを使用することを禁止した。しかし、このルールへの遵守を検証するツールは存在しない。Springer Natureでは、LLMを著者として記載することは許さず、その使用は方法または謝辞のセクションで言及しなければならないとする。これらの新しいガイドラインは、Elsevierでも同様に実施されている。

潜在的なバイアスを含むAIによるインフォデミックの発生は、将来的に公衆衛生上の重大な脅威となることが予測されており(参照論文)、予防や治療戦略における医療上の重要な意思決定に大きな影響を与える可能性があるため、冷静で注意深い技術利用姿勢と適切な規制構築、研究開発コミュニティの強い倫理観、が求められている。

関連記事:

  1. ChatGPT – 放射線科専門医試験で合格基準に到達
  2. ChatGPTの医学的エビデンス要約能力
  3. ChatGPTの回答が患者により好まれる可能性
TOKYO analytica
TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。 The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。 1. 岡本 将輝 信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員教授など。専門はメディカルデータサイエンス。 2. 杉野 智啓 防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事