正しい査読を経ずに執筆者から論文掲載料を奪う、いわゆるハゲタカジャーナル(predatory journals) が増加している。執筆者が発表数をかさ増しする意図もあり、研究費から拠出される掲載料は執筆者の懐を傷めず、不誠実な共依存関係もその一部にはある。データが偽造・改ざんされた悪質な論文が混入するなど、科学界の信憑性・信頼性を損なっている。
Analytics India Magazineでは、AIによる論文評価をサポートする取り組みを紹介している。Machine Boxというツールは、Docker(PC上の仮想環境ソフトウェア)に機械学習機能を組み込み、自然言語処理で論文中の言い換え部位などを特定し盗作を検出する。また、米シラキュース大学のチームが実装したアルゴリズムは、膨大な論文内画像を掘り起こし、回転など加工された複製画像でも検出が可能という。
AIは査読プロセスの改善と自動化に重要な役割を果たすようになってきている。しかし、真の言語能力はヒトのプロフェッショナルを超えていない。MITが作成したソフトウェアSCIgenはデタラメの論文でも自動生成が可能として話題となったが、その混入を検出する労力は割に合わない面も確かにある。低質な論文を粗製乱造するハゲタカジャーナル問題は今後も続くだろう。