arXivがLLM生成論文の投稿規制強化無審査の引用捏造などで掲載禁止に

この記事の要約

arXivがLLM生成論文の投稿規制強化の動きは、基盤モデル競争が性能比較だけでなく配布網や企業導入の争いになったことを示す。

モデルの価値は、API、クラウド、開発ツール、業務データと結びつくほど大きくなりやすい。

読者はベンチマークの優劣だけでなく、どの企業基盤に組み込まれるかを見る必要がある。

学術論文のプレプリントサーバーを運営するarXivは、大規模言語モデル（LLM）によって生成された低品質な論文、いわゆる「AI slop」への対策を強化する。論文内にLLMによる幻覚引用や、生成時に混入したメタコメントなど「著者が明らかにLLMの出力結果を検証していない圧倒的証拠」が確認された場合、当該研究者の投稿を禁止する方針を打ち出した。研究者コミュニティにおける生成AIの悪用が学術出版の信頼性を揺るがしかねないとの危機感が背景にある。

摘発対象はLLM由来の明白な痕跡

arXivが新たに定める禁止措置の対象となるのは、論文内に残された生成AI特有の痕跡だ。具体的には実在しない論文を参照する幻覚引用や「ここに具体例を挿入」といったLLMが出力するメタコメント、文脈と無関係に挿入されたテキスト断片などが該当する。運営側はこれらの証拠を「著者がLLMの生成結果を一切確認せず、そのまま投稿した圧倒的証拠」と位置づける。

arXivは生成AIそのものの利用を全面的に禁じるのではなく、研究者が出力内容を検証し、学術的責任を果たすことを求めている。同サイトは世界中の研究者が査読前に成果を公開する場として機能しており、月間の投稿数は約2万本に上る。投稿数の急増に伴い、内容の質をどう担保するかが運営上の長年の課題だったが、2023年以降の生成AI普及が事態をさらに複雑化させている。

学術出版界に広がるAIスロップの実態

AIスロップとは、生成AIが大量生産する低品質なコンテンツ全般を指す蔑称だ。学術分野では、研究実績を水増ししようとする一部の研究者がLLMを使って短時間で論文を生成し、arXivのような査読前プラットフォームに投稿する事例が急増している。米国の調査会社によると、2024年にarXivへ投稿された論文のうち少なくとも数千本規模で生成AIの未検証利用が疑われるという。

深刻なのは、AIが生成した研究が一見すると学術的な体裁を整えている点だ。専門知識を持つ研究者でも注意深く読まなければ違和感を見抜けないケースが増えている。しかし参考文献リストに実在しない論文が並んでいたり、分野の基本概念を誤って説明していたりと、後続の研究者が引用した際に誤情報が拡散するリスクが高まっている。ある学術出版社の調査では、生成AIの普及以降に撤回された論文の約3割に何らかのAI生成コンテンツが含まれていたとの報告もある。

日本の研究者コミュニティと企業への余波

この規制強化は日本の研究機関や企業の研究部門にも影響を及ぼす。日本の主要大学や国立研究開発法人では、arXivへのプレプリント投稿が研究成果の迅速な公開手段として定着しているからだ。理化学研究所や産業技術総合研究所の研究者も、国際共同研究の成果をarXiv経由で発信するケースが多い。

特に影響が大きいのが、AI関連企業の研究開発部門である。Preferred NetworksやサイバーエージェントのAI事業子会社など、日本のAI研究企業の多くはarXivで研究成果を積極的に公開してきた。これらの企業は国際的な人材獲得競争の中で、arXivでのプレゼンスを技術力の証明として活用している。新規制はAIスロップの排除を目的とするが、日本語を母語とする研究者が英語論文をLLMで校正する際にメタコメントが混入するリスクも指摘されており、投稿前の確認プロセス見直しが急務となる。

研究者が直面する実務上の変更点

arXivの投稿禁止措置は、問題のある論文一本で即座に適用されるわけではない。運営チームはまず該当論文の著者に警告を発し、修正や説明を求める段階を経る。しかし明白な悪質性が認められた場合や、繰り返し違反が確認された場合には投稿アカウントの停止措置に踏み切る。この段階的対応は、生成AIを研究の補助ツールとして適切に利用する大多数の研究者に配慮した設計だ。

研究者が注意すべきなのは、共著者がLLMを使用した場合も連帯責任が生じる点である。最終投稿者は全ての共著者の作業内容を把握し、生成AI利用の有無とその検証状況を確認する義務を負う。またarXivは既存の投稿ガイドラインで生成AI利用の開示を推奨してきたが、今回の措置は開示の有無よりも「検証したか否か」という実質的な行為に焦点を当てている点が特徴的だ。

規制の実効性と今後の学術出版モデル

arXivによる規制強化は、プラットフォーム単独でAIスロップを根絶できる性質のものではない。悪質な投稿者は別のプレプリントサーバーへ移行する可能性が高く、業界全体での対応が不可欠となる。実際にPubMed CentralやSSRNといった他の主要リポジトリも、同様のガイドライン整備を進めている段階だ。

長期的には、プレプリントの信頼性を担保する新たな仕組みづくりが加速するとみられる。MITの研究者グループは、投稿論文の参考文献を自動検証するツールを開発中であり、CrossRefやOpenAIREといった学術情報基盤との連携も視野に入る。arXivの今回の措置は、生成AI時代における学術出版の質的管理をめぐる国際的な試行錯誤の一端であり、学術コミュニティ全体が研究の完全性をいかに維持するかという根本的な問いを投げかけている。