訓練コストは4400万円⋯中国DeepSeek「R1」モデル、Nature論文で透明性を示す

2025年9月24日0693

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO（コネクト）」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

中国の人工知能（AI）スタートアップ「DeepSeek」の大規模言語モデル（LLM）「DeepSeek R1」に関する査読論文が9月17日、英科学誌「Nature」に掲載された。タイトルは「DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning」。共同執筆者にはDeepSeekの創業者である梁文鋒氏も加わっている。

査読論文では、強化学習（RL）を用いてAIの推論能力を高める仕組みとして、AIが正しい回答をすると報酬を与えて自律的な学習を促し、人間が推論過程を教えるプロセスを減らして訓練コストを削減する手法を公開した。補足資料には、DeepSeek R1の訓練コストがわずか29万4000ドル（約4400万円）だったことも示された。

DeepSeekが1月にインターネットで発表した査読前論文は、第三者の専門家から安全性テストの不十分さや訓練プロセスの不透明さが指摘されていた。今回はこれらの課題を解決し、査読論文として発表した。Nature編集部は、DeepSeek R1は厳しい査読を通過した世界初の主要LLMだとし、AI開発の透明性に向けて大きな一歩を踏み出したと評価した。