「Llama 3-V」開発のスタンフォード大チーム、中国のマルチモーダルモデル盗用で謝罪

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

「Llama 3-V」開発のスタンフォード大チーム、中国のマルチモーダルモデル盗用で謝罪

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

5月末、スタンフォード大学のチームが開発したマルチモーダルモデル「Llama 3-V」がオープンソースコミュニティーの話題をさらった。トレーニングにかかった費用はわずか500ドル(約8万円)、モデルサイズは米OpenAIのマルチモーダルモデル「GPT-4v」の100分の1と非常にコンパクトながら、GPT-4vなどに匹敵する性能を誇るという。

最先端の性能と名門大学のネームバリューで、Llama 3-Vは一躍スポットライトを浴び、オープンソースプラットフォーム「Hagging Face」のトレンドランキングでトップ5にランクインするほど注目を集めた。

開発者コミュニティーが熱狂に包まれるなか、Llama 3-Vの構造とコードが、清華大学とAIスタートアップ企業「面壁智能(ModelBest)」が共同開発したマルチモーダルモデル「MiniCPM-Llama3-V 2.5」と酷似していることに一部のユーザーが気付き、にわかに盗用疑惑が持ち上がった。

清華大発のLLM開発ベンチャー、ファーウェイ傘下の投資会社から資金調達 高度なAIエージェントに注力

面壁智能のチーフサイエンティスト劉知遠氏はこれに対し、中国のQ&Aサイト「知乎(zhihu)」で「Llama 3-Vは我々が開発したMiniCPM-Llama3-V 2.5の盗用でほぼ間違いない」とコメント。MiniCPM-Llama3-V 2.5も米Meta社のオープンソース大規模言語モデル「Llama 3」をベースに開発されたことを認めつつ、オープンソースの活用が他の開発者に対する信頼や敬意の上に成り立っているにも関わらず、Llama 3-Vチームの行為はこれをひどく踏みにじるものだと語った。

数々の証拠が明るみに出た後、Llama 3-Vの開発チームはまずコメントとライブラリを削除するという形で対応した。しかし批判は収まることなく、ついに6月3日(現地時間)に開発者のAksh Garg氏とSiddharth Sharma氏がSNS上で、MiniCPMの原作者に向けて公式に謝罪し、Llama 3-Vの撤回を表明した。

これを受けて、スタンフォード人工知能研究所の主任Christopher David Manning氏が、SNS上で今回の盗用を厳しく非難したほか、Google傘下のAI企業DeepMindの研究者LucasBeyer氏はSNSの投稿で次のように語っている。「興味深いのは、これほどの性能を誇るMiniCPM-Llama3-V 2.5に対し、私を含めほとんどの人が注意を向けていなかったことだ。開発者が米国の名門大学ではなく、中国の研究室だったことが理由かもしれない」

*1ドル=156円で計算しています。

(翻訳・畠中裕子)

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録