アリババ、大規模言語モデルをオープンソースで公開 中国テック大手では初

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

大企業注目記事

アリババ、大規模言語モデルをオープンソースで公開 中国テック大手では初

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

アリババグループのクラウドインテリジェンス事業を担う「アリババクラウド(阿里雲)」は8月3日、70億パラメーター(7B)の大規模言語モデル(LLM)「通義千問(Tongyi Qianwen)」をベースとした2つのAIモデル、ファウンデーション(基盤)モデルの「Qwen-7B」と対話型AI(人工知能)向けモデルの「Qwen-7B-Chat」のオープンソースコードを公開した。同社が運営する開発者向けのAIモデルコミュニティ「魔搭(ModelScope)」に無償で提供され、商用利用も可能だという。

Qwen-7Bは、中国語や英語など複数の言語に対応し、2兆トークン以上のデータセットでトレーニングされている。開発者は一般的なグラフィックカードでモデルを展開・実行することが可能となっている。

自社開発した大規模言語モデルをオープンソース化したのは、中国のテック大手では初となるという。海外では、米メタの「Llama2」が今年7月にオープンソース化された。中国国内では、百川智能(Baichuan Intelligent)の「Baichuan-7B」や、智譜AI(Zhipu AI)が清華大学と共同開発した「ChatGLM2-6B」など新興AI企業による大規模言語モデルがオープンソース化されており、無視できない存在となっている。

中国発の大規模言語モデル「Zhipu AI」、美団から資金調達 評価額は約700億円に

アリババクラウドは2つのAIモデルのオープンソースコードを公開すると同時に、複数のベンチマークによる評価も発表した。Qwen-7Bの事前学習モデルは、英語による推論能力などを評価するベンチマーク「MMLU」で、現在主流の7B、12Bおよび13Bのオープンソースモデルよりも高いスコアを獲得した。中国語による一般知識のベンチマーク「C-Eval」でも、7Bのオープンソースモデルでは最高の評価を得た。(36Kr Japan編集部)

「ChatGPTは5年後に使われなくなる」ーメタのチーフサイエンティストが批判 AIバブルには陰り

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録