アリババ、大規模言語モデルをオープンソースで公開　中国テック大手では初

2023年8月16日01754

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

アリババグループのクラウドインテリジェンス事業を担う「アリババクラウド（阿里雲）」は8月3日、70億パラメーター（7B）の大規模言語モデル（LLM）「通義千問（Tongyi Qianwen）」をベースとした2つのAIモデル、ファウンデーション（基盤）モデルの「Qwen-7B」と対話型AI（人工知能）向けモデルの「Qwen-7B-Chat」のオープンソースコードを公開した。同社が運営する開発者向けのAIモデルコミュニティ「魔搭（ModelScope）」に無償で提供され、商用利用も可能だという。

Qwen-7Bは、中国語や英語など複数の言語に対応し、2兆トークン以上のデータセットでトレーニングされている。開発者は一般的なグラフィックカードでモデルを展開・実行することが可能となっている。

自社開発した大規模言語モデルをオープンソース化したのは、中国のテック大手では初となるという。海外では、米メタの「Llama2」が今年7月にオープンソース化された。中国国内では、百川智能（Baichuan Intelligent）の「Baichuan-7B」や、智譜AI（Zhipu AI）が清華大学と共同開発した「ChatGLM2-6B」など新興AI企業による大規模言語モデルがオープンソース化されており、無視できない存在となっている。

中国発の大規模言語モデル「Zhipu AI」、美団から資金調達　評価額は約700億円に

アリババクラウドは2つのAIモデルのオープンソースコードを公開すると同時に、複数のベンチマークによる評価も発表した。Qwen-7Bの事前学習モデルは、英語による推論能力などを評価するベンチマーク「MMLU」で、現在主流の7B、12Bおよび13Bのオープンソースモデルよりも高いスコアを獲得した。中国語による一般知識のベンチマーク「C-Eval」でも、7Bのオープンソースモデルでは最高の評価を得た。（36Kr Japan編集部）