セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
アリババグループのクラウドインテリジェンス事業を担う「アリババクラウド(阿里雲)」は8月3日、70億パラメーター(7B)の大規模言語モデル(LLM)「通義千問(Tongyi Qianwen)」をベースとした2つのAIモデル、ファウンデーション(基盤)モデルの「Qwen-7B」と対話型AI(人工知能)向けモデルの「Qwen-7B-Chat」のオープンソースコードを公開した。同社が運営する開発者向けのAIモデルコミュニティ「魔搭(ModelScope)」に無償で提供され、商用利用も可能だという。
Qwen-7Bは、中国語や英語など複数の言語に対応し、2兆トークン以上のデータセットでトレーニングされている。開発者は一般的なグラフィックカードでモデルを展開・実行することが可能となっている。
自社開発した大規模言語モデルをオープンソース化したのは、中国のテック大手では初となるという。海外では、米メタの「Llama2」が今年7月にオープンソース化された。中国国内では、百川智能(Baichuan Intelligent)の「Baichuan-7B」や、智譜AI(Zhipu AI)が清華大学と共同開発した「ChatGLM2-6B」など新興AI企業による大規模言語モデルがオープンソース化されており、無視できない存在となっている。
アリババクラウドは2つのAIモデルのオープンソースコードを公開すると同時に、複数のベンチマークによる評価も発表した。Qwen-7Bの事前学習モデルは、英語による推論能力などを評価するベンチマーク「MMLU」で、現在主流の7B、12Bおよび13Bのオープンソースモデルよりも高いスコアを獲得した。中国語による一般知識のベンチマーク「C-Eval」でも、7Bのオープンソースモデルでは最高の評価を得た。(36Kr Japan編集部)
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録