アリババ、大規模言語モデル「通義千問2.0」を発表 業界別モデル8種類も

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

EXCITEのRSSに登録大企業注目記事

アリババ、大規模言語モデル「通義千問2.0」を発表 業界別モデル8種類も

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

アリババグループ傘下のアリババクラウド・インテリジェンスは10月31日、アリババの年次テクノロジーイベント「Apsara Conference」で、最新の大規模言語モデル(LLM)「通義千問(Tongyi Qianwen)2.0」と新しい業界別モデルを発表した。

通義千問2.0は、数千億のパラメータを持つ汎用大規模言語モデルで、前モデルより大幅にアップグレードしたという。また、言語理解、算術問題解決、質疑応答などの領域において、主要な大規模言語モデルベンチマークを成功裏に上回っている。さらに、拡張したモデルサイズと改良アライメント技術により、複雑な指示の理解、コピーライティング、推論、記憶保持、幻覚の防止において高い能力を示している。

MMLU(マルチタスク言語理解)、C-Eval(中国語モデル評価)、GSM8K(算数問題解決)、HumanEval(多言語コード生成能力)などのベンチマークにおいて、通義千問2.0は、最先端モデルを含む既存の大規模言語モデルを上回る。

新しい業界別モデルでは、エンタメ、金融や法律などの業界に特化したモデル「通義霊碼」「通義智文」「通義聴悟」「通義星塵」「通義点金」「通義暁蜜」「通義仁心」「通義法睿」の8種類がある。それぞれ、AIアシスタント、コンピューターコードの生成や金融データの分析などを提供する。

アリババグループの蔡崇信(ジョセフ・ツァイ)会長によると、中国のテクノロジー企業の80%と大規模モデル開発企業の約半数が、アリババクラウドを利用しているという。同社はAI時代に最もオープンなクラウドを目指しており、誰もが簡単で手頃にAIを開発し利用できるようになり、特に中小企業がAIを活用して高い生産性を実現できるよう支援したいと考えていると伝えた。

アリババクラウド、最強の大規模言語モデル「Qwen-14B」をオープンソース化 無償で商用利用可能に

(36Kr Japan編集部)

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録