中国の大規模言語モデル、政府が一般公開を承認 第1弾はバイドゥやアリババなど11社の激戦

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

大企業スタートアップ編集部お勧め記事注目記事

中国の大規模言語モデル、政府が一般公開を承認 第1弾はバイドゥやアリババなど11社の激戦

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

大規模言語モデル(LLM)をベースとしたプロダクトが8月31日、中国で初めて政府から一般公開の承認を得た。

生成AIや大規模言語モデルが一大ブームとなった今年、データセキュリティや法律、倫理問題なども盛んに取り上げられるようになった。8月15日、中国国家インターネット情報弁公室(CAC)など7機関が公布した「生成AIサービスの暫定的管理方法」が施行された。同規定によると、生成AI関連のプロダクトはサービス提供を開始する前に関連する国家機関に申請のうえセキュリティ審査を受けること、アルゴリズムの登録手続きをすることなどを義務付けている。

中国の大規模言語モデル関連プロダクトは、一連の登録・承認を済ませるまではごく限定的な範囲の内部テストしか実施できない。この場合、テスト参加資格を取得したユーザー、もしくは法人ユーザーに限定されることになる。

規定の施行後、政府の承認を得た初のプロダクトがこのほど出揃った。バイドゥ(百度)の「文心一言(ERNIE Bot)」をはじめ、智譜AI(Zhipu AI)、センスタイム(商湯科技)、百川智能(Baichuan Intelligent Technology)、MiniMax、抖音集団(Douyin Group)、中国科学院自動化研究所(CASIA)、上海人工智能実験室(Shanghai Artificial Intelligence Laboratory)、360、iFLYTEK(科大訊飛)、アリババクラウド(阿里雲)の開発した11プロダクトだ。開発元は大手テック企業やユニコーン企業、学術機関やスタートアップなどさまざま。ファーウェイやテンセントの大規模言語モデルも一般公開の準備に入っているとメディアが報じているが、公式なコメントは発表されていない。

現段階で一般ユーザーを対象に公開あるいはテストが実施されているのは以下の7プロダクトだ。

1.バイドゥ——文心一言(ERNIE Bot)
バイドゥの「文心一言」は中国初、また世界的大手テック企業としても初めての生成AIで、2023年3月16日に招待制でテスト利用を開始した。このベースとなる基盤モデル「文心(ERNIE)」は2019年に中国国内で発表され、最新の「文心バージョン3.5」は、国内外の権威ある十数種類ものベンチマークテストでトップレベルのスコアを達成している。

URL:https://yiyan.baidu.com

2.智譜AI——GLM
2019年に設立された智譜AIは中国で最初期に大規模言語モデルの開発に着手した企業で、清華大学コンピューターサイエンス・テクノロジー学科知識工学実験室(Knowledge Engineering Group)から誕生した。

すでにパラメーター数1000億クラスの2カ国語学習済みモデル「GLM-130B」を発表しており、中国語・英語の会話に対応する大規模言語モデル「ChatGLM」、「CodeGeeX」や「CogView」などのプロダクトを集約した基盤モデルのプラットフォーム「Bigmodel.ai」をリリースしている。

智譜AIは今年、ChatGLMをベースとした一般ユーザー向けの対話型AI「智譜清言」をリリースした。法人向けプロダクトは国内で複数の大手IT企業や政府機関などと提携している。

URL:https://chatglm.cn/

3.センスタイム——日日新SenseNova
センスタイムは今年4月に基盤モデル「日日新SenseNova」を発表した。自然言語、コンテンツ生成、自動アノテーション、カスタムモデルのトレーニングなどの機能を持ち、対話型AI「商量SenseChat」、画像生成ツール「秒画SenseMirage」、デジタルヒューマン生成ツール「如影SenseAvatar」、3Dコンテンツ生成ツール「瓊宇SenseSpace」および「格物SenseThings」など、優れた性能を持ちながら使いやすいコンテンツ生成プロダクトをリリースしている。最新の「商量SenseChat バージョン2.0」もすでに発表しており、現段階で金融・医療・自動車・不動産・エネルギー・メディア・製造業などの業種の500社以上と提携関係を結んでいる。

URL:https://chat.sensetime.com

4.百川智能——百川(Baichuan)
百川智能は2023年4月に検索エンジン「搜狗(Sogou)」の元CEO・王小川氏が設立した。6月15日にパラメーター数70億の中国語・英語対応大規模言語モデル「Baichuan-7B」を発表し、そのわずか1カ月後にはパラメーター数130億の汎用大規模言語モデル「Baichuan-13B-Base」、対話型AI「Baichuan-13B-Chat」およびそのINT4とINT8の量子化バーションをリリースした。また、次世代大規模言語モデル「Baichuan-53B」の発表も表明したばかりだ。

URL:www.baichuan-ai.com

5.MiniMax——ABAB
Minimaxはセンスタイムの元バイスプレジデントで汎用AI技術開発を統括してきた閆俊傑氏が2021年に設立した。テキストから音声・画像・テキストの3つのモダリティに対応してコンテンツを生成できる基盤モデルを構築しており、独自の汎用大規模言語モデル「ABAB」、バーチャルチャットソフト「Glow」、対話型AI「Inspo」などをリリースしている。

Minimaxは大規模言語モデルを手がける中国のスタートアップ企業としては最高クラスの評価額を誇る。ロイターの今年6月の報道によると、MiniMaxは新たに2億5000万ドル(約370億円)以上を調達し、企業評価額は12億ドル(約1800億円)を超えたという。

URL:https://api.minimax.chat/

6.抖音集団-雲雀(Skylark)
バイトダンス系の抖音集団は8月17日、対話型AI「豆包(Doubao)」のオープンテストを実施することを発表した。豆包は同社の大規模言語モデル「雲雀」をベースに開発されたもので、チャットボットや執筆アシスタント、英語学習アシスタントなどの機能を提供するという。現在、携帯電話番号か抖音アカウント、AppleIDからのログインでWebブラウザ版、iOS版、Android版が利用できる。

URL:https://www.doubao.com

7.iFLYTEK-訊飛星火(iFLYTEK SPARK)
音声AI開発に注力し、同分野で世界をリードしてきたiFLYTEKがリリースした次世代型大規模言語モデルはさまざまな分野の知識と言語理解力を備え、自然な会話を理解してタスクを実行できる。同社は2022年12月から大規模言語モデル関連の開発を本格化し、音声分野に特化した企業として、より完璧に近いプロダクトを目指してきた。23年5月に発表した「訊飛星火」は、生成AIとして教育現場やオフィスシーンなどで優れたパフォーマンスを見せ、8月に早くもバージョン2.0へアップグレードしている。

URL:https://xinghuo.xfyun.cn

その他、オープンテストを実施中のもので利用申請や招待コードが必要なものは以下だ。

中国科学院「紫東太初2.0(ZIDONGTAICHU 2.0)」https://taichu-web.wair.ac.cn
アリババクラウド「通義千問(Tongyi Qianwen)」https://qianwen.aliyun.com
360「360智脳」https://ai.360.cn
ファーウェイ「盤古(Pangu)」https://pangu.huaweicloud.com

オープンテスト前のものは:
上海人工知能実験室「書生(Intern)」https://intern-ai.org.cn

(翻訳・山下にか)

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録