【特集】活用広がる中国のバーチャルヒューマン、大規模言語モデルの登場でどう変わったのか

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ特集編集部お勧め記事注目記事

【特集】活用広がる中国のバーチャルヒューマン、大規模言語モデルの登場でどう変わったのか

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

2023年、大規模言語モデルによりバーチャルヒューマン業界に革命的な変化がもたらされた。バーチャルヒューマンは「メタバース・バブル」から抜け出して、新たに動き出した。

大規模言語モデルが登場するまで、バーチャルヒューマンは制作コストが高額で技術も成熟していなかったため、多くのスタートアップや大企業が資金難に直面し、実用化は容易ではなかった。しかし大規模言語モデルのおかげでコストが下がり、制作時間も短縮されただけでなく、コミュニケーション能力やリアリティが高まり、バーチャルヒューマンがさまざまな分野で広く実用化されるようになった。

「参入ハードルが劇的に下がった」

関係者によると、かつてバーチャルヒューマンの大部分は実際の人(中の人)の動きを元にして制作されていた。専門の俳優がデバイスを装着し、モーションキャプチャ技術を使って長時間にわたるデータ収集を経て、ようやく3Dモデルを完成させることができた。そのため、人件費が高く制作時間も長かった。現在は大規模言語モデルを活用することで、バーチャルヒューマンの制作コストは数十万元(数百~数千万円)から数千元(数万~数十万円)にまで下がり、制作時間も数カ月単位から最短で数時間にまで短縮された。中国で最も早い時期からAIによる音声認識を使い各種のサービスを提供してきた「硅基智能(Silicon Intelligence)」は「我が社のデジタルヒューマンは当初から価格を一律8000元(約16万円)とし、統一価格とサービスで市場シェアを拡大してきた」とする。

こうした変化のおかげで、バーチャルヒューマンがライブ配信、教育、金融など多くの分野で活躍する道が開けた。初めの頃は単なるイメージに過ぎなかったバーチャルヒューマンだが、次第にデジタル従業員やカスタマーサービスなど実用的な機能を備えたツールに姿を変え、効率化やコスト低減とともに、顧客に対してより多彩でリアルなサービスを提供するようになった。現在では、AIGC(AI生成コンテンツ)によってバーチャルヒューマンの制作効率がアップし、参入のハードルが下がった。さらに大規模言語モデルのおかげでバーチャルヒューマンがより多くの知識やスキルを深く学習できるようになり、認識できるコンテンツも画像や動画、音声などさまざまなスタイルに広がったことで、人と自然なコミュニケーションをとるための基礎が出来上がった。例えば、ライブ配信ルームやバーチャルヒューマンとの対話が可能なデバイスでは、ユーザーがテキストを使ったリアルタイムの交流や対話ができ、商品紹介や問題の解決に役立てることができる。江蘇省南京市で軽食チェーン店を展開する企業は硅基智能のAIデジタルヒューマンを使ってライブコマースを14日間、時間にして289時間実施したところ、7424件の取引が成立し、取引総額は7万7918.38元(約160万円)になった。

バーチャルヒューマンの技術は2次元と3次元とで異なる進化をたどっている。2次元のバーチャルヒューマンは制作コストが低く、実用化が簡単なため、手軽な商用化に適している。一方、より人に近い3次元のバーチャルヒューマンは技術が複雑で、コストも高くなりがちだが、より質の高いインタラクティブ体験が可能になる。3次元バーチャルヒューマンは大規模言語モデルの進歩に伴いデータ収集や生成技術が徐々に進化しつつあり、2次元バーチャルヒューマンはライブコマースなどの分野で大きく貢献している。

ビジネスモデルの変容と多様化

バーチャルヒューマンを使ったビジネスモデルも2023年に多様化し始める。

一つ目はメタバースの時代に主流だったIP(キャラクター)型で、主にアイドル、娯楽、教育などの分野で利用された。そこからバーチャルアイドル、デジタル宇宙飛行士、ブランドアンバサダーといった役割が派生し、IP戦略により柳夜煕や洛天依などのキャラクターが誕生した。

資生堂、中国のバーチャルヒューマン4人をアンバサダーに起用 消費のけん引役Z世代に訴求

二つ目は機能型バーチャルヒューマンで、サービス型バーチャルヒューマンとも呼ばれる。代表例はデジタル従業員で、バーチャル司会者やカスタマーサービスなど、金融、旅行、小売、ライブコマースなどの分野で、人が行う仕事のサポート役として、コストを抑え、自動化、規格化、スマート化されたサービスを提供する。

バーチャルヒューマン「AYAYI」がアリババの社員に。メタバースが切り開く新たな可能性

そして三つ目は、現在広がりつつあるアバターだ。ゲーム内でプレイヤーの分身になったり、バーチャルコンサートで観客になったりと、多くのゲームやVR、メタバースの中で活用される。バーチャル空間と現実空間をつなぐ役割を担い、最終的にはバーチャルコンテンツの制作を後押しすることになる。

こうしたビジネスモデルはバーチャルヒューマン業界に新たな成長分野をもたらしただけでなく、従来型の業界にデジタルトランスフォーメーションという新たな道を示した。例えば、中国ゲーム大手・網易(ネットイース)傘下のオンライン教育サービス「網易有道(NetEase Youdao)」は、バーチャルヒューマンと教育を組み合わせたAI会話教師を発表した。より実際的な練習環境を整えたオープンな会話スペースを提供し、会話が終了するとすぐさま結果がフィードバックされる。また、音声認識技術大手の科大訊飛(アイフライテック)の大規模言語モデル「訊飛星火(iFLYTEK Spark)」は中国語と英語の作文を添削したり、実際に教師を相手にしているような会話のシーンを提供したりする。

バーチャルヒューマンと行政を組み合わせた例としては、福建省厦門市や広東省深圳市、江西省などが続々とバーチャル従業員を導入している。業務内容には、多言語による政策解説、チャットで手続きをガイドするデジタル行政サービスなどがあり、バーチャルヒューマンを使って必要な行政サービスを案内して、問い合わせや相談といった業務を提供する。

一部の開発企業では、デジタルヒューマンと越境ECを組み合わせたサービスの試みを進めている。硅基智能は「海外の多言語に対応した動画やライブコマースはハードルが高いため、翻訳用ミニプログラムと翻訳AI『Anylang.ai』を開発した。リアルタイムの翻訳機能とデジタルヒューマンを使い、越境EC企業の海外進出に向けたワンストップサービスを提供したい」と語る。

AI顔交換で中国発ショートドラマを海外向けにリメイク。制作コスト削減で世界展開を加速

今年、大規模言語モデルがさらに発展すれば、バーチャルヒューマンの技術も飛躍的な進歩をとげ、多くの業界にさまざまなデジタル化のチャンスをもたらすことが期待される。

*2024年2月9日のレート(1元=約21円)で計算しています。

作者:自象限(WeChat公式ID:zixiangxian)、編集・翻訳:36Kr Japan編集部

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録