【動画】まるで人間? EQ高い対話型AI「アーチ―」、アリババ出身起業家が開発

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

【動画】まるで人間? EQ高い対話型AI「アーチ―」、アリババ出身起業家が開発

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

2024年9月に上海市で開催されたテックイベント「外灘大会」で、ひときわ注目を集め、身動きできないほどの人だかりができていたのが「阿奇(アーチー)」というコンパニオンロボットの展示場所だった。

アーチーは、これまでの常識を覆すような人工知能(AI)搭載ロボットに仕上がっている。EQ(心の知能指数)が高く、人を相手にしているかのような機敏でスムーズなコミュニケーションを楽しめる。これを可能にしたのが、音声・ビデオのマルチモーダル機能を持つAIモデル「ArkModel 2.0」だ。

使用感で言えば、ArkModelは米OpenAIの最新マルチモーダルAIモデル「GPT-4o」と遜色ない超低遅延のリアルタイム対話を実現している。しかも、3Dアバターを動かしたりロボットを操作したりできるなど、GPT-4oにはない斬新な機能も搭載されている。

このArkModelを開発したのは、2023年6月に設立された「無界方舟知能技術(AutoArk)」(以下、無界方舟)だ。創業者の曽暁東CEOは自然言語処理分野のエキスパートであり、アリババグループで初代機械翻訳システムのコアアルゴリズムを担当した。2017年にはMITテクノロジーレビューの「Innovators Under 35(35歳未満のイノベーター)」に選出されている。

ArkModel 2.0はエンドツーエンド方式のマルチモーダルAIモデルで、テキストや音声、画像データを同時に処理し、種類の異なるデータ間のタスクも実行できる。複数のマルチモーダルモデルの評価テストでは、GPT-4oなど著名なAIモデルを上回る結果をたたき出した。

ArkModelを搭載したコンパニオンロボット「アーチー」を実際に使ってみて、特に優れていると感じた点をいくつか紹介したい。まず、反応速度300ミリ秒という超低遅延を実現したこと。しかも音声だけでなく、映像も含めたやり取りもこのスピードでできる実力は、中国市場では敵なしだ。また、音声や映像を含むマルチモーダルなやり取りが可能なだけでなく、アーチーの話を遮って与えた指示にも問題なく対応できる。さらに、「AIっぽさ」をなくした自然で感情豊かな対話が可能で、中国語の標準語や広東語以外にも、日本語やポルトガル語、アラビア語など21言語に対応している。加えて、アバターを動かしたり、ロボット機器の動作を制御したりする機能もある。

曽CEOは外灘大会で、ユーザーのニーズを深く理解できるAIエージェントが普及すれば、スマートスピーカーや、会話できるフィギュア、子どもと遊ぶロボット犬、車載コンパニオンロボットといった形でAIが人々の生活に溶け込むようになるとの展望を示した。これこそが無界方舟の目指す未来であり、その実現に向けて他社との協業も積極的に進めているという。実際の活用シーンは教育分野や車載機器、スマート玩具、エンボディドAI、観光・デモンストレーションなどを想定し、児童や学生、オフィスワーカー、シニア世代など、特定のユーザーグループに合わせたソリューションを打ち出していくという。

(翻訳・畠中裕子)

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録