36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
近年、急成長を遂げているAIモデルが特定の分野で人に匹敵する性能を実現しており、エンボディドAI(身体性を有するAI)の進化を後押ししている。ただ、エンボディドAIが特定の産業シーンで十分に活躍するためには、その業界に特化した「頭脳」を獲得する必要がある。中国のハルビン工業大学深圳校から生まれた「若愚科技(Ruoyu Technolog)」はまさに、ロボットの頭脳となるAIモデルを開発している。
若愚科技は2023年に設立され、今年3月にはエンジェルラウンドで5000万元(約11億円)を調達した。少し前には、ロボットの頭脳として機能するマルチモーダルのAIモデル「若愚・九天」を発表。この技術は、複数のロボットが協働して調理を担当する無人厨房でその性能が実証された。
言葉でロボットを操作して、注文から配膳までの全プロセスを完了させられる。「炒め物を作る」という複数のステップからなる作業手順を自律的に計画して実行することができる。若愚・九天は既存のエンボディドAIなどとは異なり、人間の意図を理解できるほか、ロボットとの対話や複雑なタスク実施計画などの機能を備えている。
例えば、「レタス炒めをください」と注文すると、ロボットはその言葉の意図を理解し、「食材保管エリアから材料を持ってくる」「準備エリアで重さを量る」「調理エリアで炒める」「客席に配膳する」など複数のステップに分解して作業計画を立てる。
さらに若愚・九天には、学習済みの内容をベースに新たな内容を類推し、応用する能力が備わっている。ある料理にニンニクを加えるケースのみを学習させている場合でも、利用者が「唐辛子を入れてください」と指示すると、ロボットは唐辛子がニンニクと同じ香味野菜だと理解し、ニンニクを加える手順でニンニクの代わりに唐辛子を入れるという判断を下す。
このAIモデルが画期的と言えるのは、マルチモーダルモデルの働きにより「群知能」を持たせ、複数のロボットが集団の中でそれぞれが協調的な振る舞いをできるようにしたことだろう。ロボットアームやAGV(無人搬送車)を含むいくつものロボットを、AIモデルの若愚・九天が一括してコントロールする。1つの頭脳で複数の体を動かすことができるのだ。
若愚科技の鄧煜平・最高製品責任者(CPO)は、複数のロボットが協働して高度なタスクを実行する際、それぞれのタスクでロボット同士が複雑に関わり合うと説明する。例えば、ロボット2台が炒め物を作り、別のロボットが食器を準備するという作業中に、調理の工程が変更されて炒め時間が延びた場合、食器を準備し終わったロボットは何もせず待機するのではなく、自律的に次に必要な食材を取りに行くという判断をする。こうして全体の作業効率を大きく高めることが可能になる。
ロボットが考えて決定する「大脳」の働きだけでなく、ロボットの動きを制御する「小脳」の機能も改良が進められた。「容器を傾けてニンニクを鍋に入れる」「ヘラを使って出来上がった料理を鍋から取り出す」などの複雑なタスクを実行できるよう、拡散モデルによる模倣学習を施し、複雑な動作も正確にこなせるようになった。
現在、エンボディドAIの頭脳として発表されているものには、Googleの視覚言語モデル「PaLM-E」、Google傘下のDeepMindによる視覚言語行動モデル「RT-1」「RT-2」「RT-X」などがある。
若愚科技の共同創業者で最高執行責任者(COO)の孫騰博士は、若愚・九天が工業分野の複雑な工程や物流現場、無人店舗などにも活用でき、将来的にはその分野がさらに拡大する見込みだと語った。
*1元=約22円で計算しています。
(翻訳・畠中裕子)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録