ロボットに”大脳”を提供〜エンボディドAI開発の「X Square」が資金調達、複雑で細かな操作も実行可能に

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

ロボットに”大脳”を提供〜エンボディドAI開発の「X Square」が資金調達、複雑で細かな操作も実行可能に

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

エンボディドAIの開発に取り組む中国発のスタートアップ企業「X Square」がこのほど、エンジェルラウンドで聯想之星(Legend Star)から、さらに追加のエンジェル+ラウンドで九合創投(Unity Ventures)から、それぞれ数千万元(数億~十数億円)を調達した。

X Squareは2023年12月設立、エンボディドAIの研究開発に特化し、ロボット向けに基盤モデルを提供する。ロボット用に大脳・小脳のような汎用システムを構築し、検知から動作までのエンドツーエンド能力を持たせるのが目標だ。同社にはロボットラーニング分野でトップクラスの研究機関のメンバーだったスタッフやLLMの専門家が在籍し、ソフトとハードを総合的に開発、最適化する能力を備えている。創業からわずか3カ月の間に、LLMを使った訓練によってロボット自身が数十種類の複雑なタスクを実行できるようにした。

X Squareを創業したWilliam Wang CEOは世界で最も早くニューラルネットワークに注意機構(attention mechanism)を取り入れた研究者の1人で、米国で多くのプロジェクトに参加した経験がある。またHao CTOはIDEA研究院の出身で、LLM「封神榜」開発チームでアルゴリズムの責任者を務めた。

エンボディドAIの基盤モデルは今後のAI開発における重要分野になる。米アルファベット傘下の英DeepMindは2023年10月に、訓練ゼロ、もしくはわずかな訓練でも特定のタスクを実行できる世界最大のロボット用基盤モデル「RT-X」を発表した。また米半導体大手のエヌビディア(NVIDIA)は2024年3月にヒト型ロボット用基盤モデル「GR00T」を発表している。

エンボディドAIの研究は長い間ゆっくりとしか進んでこなかった。William Wang CEOは、その原因としてロボットのタスクが極めて複雑なことを挙げ、周囲の環境を検知、推理し、タスクを立案する高次元の能力と、運動皮質や小脳のように直接動きをコントロールする低次元の能力の双方が関わってくると語った。「ハードだけなら最も複雑な操作であってもすでに市場に出回っているもので対応することができるが、AIが足かせになっている」という。

これまでのようにシーンごとに分けるやり方ではモデルの汎用性を向上させるのは難しい。そこでX Squareはロボットのタスクを大きく2つに分けた。ひとつは、マルチモーダル大規模言語モデル(LLM)が人の指示と意図に基づいて高次元の推理と立案を実行する部分。もうひとつはロボットの基盤モデルが計画に基づいてエンドツーエンドで動作を実行する部分だ。X Squareはソフト・ハード両方の研究能力を持ちLLMに精通していることから、物理世界におけるコミュニケーションとLLMの訓練を組み合わせて、LLMの汎用操作能力を進化させた。

いずれも大規模言語モデルが自身で推理した動き(動画は高速処理済み)/提供:X Square

簡単に言うと、X Squareが自社で開発したロボット用基盤モデルのプラットフォームは、マルチモーダルLLM、ロボット制御用LLMとロボット本体を組み合わせたものということだ。

X Squareによると、自社で研究開発した基盤モデルはすでに世界の先進レベルにあり、複雑で細かな操作を実行できるようロボットを訓練することが可能だ。野菜やウインナーなどかたちが不規則なものや表面がツルツルしたものを細かくカットできるほか、スプーンを使って缶の中からジュースの粉をコップに入れ、水を注いでジュースを作ることもできる。

Hao Wang CTOによると、ロボット向け汎用モデルのコアはデータ訓練だという。「データだけなら世界各地にアウトソーシングすることが可能だが、ロボットの場合はソフトとハードの一体化、データとモデルを一体化する能力が求められる」。また中国は世界の製造業の中心であるという点で有利だとして、「中国がLLMに取り組み始めたのは米国より遅かったが、エンボディドAIの基盤モデルではほぼ同時にスタートした」と捉えている。

X Squareは企業と一般消費者の両方に向け、ビジネス化を進めている。William CEOは、エンボディドAIが人々の予想よりも早く実用化され、3年から5年のうちにビジネス利用が始まると考えている。

【動画】事前のトレーニング不要、口頭指示だけで動く中国のAIロボット登場 まずスーパーの売り場に投入

*2024年4月4日のレート(1元=約21円)で計算しています。

(翻訳・36Kr Japan編集部)

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録