36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
世界でエンボディドAI(身体性を持つ人工知能)の開発競争が激化している。さまざまな形態のロボットに人間並みの汎化能力を持たせ、いかにして「特定のタスクをこなす装置」から「汎用的な物理AI」へと進化させるかが、競争の焦点となっている。
このほど、エンボディドAIの意思決定を担う生成式「大脳モデル」を開発する中国スタートアップ・上海眸深智能科技が、エンジェルラウンドで上海市政府系投資会社の徐匯資本(Xuhui Capital)から1000万元(約2億3000万円)以上を追加調達した。資金はコンピューティングリソース(計算資源)の調達、人材採用やロボット実験プラットフォームの整備に充てられる。
業界初の「世界動作モデル」
眸深智能は2025年設立。復旦大学未来信息創新学院の陳涛教授と、米インテル中国法人の元チーフサイエンティスト張益氏らが創業した。同社はロボット向け生成式大脳モデルの開発に特化し、人型ロボット(ヒューマノイド)などに人間の大脳と同様の汎化能力と実用性を与えようとしている。
同社はまず、動作シーケンスを1000以上の基本要素に分解する技術を独自開発した。モデルは自然言語の指示に従い、これらの基本要素を動的に選択して組み合わせ、未学習の新たな動作を生成する。これにより、高い汎化性能を実現するという。
この技術を基盤とした業界初の「世界動作モデル(World Motion Model)」によって、ロボットは外部環境にリアルタイムで反応し、その環境に応じた「没入型動作」を生成できるようになる。同社は、動作生成、3D世界モデル、モデル圧縮、ソフト・ハード統合までを一貫して手がける体制を整えている。
3段式のデータ学習
エンボディドAIの開発では、実機データの取得コストが高額なうえ、著しいデータ不足がボトルネックとなっている。この課題を解決するため、眸深智能は3段式データトレーニングを採用した。
まず、ネット上に公開されている人体の動作動画のデータを用いて事前学習を済ませ、モデルに汎用的な動作ルールを理解させる。次に、シミュレーションデータで微調整を施し、最後にほんのわずかな実機データによる強化学習で精度を補正していく。この方式ならば、高額な実機データへの依存度が大幅に低減し、新たなロボット本体への実装にかかる期間も数週間までに短縮できるという。
また、独自のモデル圧縮・推論高速化技術により、パラメータを4分の1に圧縮すると同時に、推論速度を10倍に向上。100億パラメータ規模のモデルがロボットに内蔵されたチップ上で効率的に運用させることを可能としている。
さらに、3D検知とインタラクションを担う推論モデル「LL3DA」が、点群データを直接処理し、言語・画像・動画などマルチモーダル指示に対応する。これにより環境理解からタスク計画までを一貫して行う。
目指すは「汎用大脳モデル」のサプライヤー
創業者の陳教授は、エンボディドAI産業は分業型のエコシステムへ向かっており、単一の企業が全てを担うのは難しいと指摘。同社は世界動作モデルを中核に、ロボットメーカーやシステムインテグレーターと連携する。自社でロボット本体は製造せず、ロボット向け「汎用大脳モデル」のサプライヤーとしての地位確立を目指すという。
現在、産業化の検証段階に入り、小米集団(シャオミ)や宇樹科技(ユニツリー)など複数の大手企業と業務提携を結んでいる。すでに1000万元以上の受注を獲得し、顧客に高品質な動作データの生成サービスを提供している。
導入先としては、産業向けの搬送および家庭向けのヘルスケア・介護の2分野にフォーカスしている。搬送分野では障害物回避や複数のロボットの協調制御といったニーズに応え、ヘルスケア・介護分野では安全の見守りから手足の動きのサポートまで、段階的にサービスを拡張していく計画だ。
*1元=約23円で計算しています。
(翻訳・田村広子)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録




フォローする
フォローする



