AIロボットに「物理法則」を教える。センスタイム幹部、本当に「働ける」ロボット犬を発表

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

AIロボットに「物理法則」を教える。センスタイム幹部、本当に「働ける」ロボット犬を発表

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

人型ロボット(ヒューマノイド)の「知能」が、重要な節目を迎えた。中国AI大手のセンスタイム(商湯科技)の共同創業者である王暁剛氏が2025年12月、新たな創業プロジェクト「大暁機械人(ACEROBOTICS、以下:大暁)」を携え、三つの革新的な技術を発表した。

独自開発の汎用頭脳のスーパー・ブレイン・モジュール「A1」、ACEエンボディド開発パラダイム、そして中国初となる商用利用向けオープンソース・世界モデル「開悟(KAIWU)3.0」である。世界モデルとは、物理学や空間特性など、現実世界の力学を理解するための“頭脳”を指す。

発表会に先立ち、王氏がネットで公開した動画が大きな話題を呼んだ。10匹の形状も異なるロボット犬の前に立った彼が手をひと振りすると、リモコン操作なしでこの“ワンワン部隊”が即座に動き出した。道路上で違法駐車車両を検知してデータを送信したり、ドローン飛行禁止区域で無人機の信号を検知・確認したりそれぞれの作業に自律的に取り組んだ。

△ 大暁のロボット犬が違法駐車車両を識別する様子

これは大暁の技術が実際の業務現場に落とし込まれていることを示しており、ロボット犬を「高価な電子おもちゃ」から「実務ができる町のワーカー」へと進化させた。現在、同社のロボット犬は上海市徐匯区の警察当局と連携し、都市行政におけるロボットの活用を本格的に模索している。

上海で「無人パトカー」始動 AIで監視効率化、初日に違法駐車119台警告

ロボットに「スーパー大脳」を実装

従来のロボット犬は宙返りなどのデモンストレーションしかできなかったのに対し、なぜ大暁のロボットはこのように働けるのか。

王氏は、その理由を次の二つの核心的な技術にあると語った。

①エンボディド・スーパー・ブレインモジュールA1

これは着脱可能な「汎用頭脳」であり、宇樹科技(Unitree Robotics)、智元機器人(AgiBot)、雲深処科技(DEEP Robotics)など、市場に存在するあらゆる主流ロボット本体に適用している。これを搭載することで、従来は機械的な動作にとどまっていたロボットが、空間知能と自律的な意思決定能力を瞬時に備える。

②世界モデル「開悟3.0」

これは脳を駆動する基盤となる“心”にあたる。簡単に言えば、モデル内部に「物理法則」を構築することで、ロボットは動作を丸暗記するのではなく、世界を理解して行動できるようになる。

例えば「ドアを開ける」という基本概念を学習すれば、自宅の木製ドアであれ、レストランのガラス扉であれ、状況に応じて自律的に対応できる。

「スーパー模倣者」から脱却へ

「開悟」3.0のの真価は、現在の人型ロボットが直面している「データの壁」を突破する点にある。過去1年、ロボットAIの主流はVLA(視覚・言語・動作)モデルに依存してきた。これは「映像と指示と動作」をセットで学習させ、特定タスクを再現させる方式だ。しかしVLAの本質は「スーパー模倣者」にすぎず、環境や対象が変わると成功率は急落する。

さらに致命的なのは、実機によるデータ収集はコストが高く、業界全体のデータ蓄積量は自動運転分野(100万時間規模)に比べ、わずか10万時間程度と圧倒的に不足している。

これに対し、世界モデルは「環境との相互作用の法則」そのものを学習する。これによりロボットは以下の能力を獲得する。

・マルチモーダル理解:映像を見るだけでなく、カメラの姿勢、3D軌跡、力学的属性まで理解する。

・マルチモーダル生成:仮想世界で背景や本体、ロボットアームを変更し、学習用データを無限に生成できる。

・マルチモーダル予測:「スマホを取れ」という指示に対し、左手と右手どちらを使うべきか、その後の展開を事前にシミュレーションする。

発表会では、「開悟」3.0の驚異的な生成能力が披露された。

ユーザーがテキストでタスクを入力し、カメラ視点とロボット形態を選択するだけで、モデルはその環境下でロボットが作業を行う一人称視点の映像を生成する。これらのシミュレーションデータは、実機ロボットのブレイン訓練に高効率で利用でき、仮想空間で自己訓練・法則学習を行うことで、高価な実機データへの依存を大幅に低減できる。

深圳発人型ロボット「LimX Dynamics」、約300億円の大型調達 モジュール化×専用OSで差別化

街から工場、そして家庭へ

王氏は、「世界モデルは研究室で綺麗な映像を作るためではなく、現場で検証されてこそ意味がある」と強調する。

センスタイムが11年間培ってきた都市行政や観光分野のリソースを活用し、大暁はまず「四足歩行ロボット犬」を商用化の第一歩に選んだ。ハードウェアが成熟しており、巡回点検や警備といった明確なニーズがあるからだという。現場でデータを収集し、それを世界モデルにフィードバックするサイクルを高速で回していく。

△ 大暁モジュールを搭載したロボット犬は、赤信号の認識や自律ナビゲーションと障害物回避を実現する

王氏が描く進化のロードマップは明快だ。

短期(1〜2年):四足ロボットで都市行政・交通安全などの分野の新規市場に参入。

中期(2〜3年):車輪型双腕ロボットへ拡張し、無人物流倉庫をメインのターゲットとする。

長期:最終的に二足歩行人型ロボットへと進み、家庭環境という複雑な環境へ入る。

AI革命の後半戦は、物理法則を理解し、現実世界を移動しながら問題を解決する「身体を持った人工知能(エンボディドAI)」こそが、その主役となるだろう。

(翻訳・編集:36Kr Japan編集部)

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

次の一手をひらくヒントがここに。

会員限定ニュース&レポートをお届け。