「脳だけ」では勝てない——量産前夜の中国ヒト型ロボット、投資家が見る生き残りの分岐点(前編)
ヒト型ロボット、いわゆる「フィジカルAI」への関心が日本でも急速に高まっている。工場で搬送したり、店舗で商品を掴み客と言葉を交わしたりする——中国では、そんな実用化が先行する。とはいえ市場の約7割はなお研究開発向けとされ、本格的な社会実装と普及はこれからだ。
二足歩行は本当に必要なのか。ロボットの「脳」だけを売る会社は生き残れるのか。そしえ日本企業はこの市場に入るチャンスがあるのか。量産前夜を迎えた中国ヒト型ロボット市場の現在地を、みずほが共同GP(Co-GP)を務める投資ファンド「Mizuho Leaguer Investment(みずほリーガー・インベストメント)」のパートナーで、上海に駐在しディープテック投資を担当する張一欧氏に聞いた。
みずほリーガーは、音声や動画を自動で文字起こしする「Notta」、ノーコード・ローコードのAIアプリ開発基盤「Dify」、インメモリコンピューティングチップ「TetraMem」、そしてヒューマノイド開発の「零次方機器人(ZERITH)」などに投資してきた。

Mizuho Leaguer Investment・張一欧氏
「何でもできる」ロボットメーカーは怪しい
——フィジカルAIへの関心が日本でも急速に高まっています。投資家の視点から、現在の中国のヒト型ロボット市場をどう見ていますか?
市場として見ると、今は「研究開発向け」が7割を占めている段階です。ロボットが活躍している映像は目を引きますが、屋内や整備された環境での実証実験がほとんどで、雨の中で動かすなど、人が行きたくない過酷な環境での実用化はこれからです。
ただ、転換点は近いと思っています。テスラのOptimus(オプティマス)が今年、車の生産ラインで量産に入ると言われています。そうなると、ロボットにも自動車並みの耐久性や品質基準が求められるようになる。ヒト型ロボットの年間販売台数が現時点では車の生産ライン2週間分程度しかないので、「まだ先の話」と言う人もいますが、時間の問題だと思います。
——日本では「フィジカルAI」という言葉が急速に広がっていますが、中国は「エンボディドAI」という言葉が使われることが多いです。どう整理すればいいですか?
エンボディードAIは「製造業の現場にAIを導入する」というニュアンスで、現場側からAIを取り込む発想です。一方のフィジカルAIは「ChatGPTのようなAIがラップトップの中から現実世界に飛び出してくる」イメージで、AI側から物理世界に出ていく発想です。
日本でフィジカルAIという言葉が急速に広まったのは、エヌビディアのジェンスン・フアンCEOがこの言葉を使い始めた影響が大きいと思っています。中国ではエンボディドAI という表現の方が一般的で、どちらかといえば現場での応用を指すことが多い。同じ現象を指しながら出発点が違う、と解釈しています。
ただどちらの言葉を使うにしてもAIが体を得て、現実空間で動く——その世界に向かっていることは間違いありません。
——ロボットのマラソン大会に象徴されるように、今はロボットメーカーがヒト型、つまり二足歩行の精度の高さを競っています。
産業への実装という観点で言うと、私は二足にこだわらなくていいと考えています。二足歩行は階段を登れるなどの利点がある一方、しゃがんだ時のバランス制御が難しく、課題が多い。現在の実用シーンでは車輪式の方が安定するし、エレベーターにも乗れる。四足のほうが転倒リスクも低いです。
ロボットの役割も今後、倉庫ピッキングに強いロボット、無人店舗向けのロボット、エンタメ・ライブで踊るロボットと分化していくでしょう。「何でもできます」というロボットメーカーはむしろ怪しいと思っています。エンジニアが足りなくなりますから。
——清華大発のロボットスタートアップ「零次方機器人(ZERITH)」に投資していますが、どんな強みがありますか。
ZERITHは宇宙ステーションの無重力空間でモノのつかみ方を研究していた研究者が創業した、清華大学発スタートアップです。宇宙より地上の応用シーンの方が難易度が低く、制御技術に対する信頼感があります。
特に評価しているのはスピードです。「このコンセプトのロボットを作りたい」という企画から試作機の完成まで2カ月というスピード感です。ハードウエアとソフトウエアの基盤がしっかりしているからこそ、プロダクト化が速い。
もう一つの強みが、ロボット本体だけでなく、データを収集・整理・ラベリングするプラットフォームも自社で持っている点です。ロボットを賢くするには動作データの蓄積が不可欠ですが、「脳(AI)だけ提供します」という会社では、そのデータが集まらない。本体とプラットフォームを両方持つところに、ZERITHの競争力があります。

零次方機器人(ZERITH)
小さくてもロボットだけで完結する環境から入る
——「脳だけ提供する」ビジネスモデルでは足りないということでしょうか。
「大脳」、つまりAIモデルだけを開発・提供しようとするスタートアップが世界中で出てきて、投資も集めています。でも私は、それだけでは勝てないと思っています。
ロボットを賢くするには現実世界での動作データが必要で、そのデータはロボット本体を使って集めるしかない。大脳だけ売っていても、データが集まらない。データが集まらなければ、大脳も賢くならない。
つまり、ロボットの本体を提供して、そこに自社の大脳を載せて、現場での動作データを蓄積する——このサイクルを回せる会社でないと、長期的には厳しい。大脳メーカーも最終的にはロボット本体を作らなければならなくなると思います。
——ZERITHは既に「現場」で稼働しているそうですが、具体的にはどういう分野でしょうか。
わかりやすいのが、AI大手の商湯科技(センスタイム)と共同で進めている無人店舗で、上海ですでに5店舗が稼働しています。
店舗ではロボットが商品を取り出し、暇なときにはバックヤードで在庫補充もします。客と話すこともできますし、リアルタイムで価格調整もします。この形だと投資回収期間が1.5年。これは非常に重要な数字です。

無人店舗で注文を受け付け、商品を受け渡すZERITHのヒト型ロボット
もう一つが倉庫ピッキングです。500平方メートルほどの小型倉庫に10台程度入れて、各機が担当カテゴリを持ち、注文が来たら連携してピッキングする。トータルで人間と同等程度のスピードで動け、24時間無人で回せます。
共通するのは「クローズドループ」の発想です。狭い領域でいいから、まずロボットだけで完結する環境を作る。そこでデータが蓄積されるほどサービスの精度が上がっていきます。
では、この市場に日本企業はどう関わればいいのか。フィジカルAIへの関心は日本でも高いが、実装の現場はまだ米中に遠く及ばない。「とりあえず視察」では何も生まれない、と張氏は言う。完成品メーカーが本当に求めているもの、日本の製造業が自動車で培った技術が刺さる場所、そして「EVの二の舞」を避けるための順序——後編で詳しく聞く。
張一欧氏:みずほリーガー・インベストメントでポストインベストメント戦略を統括し、クロスボーダーで事業を展開するハイテク企業に対し、投資後のハンズオン支援を手がける。14年以上にわたりアジアおよびグローバル株式のリサーチに従事し、日本・中華圏の機関投資家向け営業の経験も持つ。日本語・中国語・英語のトリリンガル。
(取材・文:浦上早苗)
経済ジャーナリスト、法政大学IM研究科兼任教員。福岡市出身、早稲田大学政治経済学部卒。西日本新聞社を経て、中国・大連に国費博士留学および少数民族向けの大学で教員。現在は経済分野を中心に執筆編集、海外企業の日本進出における情報発信の助言を手掛ける。近著に『崖っぷち母子 仕事と子育てに詰んで中国へ飛ぶ』(大和書房)『新型コロナVS中国14億人』(小学館新書)。X: sanadi37