36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
エンボディドAIは今年世界で最も競争が激化している分野だ。イーロン・マスク氏率いる米テスラが第2世代人型ロボット「Optimus Gen 2」を発表したり、中国国内でも多くの大企業が次々に人型ロボットに投資したりと、大いに賑わっている。
こうした中、エンボディドAIロボットを開発する「千尋智能科技(Find Max)」が、シードラウンドとエンジェルラウンドで相次いで資金を調達した。Find Maxは、産業用ロボットなどを開発する「珞石機器人(ROKAE)」のCTOだった韓峰濤氏が2024年2月に創業した。わずか4カ月で2度の資金調達を実施し、調達額は約2億元(約40億円)に上った。
エンジェルラウンドは弘輝基金がリードし、達晨財智(Fortune Capital)と千乗資本(Fibonacci VC)のほか、シードラウンドに参加した順為資本(Shunwei Capital)と緑洲資本(Vitalbridge)も続けて参加した。今回調達した資金は技術開発と人員拡充に充てられる。
ちなみに、Find Maxのメンバーはいずれもロボット研究について豊富な経験を持つ。韓CEOはロボット分野で10年以上の経験を持ち、高性能軽量産業用ロボットの開発を専門とし、数々のチームを率いて20以上の業界、100以上のシーン、1000以上の顧客に対し商用化を実現し、成果を挙げている。共同創業者の高氏は清華大学教授としてエンボディドAI、ロボットビジョン、機械学習の研究に10年間携わり、汎用エンボディドAIの研究を専門とする。エンボディドAI分野ではトップクラスの米「Physical Intelligence」を創業したSergey Levine氏と共同研究をしたこともある。
世界で最も効率の高い強化学習アルゴリズム
人型ロボットの課題は、汎化能力に乏しく、コミュニケーションに限界があることだ。実際に働くとなった場合、工場などの一定環境でしか作業できず、周囲とのコミュニケーションは限定的、反応が不正確で感度が悪いということになる。
人型ロボットが人間のような賢さを持つには、大脳となるAIを搭載することが不可欠だ。
Find Maxは人型ロボットに汎化能力とコミュニケーション能力を持たせるため、コア技術のひとつとして、汎化能力が高く、マルチに使用できる大脳を構築した。ロボットの基盤となるマルチモーダル大規模モデルに、視覚言語モデル(VLM)と新たに開発したロボット操作モデル「Constraints of Parts (CoPa)」を採用した。
注目すべきは、米「Figure AI」もかつて視覚言語モデルを使ってロボットに日常シーンを理解する能力や常識を持たせるようにしたが、このアーキテクチャを提案したのがFind Maxの共同創業者、高陽氏だったということだ。
エンボディドAIの基盤となる大規模言語モデルを構築したことに加え、Find Maxが技術面でもうひとつの強みとするのは、モデル訓練用のデータ入手という難題を解決したことだ。
通常、ロボットが現実世界で働けるようになるためには、現実世界における人間の膨大な運動データを収集して事前学習を施し、周囲の環境や複雑なシーンを理解できるように訓練する必要がある。しかし、そのデータ収集が最大の難関となる。
韓CEOは、「データ、演算能力、アルゴリズム、これがエンボディドAIの大規模モデルを構築するために必要な3つの要素だ。現在、演算能力のレベルはかなり高いが、絶対的な技術があるわけではなく、アルゴリズムの技術もまだ方向性が定まっていない。そのためロボット開発に取り組む人々は、既存のデータと新しいデータを収集する能力で差をつけるしかない状況だ」と語る。
訓練データの収集が困難な原因は2つある。まず、高性能ロボット市場がまだ形成されたばかりで、ロボット自体から収集できるデータが非常に少ない。また、シミュレーションや合成データを通じた訓練も解決方法のひとつではあるが、バーチャルな合成データはやはり現実世界のデータとは大きく異なる。
Find Maxはデータ不足という問題を解決するために、汎用の高性能ハードシステム、大量のインターネットデータによる事前学習、高効率な模倣学習と強化学習に基づいて、ハードウェアの性能を十分に発揮させるようAIを進化させるというソリューションを考えた。
これを実現するため共同創業者の高氏は、サンプルの効率を高めてデータ不足の問題を解決するため、現在世界で最も効率の高い強化学習アルゴリズム「EfficientZero」と「EfficientZero v2」を打ち出した。
模倣学習については「EfficientImitate(高性能模倣学習)」アルゴリズムを提案した。このアルゴリズムはロボットが実際に稼働する過程で、一を聞いて十を知るが如く学習するようサポートする。スタンフォード大学が開発した「V-MAIL(Visual Adversarial Imitation Learning using Variational Models)」アルゴリズムに比べ、学習効率が6倍向上したという。
今後は、ビジネス、サービス、家庭用として製品の商用化に取り組む計画だ。
*1元=約20円で計算しています。
(翻訳・36Kr Japan編集部)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録