<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:media="http://search.yahoo.com/mrss/">

<channel>
	<title>視覚言語モデル | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア</title>
	<atom:link href="https://36kr.jp/topics/%e8%a6%96%e8%a6%9a%e8%a8%80%e8%aa%9e%e3%83%a2%e3%83%87%e3%83%ab/feed/" rel="self" type="application/rss+xml" />
	<link>https://36kr.jp</link>
	<description>日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。</description>
	<lastBuildDate>Tue, 01 Apr 2025 13:13:10 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://36krjp-1316517779.cos.ap-tokyo.myqcloud.com/uploads/2018/07/cropped-fav-2-1-32x32.jpg</url>
	<title>視覚言語モデル | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア</title>
	<link>https://36kr.jp</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>中国「Spirit AI」、人型ロボット賢く　AI学習効率向上</title>
		<link>https://36kr.jp/303252/</link>
		
		<dc:creator><![CDATA[n.murayama]]></dc:creator>
		<pubDate>Wed, 25 Sep 2024 21:35:00 +0000</pubDate>
				<category><![CDATA[スタートアップ]]></category>
		<category><![CDATA[注目記事]]></category>
		<category><![CDATA[人型ロボット]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[Optimus]]></category>
		<category><![CDATA[合成データ]]></category>
		<category><![CDATA[エンボディドAI]]></category>
		<category><![CDATA[千尋智能科技]]></category>
		<category><![CDATA[視覚言語モデル]]></category>
		<category><![CDATA[VLM]]></category>
		<category><![CDATA[Spirit AI]]></category>
		<guid isPermaLink="false">https://36kr.jp/?p=303252</guid>

					<description><![CDATA[<p>エンボディドAIは今年世界で最も競争が激化している分野だ。イーロン・マスク氏率いる米テスラが第2世代人型ロボッ...</p>
The post <a href="https://36kr.jp/303252/">中国「Spirit AI」、人型ロボット賢く　AI学習効率向上</a> first appeared on <a href="https://36kr.jp">36Kr Japan |  最大級の中国テック・スタートアップ専門メディア</a>.]]></description>
										<content:encoded><![CDATA[<p>エンボディドAIは今年世界で最も競争が激化している分野だ。イーロン・マスク氏率いる米テスラが第2世代人型ロボット「Optimus Gen 2」を発表したり、中国国内でも多くの大企業が次々に人型ロボットに投資したりと、大いに賑わっている。</p>
<p>こうした中、エンボディドAIロボットを開発する「千尋智能科技（<span class="text-only">Spirit AI</span>）」が、シードラウンドとエンジェルラウンドで相次いで資金を調達した。<span class="text-only">Spirit AI</span>は、産業用ロボットなどを開発する「珞石機器人（ROKAE）」のCTOだった韓峰濤氏が2024年2月に創業した。わずか4カ月で2度の資金調達を実施し、調達額は約2億元（約40億円）に上った。</p>
<blockquote class="wp-embedded-content" data-secret="qAYdUWSAV6"><p><a href="https://36kr.jp/286066/">産業用ロボットの中国新鋭「ROKAE」が100億円超を調達、日本でも展開</a></p></blockquote>
<p><iframe class="wp-embedded-content" sandbox="allow-scripts" security="restricted"  title="&#8220;産業用ロボットの中国新鋭「ROKAE」が100億円超を調達、日本でも展開&#8221; &#8212; 36Kr Japan |  最大級の中国テック・スタートアップ専門メディア" src="https://36kr.jp/286066/embed/#?secret=3kmPFwUieO#?secret=qAYdUWSAV6" data-secret="qAYdUWSAV6" width="500" height="282" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"></iframe></p>
<p>エンジェルラウンドは弘輝基金がリードし、達晨財智（Fortune Capital）と千乗資本（Fibonacci VC）のほか、シードラウンドに参加した順為資本（Shunwei Capital）と緑洲資本（Vitalbridge）も続けて参加した。今回調達した資金は技術開発と人員拡充に充てられる。</p>
<p>ちなみに、<span class="text-only">Spirit AI</span>のメンバーはいずれもロボット研究について豊富な経験を持つ。韓CEOはロボット分野で10年以上の経験を持ち、高性能軽量産業用ロボットの開発を専門とし、数々のチームを率いて20以上の業界、100以上のシーン、1000以上の顧客に対し商用化を実現し、成果を挙げている。共同創業者の高氏は清華大学教授としてエンボディドAI、ロボットビジョン、機械学習の研究に10年間携わり、汎用エンボディドAIの研究を専門とする。エンボディドAI分野ではトップクラスの米「Physical Intelligence」を創業したSergey Levine氏と共同研究をしたこともある。</p>
<h3>世界で最も効率の高い強化学習アルゴリズム</h3>
<p>人型ロボットの課題は、汎化能力に乏しく、コミュニケーションに限界があることだ。実際に働くとなった場合、工場などの一定環境でしか作業できず、周囲とのコミュニケーションは限定的、反応が不正確で感度が悪いということになる。</p>
<p>人型ロボットが人間のような賢さを持つには、大脳となるAIを搭載することが不可欠だ。</p>
<p><span class="text-only">Spirit AI</span>は人型ロボットに汎化能力とコミュニケーション能力を持たせるため、コア技術のひとつとして、汎化能力が高く、マルチに使用できる大脳を構築した。ロボットの基盤となるマルチモーダル大規模モデルに、視覚言語モデル（VLM）と新たに開発したロボット操作モデル「Constraints of Parts (CoPa)」を採用した。</p>
<p>注目すべきは、米「Figure AI」もかつて視覚言語モデルを使ってロボットに日常シーンを理解する能力や常識を持たせるようにしたが、このアーキテクチャを提案したのが<span class="text-only">Spirit AI</span>の共同創業者、高陽氏だったということだ。</p>
<blockquote class="wp-embedded-content" data-secret="taWrPcAOlG"><p><a href="https://36kr.jp/303508/">元・ファーウェイ天才少年、最新の人型ロボット5機種を発表　年内に300台出荷の見込み</a></p></blockquote>
<p><iframe class="wp-embedded-content" sandbox="allow-scripts" security="restricted"  title="&#8220;元・ファーウェイ天才少年、最新の人型ロボット5機種を発表　年内に300台出荷の見込み&#8221; &#8212; 36Kr Japan |  最大級の中国テック・スタートアップ専門メディア" src="https://36kr.jp/303508/embed/#?secret=ph5yLGByBR#?secret=taWrPcAOlG" data-secret="taWrPcAOlG" width="500" height="282" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"></iframe></p>
<p>エンボディドAIの基盤となる大規模言語モデルを構築したことに加え、<span class="text-only">Spirit AI</span>が技術面でもうひとつの強みとするのは、モデル訓練用のデータ入手という難題を解決したことだ。</p>
<p>通常、ロボットが現実世界で働けるようになるためには、現実世界における人間の膨大な運動データを収集して事前学習を施し、周囲の環境や複雑なシーンを理解できるように訓練する必要がある。しかし、そのデータ収集が最大の難関となる。</p>
<p>韓CEOは、「データ、演算能力、アルゴリズム、これがエンボディドAIの大規模モデルを構築するために必要な3つの要素だ。現在、演算能力のレベルはかなり高いが、絶対的な技術があるわけではなく、アルゴリズムの技術もまだ方向性が定まっていない。そのためロボット開発に取り組む人々は、既存のデータと新しいデータを収集する能力で差をつけるしかない状況だ」と語る。</p>
<p>訓練データの収集が困難な原因は2つある。まず、高性能ロボット市場がまだ形成されたばかりで、ロボット自体から収集できるデータが非常に少ない。また、シミュレーションや合成データを通じた訓練も解決方法のひとつではあるが、バーチャルな合成データはやはり現実世界のデータとは大きく異なる。</p>
<p><span class="text-only">Spirit AI</span>はデータ不足という問題を解決するために、汎用の高性能ハードシステム、大量のインターネットデータによる事前学習、高効率な模倣学習と強化学習に基づいて、ハードウェアの性能を十分に発揮させるようAIを進化させるというソリューションを考えた。</p>
<p>これを実現するため共同創業者の高氏は、サンプルの効率を高めてデータ不足の問題を解決するため、現在世界で最も効率の高い強化学習アルゴリズム「EfficientZero」と「EfficientZero v2」を打ち出した。</p>
<p>模倣学習については「EfficientImitate（高性能模倣学習）」アルゴリズムを提案した。このアルゴリズムはロボットが実際に稼働する過程で、一を聞いて十を知るが如く学習するようサポートする。スタンフォード大学が開発した「V-MAIL（Visual Adversarial Imitation Learning using Variational Models）」アルゴリズムに比べ、学習効率が6倍向上したという。</p>
<p>今後は、ビジネス、サービス、家庭用として製品の商用化に取り組む計画だ。</p>
<p>＊1元＝約20円で計算しています。</p>
<p>（翻訳・36Kr Japan編集部）</p>The post <a href="https://36kr.jp/303252/">中国「Spirit AI」、人型ロボット賢く　AI学習効率向上</a> first appeared on <a href="https://36kr.jp">36Kr Japan |  最大級の中国テック・スタートアップ専門メディア</a>.]]></content:encoded>
					
		
		
		
		<media:content url="https://36krjp-1316517779.cos.ap-tokyo.myqcloud.com/uploads/2024/09/20240906151757Find　Max868-1024x415.jpeg" type="image/jpeg" medium="image" width="100%" height="auto">
				<media:description type="plain"><![CDATA[Find　Max]]></media:description>
		</media:content>	</item>
	</channel>
</rss>
