36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国のロボット分野では2023年から新興企業の誕生が相次いでいる。一部の企業は人型ロボットの開発を選び、自律歩行が可能で複雑な作業もある程度こなせる汎用ロボットの実現を目指している。また、ロボットの全脳アーキテクチャの開発に重点を置き、人間の指示によってタスクを計画、分解する意思決定能力をロボットに付与しようとしている企業もある。
そのなかで、中国の超名門大学である清華大学から生まれたベンチャー企業「千訣科技(QianJue)」は、ロボット向けの大規模言語モデル(LLM)に特化しており、さまざまなタイプのロボットに対応する汎用LLMの開発に取り組んでいる。同社のLLMは認識、意思決定、制御という3つの部分に分かれている。うち認識モデルの「千訣・丘脳」が最近、製品化に向けて大きく前進した。(編集部注:「丘脳」は日本語で「視床」の意味)
脳の視床は動物のさまざまな感覚情報を大脳皮質に伝達する多機能な部位だ。視床は単なる情報中継基地にとどまらず、感覚情報を送受信するほかに圧縮、解析、生理信号調節などの処理を施し、生物の知能を発揮させる重要な役割を担う。
目などの基本感覚器官に比べ、視床が突出しているのは思考力だ。千訣科技は汎用ロボットにあらゆる物を認識する能力を与えたいと考え、視床の働きを模した千訣・丘脳を発表した。小型の言語モデルを中央処理装置(CPU)として使い、マルチモーダルな思考の連鎖を構築することで、さまざまな物体の状態や性質を認識できるという。
創業者の高海川CEOによると、従来の検出法や画像テキストマッチングなどのマシンビジョンに比べ、ロボットの「視床」は一定の思考能力を持っており、取得した環境情報を迅速に認識する。
千訣・丘脳によって、ロボットは操作するほとんどの物体の特徴を認識できるようになり、位置の検出や状態に関する豊富な情報を含む物体の特徴を自動的にフィードバックする。また、自動化されたマルチモーダルな思考の連鎖によって、ボトルのキャップや取っ手など物体の細かい点まで認識できる。高CEOは、千訣・丘脳が大量のトレーニングセット以外の物体を汎化可能で、変化に富む物体の種類を推測し、方言やネットスラングなどの表現も正確に認識するため、ロボット以外でも多くの分野で活用できると説明した。
同社の開発チームは千訣・丘脳をベースに、オフィス環境における一般的なタスクの分解と実行をサポートする意思決定型サービスロボットを作った。また今年前半に、ロボットの意思決定モデル「千訣・大脳」を発表する計画だ。認識モデルと意思決定モデルを連動させ、製品の汎用化とスマート化を進めることで、ロボットメーカーを支援し、LLMの活用ハードルを下げる。
ロボット向けLLMをトレーニングする際の課題は、高品質のロボットデータセットが不足していることだという。千訣科技はこの半年ほどで、データセットの規模とデータのタグ付けを改善した。同社はロボット向けLLMを開発する作業ラインを構築、データのタグ付け、開発、クリーニング、ファインチューニングを自動で進め、モデルの改良を進めている。
(翻訳・大谷晶洋)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録