AI主導のデータラベリング技術 膨大データを迅速に処理 人間の手作業を削減

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

AI主導のデータラベリング技術 膨大データを迅速に処理 人間の手作業を削減

続きを読む

人工知能(AI)データサービスを手掛ける「竜猫数拠(Longmao Data)」がこのほど、プレシリーズBで3300万元(約5億円)を調達した。リード・インベスターは「KIP中国(Korea Investment Partners China)」、コ・インベスターは「金沙江創投(GSR Ventures)」。調達資金はラベリングの自動化技術やAIの研究開発、市場開拓に充てられる。同社はこれまでにも金沙江創投のほか、「九合創投(Unity Ventures)」「不惑創投(Buhuo Ventures)」「真順基金(Zhenshun Fund)」および「雲天使基金(Cloud Angel Fund)」から複数回にわたり資金を調達している。

データ、ハッシュレート、アルゴリズムはAIを成長させる三要素だ。AI技術の発展に伴い、市場にデータラベリングの需要が生まれた。多様化した大量のデータを把握するため、初期のデータラベリング業界では外部委託の形で、膨大な手作業によるデータの収集とラベリングを行っていた。データの量と品質の両方の向上が求められるようになると、人件費の高さや作業効率、品質の低下という問題の解消が課題となった。

竜猫数拠は上記の問題を解消するため、データラベリング作業をオンラインで行うこととし、AIデータラベリング・プラットフォームを構築。オンラインユーザーをデータの収集とラベリングに参加させることで人件費や事業所を構えることで生じるコストを削減した。さらに、ラベリングツールの最適化やラベリングの自動化、データのプレラベリングなどを進めることで、データラベリングの効率と品質を向上させた。

同社のプラットフォームは2016年にローンチされた。事業範囲はコンピュータービジョン(CV)、音声認識、自動運転、AIの従来型産業への活用の4分野にわたっている。

プラットフォームに備えられた機能をみる限り、同社はすでにAIによるラベリングの自動化を実現している。ラベリング項目とデータの蓄積を基盤に、顔認識やセマンティックセグメンテーション、光学文字認識(OCR)、音声認識、自動運転などシーン別データのプレラベリングを行ってから、ラベリングスタッフに業務を分担させる。これにより、AIの精度の高い訓練とイテレーションを実現することが可能だ。また、プラットフォームが備える検証機能により、顧客はデータ作成の進捗状況を遠隔管理できる。

ラベリングスタッフと品質の管理については、オンラインユーザーをスタッフとしているため、従来よりも多くの人材を得ることが可能となっている。スタッフはプラットフォーム上で研修を受け、習熟度に従って作業を割り振られ、成果に基づいて報酬が支払われる。この管理システムにより、データの品質を向上できるほか、ラベリングサービスの対価を3割削減できる。

同社の現在の登録ユーザーは累計で約500万人。ラベリングチームは2000チームを超え、すでにIT大手や科学技術の研究開発に携わるトップ企業など数百社にサービスを提供している。中国IT大手の「百度(Baidu)」やアリババグループ、ネット通販大手の「京東(JD.com)」、動画共有アプリの「快手(Kuaishou、海外版は「Kwai」)」、ニュースアプリの「今日頭条(Toutiao)」、スマホ大手のシャオミ(小米科技)、保険大手の「中国平安集団(Ping An)」、通信大手の「中国移動(チャイナモバイル)」、韓国のサムスン電子などが長期にわたり竜猫数拠のサービスを利用している。

データラベリング業界が中国で誕生したのは比較的遅かった。業界の代表的な関連企業には時価総額28億ドル(約2900億円)のグローバル企業「Appen」や米アマゾン(Amazon)が運営する「アマゾンメカニカルターク(AMT)」、評価額10億ドル(約100億円)の米「Scale AI」、先ごろシリーズBで2500万ドル(約2億6000万円)を調達した米「Labelbox」が挙げられる。

KIP中国の投資董事、林湧氏は「AIが垂直的関係にある各産業に浸透する過程で、データサービスへの需要は高まり続けるだろう。竜猫数拠は中国のAIデータサービス企業のトップランナーとして、国内外の多くの優良顧客から認められている。また柔軟性の高い組織能力を備えており、AI業務を必要とする企業により良いインフラサービスを提供していけるだろう」と指摘した。

金沙江創投のパートナー、陳斕傑氏は「竜猫数拠は技術面で先頭を走り続けている。当社は竜猫数拠が提供するAIデータサービスのコアコンピタンスを常に評価しており、中国におけるAIの発達は見通しが明るいと見ている。今後も引き続き、AIが浸透するであろう垂直的関係にある各産業への投資チャンスに注目していく」と述べた。
(翻訳・田村広子)

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録