世界中のAI企業に音声データサービスを提供、205言語をカバーする中国「未有科技(iWillTech)」

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

世界中のAI企業に音声データサービスを提供、205言語をカバーする中国「未有科技(iWillTech)」

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

「データ」は21世紀で最も重要な資産だと言われている。中でも音声データは、人とコンピューターの間のインタラクションや世界規模のコミュニケーションを可能にする大切な基礎となっている。

しかし、データ資産がカバーできる範囲には限りがあり、自社で所有するデータセットは健全ではないため、大半のデータ企業はこれまで通り業務をアウトソースするやり方を採用している。しかしこの方法では、データソースがコンプライアンス違反であったり、データの質が低い、コストが調整不能、サービスが専門的でないといった問題が生じる。また、音声分野にはマイナー言語のデータが不十分、世界規模の運営経験が不十分などの問題がある。

2019年6月に設立された中国発スタートアップ企業「未有科技(iWillTech)」は、世界のAI企業に音声認識、音声合成、自然言語処理、コンピュータービジョンなどに関するAIモデルのトレーニングデータを提供する。設立以来、バイトダンス(字節跳動)、iFLYTEK(科大訊飛)、テンセント、アリババ、JDドットコム(京東集団)、DJI(大疆創新科技)、小鵬汽車(Xpeng Motors)、中国科学院などAIに関わる大手企業や研究機関にサービスを提供し、AIの導入を支援してきた。

同社の彭玉成CEOは、データがAIの発展を一定程度妨げる中心要素になっており、グローバルな応用シナリオを数多く実現させるにはグローバルなデータが必須だと考えている。「AI業界をけん引するデータ、アルゴリズム、演算力は、トロイカの3頭の馬に例えられる。中でもデータはAIの実用化レベルを本質的に左右するものだ。スマートオフィス、無人運転、スマートコックピット、ゲーム・エンターテインメント、将来的にはメタバースの実現にも質の高いデータが大量に必要になる。グローバルに使えるモデルをトレーニングするには、使用するデータもグローバルなものが必須になる」と述べた。

未有科技を創業した楊雪平氏によると、業界のペインポイントを解決するため、未有科技はデータ企業としてこれまで一般的だったアウトソーシングに替わり、「完全自社運営」の事業モデルを初めて採用した。運営に直接携わり、データを生産するエンドユーザーを直接管理することで、データの収集・アノテーション(注釈付け)・品質検査・納品までの全プロセスをコントロールできるからだ。未有科技はすでにISO27701(プライバシー保護)、ISO27001(情報セキュリティ管理)、ISO9001(品質管理)認証を取得しており、価格の透明性を保証し、品質を永久保証する中国初のデータ企業となった。

未有科技の中核事業(画像:インタビュイー提供)

未有科技は設立当初からデータ分野で最も参入障壁の高い音声データを手がけており、現在ではマイナー言語の分野でコアコンピタンス(中核的競争力)を築いている。世界の205言語をカバーし、米国・日本・シンガポール・中国などに運営センターを設け、アジア・アフリカ・ヨーロッパ・アメリカ・オーストラリアの五大陸を網羅するエリア組織を構築、60以上の言語のデータセットを独自に保有しており、いずれも規模を拡大中だ。

マイナー言語のデータはすでに未有科技が持つ優位性の中心となっている。自社で版権を持つデータセットは世界の80%以上の人々の話す言語をカバーし、正確率は99%以上に達する。また、事業成長に伴い自動運転やOCR(光学文字認識)、画像などの分野にも幅を広げ、事業ポートフォリオを効果的に拡充している。

楊氏は人とコンピューターの間であっても、人と人同士であっても、テクノロジーによる相互交流を実現するにはいずれもデータが基盤になると考えている。

(翻訳・山下にか)

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録