遠くから音声のノイズを除去、中国新興企業がアマゾン「Alexa」にも技術提供

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

遠くから音声のノイズを除去、中国新興企業がアマゾン「Alexa」にも技術提供

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

5Gの実用化に伴い、IoTデバイスの普及が進んでいる。これらのデバイスのほぼすべてが音声認証や音声操作などに対応しており、音声を正確に捕捉する技術が製品の使いやすさに直結するといえる。音声情報からノイズを除去する技術を手掛ける中国の新興企業、深圳米唐科技有限公司(Sugrsugr Tech、以下「Sugr」と略称)」は、これまで難易度の高かった距離1~10mの範囲内のノイズを除去する技術を開発、アマゾンやファーウェイといった大企業にAIアルゴリズム、クラウドプラットフォーム、チップモジュールが一体化したソリューションを提供し始めた。

AIスピーカーやスマート家電などの音声入出力技術といったいわゆる、音声インタラクションは、デバイスとの距離によってファーフィールド、ニアフィールドの2つに分けることができる。ファーフィールドの距離は1〜10メートルで、この距離になると雑音、エコー、残響が音声受信の大きな妨げとなる。そのため、IoTデバイスの普及によって、ファーフィールドのノイズ除去技術へのニーズが高まっている。

Sugrは、こうしたファーフィールドノイズ除去技術の開発を専門とする企業で、法人向けにアルゴリズム、クラウドプラットフォーム、チップモジュールが一体化したソリューションを提供している。その中核技術は、「3Dアレイビームフォーミング」機器を使い、立体的な3Dサラウンド音場を採取し、高位合成によってノイズ除去の効果を高めるものである。この技術は柔軟性に優れているほか、集音角度の狭さ、発言者が誰か判断できない、外部環境の変化による影響の受けやすさを示すロバスト性が弱い、量産化が難しいといった他の技術にみられる欠点も克服している。

3Dアレイアルゴリズムの概要図(画像はSugrが提供)

Sugrの技術は効率性にも優れており、最高レベルのノイズ除去効果を実現する場合に必要な計算量は、従来の技術の1/5である。音声での起動のしやすさ、識別の精度、反応の速さ、エネルギー消耗、信号対雑音比などのスペックはともに世界トップクラスである。現時点でのエコー消去量は60dB以上、ノイズ消去量は40dB以上だという。

同社の宋少鵬CEOによると、Sugrの技術はすでに数百万台のデバイスに採用され、数十万世帯に利用されている。

Sugrはアマゾンのグローバルパートナーで、アマゾンが認証したAlexaエコシステムインテグレーターでもある。アマゾン以外の顧客には、ファーウェイや照明器具大手の「Acuity Brands」などがある。

同社がファーウェイに提供したソリューションは、スマートスピーカー「AI Cube」に搭載され、スマートスピーカーの開発期間を12カ月から3カ月に短縮し、音声認識のチューニング所要時間を960時間から12時間に短縮するなど、特筆すべき効果を挙げている。

ファーフィールドノイズ除去技術はまだ参入者が少ないブルーオーシャン市場であり、中国国内ではSugrのほか、「声加科技(Sound+)」、「声智科技(SoundAI)」、「友傑智新(ELITEAI)」、「啓英泰倫(Chipintelli)」などが開発している。友傑智新はAI音声コントロールのオペレーションに長け、啓英泰倫はAIチップとアルゴリズムに注力するなど、各社の技術は一長一短といった状態である。

Sugrは2014年に設立され、当初はスマートスピーカー「Sugr Cube」を開発していたが、その後ファーフィールドノイズ除去に特化するようになった。エンジェルラウンドの出資者は「真格基金(ZhenFund)」と「深圳央金投資管理有限公司」であった。

(翻訳・小六、編集・後藤)

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録