36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
今やスマートデバイスに不可欠な要素となった音声認識技術。ウエアラブルデバイスからスマートホームに至るまで、どれも音声認識技術なしには機能しない。それに伴い、音声インタラクションの第一歩である「聞くこと」に特化した技術を研究する企業が現れ始めている。
2017年に深圳で創業した「大象声科(Elevoc Technology)」(以下、Elevoc)は、ディープラーニングを活用して全く新しい音声処理技術を開発する企業で、人と同じように音声を認識できる機械の実現を目指している。同社の技術は計算的聴覚情景分析(CASA)とディープニューラルネットワーク(DNN)に基づくもので、人の声を周囲の雑音から分離する実用レベルの技術としては業界初となる。今後は、雑音の中でも自分に向けられた会話をきちんと聞き取れる「カクテルパーティー効果」のより高度な再現が期待されている。
Elevocの創業者でCEOの苗健彰氏の説明によれば、従来のデジタル信号処理は既定の雑音特性や方向に基づいて信号をフィルタリングし、音声強調を行う方式だという。しかし日常生活の雑音が想定通りの特性を持つとは限らず、さまざまに反響して聞こえてくるため、従来の方式では雑踏などの雑音環境に十分対応できなかった。CASAとDNNを組み合わせたElevoc技術なら人の音声認識に似たメカニズムを学習させ、さまざまな音が飛び交う環境でも人の声を聞き分けて認識できるという。
技術の実用化に当たって、Elevocは「ノイズキャンセリング」からアプローチした。雑踏内でもクリアな音声で通話したりボイスメッセージを送ったりできるようにしたほか、雑音環境下での音声認識精度を向上させ、音声を正確に聞き取ることができるようにした。同社の音声強調アプリケーション「Vocplus」と音声インタラクション「Vocplus Smart」は、現在スマートフォンやイヤホン、PC、トランシーバー、インターネットを利用した音声通話(VoIP)、IoTなどの分野で幅広く活用されている。
特に活用が進んでいるのが、スマートフォンやイヤホンなど家庭用電化製品の分野だ。これは業界そのもののニーズと市場規模が関係している。「現在、シャオミやOPPO、vivoなど中国のスマホメーカーのほとんどは我が社のノイズキャンセリング技術『Vocplus Telecom』やハウリング抑制機能を導入している」と苗CEOは明かす。
昨年から火がついた完全ワイヤレスイヤホン(TWS)ブームの影響で、多くのイヤホンメーカーがAI主導型の通話ノイズキャンセリング機能を採用するようになった。Elevocはブルートゥースイヤホン用のAIノイズキャンセリング機能をいち早く実用化した企業であり、最初の量産モデルはOPPOのワイヤレスイヤホン「Enco Q1」だ。また今年にも中国の音響メーカー「Edifier」と協業して、AIアルゴリズムと骨伝導を組み合わせたノイズキャンセリング機能の実用化を果たした。このほか、クアルコムをはじめとする国内外の有名チップメーカーとも提携を結んでいる。
同社はライセンス販売とプロジェクトごとのサービス料という2種類の収益モデルを採用している。現時点でライセンスを使用しているデバイス数は数千万台に上り、今年の売上高は数千万元(数億円)に達すると見積もられている。
今後は音声技術の全体の整備と活用分野の拡大を進め、補聴器、スマートホーム、会議システム、車載用システムなどさまざまな業界に特化した音声認識ソリューションの提供を目指している。(翻訳・畠中裕子)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録