形状はまるでスマホ 音声認識「iFLYTEK」、次世代AIボイスレコーダーで市場拡大を目指す

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ注目記事

形状はまるでスマホ 音声認識「iFLYTEK」、次世代AIボイスレコーダーで市場拡大を目指す

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

音声認識分野でトップランクインの中国「科大訊飛(iFLYTEK)」が、スマートICレコーダーのアップデート交流会を開催、録音、音声反訳(文字起こし)、編集すべてで性能を向上させた新製品を披露した。

1990年代以降、ボイスレコーダーは形状が変わった程度で、技術的イノベーションはほとんどなく、消費者の多様なニーズを満たせていない。従来型ボイスレコーダーの出荷量は、ここ数年450万台前後でずっと横ばいだ。

スマート音声認識技術の開発で世界をリードする科大訊飛は、発展性が低いとされてきたボイスレコーダー市場に2019年5月に参入した。同社SRシリーズのボイスレコーダーのセールスポイントは、基本的な録音機能だけではなく、画面とソフトウェアの活用により、AIボイスレコーダーの活躍の場を徐々に増大させてきたことだ。

科大訊飛の共同創設者胡郁氏は、AI音声認識技術の導入はハイエンドボイスレコーダーを再定義し、市場の拡大をもたらすと考える。音声反訳機能に消費者ニーズがあるのは間違いないのだが、さまざまな状況下で、消費者がどのようなソリューションを求めているかはまだはっきりしていない。科大訊飛は、製品マトリクスを構築することで、消費者の多様なニーズに対応し、ニッチな市場でヒット商品が出現するのを待つという。

「科大訊飛」AIボイスレコーダーアップグレード交流会

科大訊飛の副総裁兼コンシューマービジネスグループ副総裁の李伝剛氏は、正確な認識、遠くの音の録音、クリアな録音および多言語対応を同社AIボイスレコーダーのフラッグモデルの四大基準と定義した。この基準に基づいたアップグレードのポイントは以下の3つに要約される。

・録音 音源測位:複数のマイクにより話者の位置を特定し、話声をリアルタイムで波形にしてボイスレコーダーの画面上に表示する。非人間音声フィルタリング:人の声以外の雑音を自動でカットする。高ゲインノイズリダクション:ノイズリダクションで、人の声を明瞭にし、音声反訳の精度を30%向上させた。

・音声反訳 中国語と英語の混合音声反訳をサポートし、英語、日本語、韓国語、ロシア語、フランス語、ベトナム語、スペイン語の7カ国語に加え、広東語、河南語、四川語、重慶語など12地方の方言を新たに追加、少数民族のチベット語やウイグル語の音声反訳もサポートする。金融、貿易、医療など7分野の専門用語の音声反訳も可能。

・編集 話の内容に従って段落を分割する。録音と音声反訳の結果に従って話者を自動的に区別する。ケバ取り、摘要の作成なども自動で行えるようになった。

製品アップデートの背後にはテクノロジーの進化がある。中国語と英語の混合音声反訳を例にとると、このテクノロジーは音声認識の分野ではかねてから難しいとされており、学術研究から製品化への道のりには多くの障害があった。科大訊飛は3年でこの難題を克服し、第2世代エンジンを第3世代エンジンにアップグレードし、技術レベルからエンド・ツー・エンドの音声認識を実現し、製品化にこぎつけた。数々の技術イノベーションを成し遂げる科大訊飛のAI研究所は中国の公共部門に属し、それらの技術力をベースとしてAI+玩具(児童用学習ロボット「Alpha Egg」やスマートデスクライトなど)、AI+学習(学習支援タブレット、英語学習支援タブレットなど)、AI+オフィス(翻訳機、レコーダー、電子ノートなど)といったさまざまな製品ジャンルが生み出されている。

AI技術を搭載したボイスレコーダーに対して、市場は良好な反応を示した。2019年、科大訊飛コンシューマービジネスの売上高は、前年比43.99%増の36億2500万元(約550億円)に達し、同社の総売上高の35.96%を占めた。同社のAIボイスレコーダーは「京東(JD.com)」が毎年6月18日に開催する「618セール」で売上ナンバーワンに輝いた。また11月11日にちなんで開催される中国ネット通販イベント「双11(ダブルイレブン)」では、京東と「天猫(Tmall)」の売上高ランキングで、ボイスレコーダー部門と単品売上高部門の二冠を達成している。ユーザーエクスペリエンスを保障するために、科大訊飛はオフラインストアも拡張してきた。科大訊飛は昨年一年間に、ITデジタルストアや家電量販チェーン「国美零售(GOME Retail)」「蘇寧易購(Suning.com)」「迪信通(D.PHONE)」など累計2000店舗に販路を広げたが、今年は3000店舗に増やす見通しだ。胡氏によれば、2019年のコンシューマービジネス製品のオンラインとオフラインにおける売上高は基本的に半々だったが、将来的には両方のチャネルをさらに拡張し、オンラインとオフラインの比率を3:7に調整する可能性があるという。

科大訊飛は海外市場にも事業を展開しており、現在、同社のボイスレコーダーは115カ国の646都市で販売されている。胡氏は、国外のボイスレコーダー製品市場は中国ほど進んでいないため、中国のAIボイスレコーダーを国外でPRする際に一定のアドバンテージがあると語った。

録音から音声反訳へ、従来品からAI製品へ、既成の枠を超えたボイスレコーダーが今後どのような形態に発展するのか、業界全体で共に考える必要があるだろう。AIボイスレコーダーの新機種開発では、技術の進歩の速さと消費者潜在ニーズに対する業界の理解度がカギとなる。
(翻訳・永野倫子)

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録