イマドキの「AIニュースキャスター」は高い完成度、捜狗が発表

36Kr Japan | 中国No.1スタートアップメディア日本版

中国最大のタートアップメディア、36Krの日本版です。先端企業の技術開発、業務提携、ファイナンス状況など中国の「今」を現地から届けるとともに、日本人向けの解説などのオリジナル記事を発信します。36Kr日本版を見れば、中国が分かります。

テクノロジー

イマドキの「AIニュースキャスター」は高い完成度、捜狗が発表

続きを読む

7日、浙江省烏鎮で開催された「第5回世界インターネット大会」で、中国インターネット検索大手「捜狗(Sogou)」と国営メディア「新華社」が共同開発した世界初の「AI(人工知能)ニュースキャスター」が披露された。

この「AIニュースキャスター」は、人間のニュースキャスターが話す声、唇の動き、表情の変化などの特性を抽出し、それらを合成。リアルな声と表情、自然な唇の動きが再現されており、実際のキャスターと比較しても違和感のない完成度を誇る。

捜狗と言えば、先日開催された「2018年音声翻訳技術のための国際評価ワークショップ(IWSLT)」で、ライバルのアイフライテック(科大訊飛、iFLYTEK)やアリババ(阿里巴巴)、AppTek(Applications Technology)、KIT(カールスルーエ工科大学)、AFRL(米空軍研究所)といった世界トップレベルの企業や研究機関を抑え、見事に優勝した。

IWSLT2018のコンペティション結果
捜狗がこれまで獲得してきた賞

捜狗のAI戦略は音声を中心に展開されており、対話、問答、翻訳、言語による自然なコミュニケーション技術を開発している。

2012年、同社は音声認識技術研究に着手。ディープラーニング技術の研究を進め、音声入力ツールや地図の音声ナビなどに活かされた。2015年には、E2Eのニューラルネットワークを用いた機械翻訳が盛んになり、同社も参入。2016年8月、音声対話エンジン「知音」をローンチし、ウェアラブル端末、車載設備、テレビ、家具などに搭載できる「知音OSプラットフォーム」を開発した。2017年7月にはテレマティクスサービスを提供し、ユーザーが「搜狗地図」を使用する際に音声で操作できるようになった。そして翌8月には、音声を自動でテキスト化するアプリ「捜狗聴写」をローンチ。今年は旅行者向けポータブル翻訳機「旅行翻訳宝」、ペン型音声翻訳レコーダー「搜狗録音翻訳筆」も発売した。スマホ向け入力アプリ「捜狗手機輸入法」では、1日平均5億回の音声入力があったという。

搜狗は、ライバルのアイフライテックよりもかなり遅れて音声認識の分野に参入したが、飛躍的な発展を遂げた。この点について、捜狗の音声技術研究チームは「かつてはGMM-HMM理論の骨組みに基づいて作られていたが、2010年のディープラーニング技術の登場によって開発環境が大きく変わり、結果として捜狗など後発企業に挽回するチャンスをもたらした」と36Krに見解を述べた。
(翻訳・飯塚竜二)

メールアドレスを登録して中国最新情報入手