イマドキの「AIニュースキャスター」は高い完成度、捜狗が発表

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

テクノロジー

イマドキの「AIニュースキャスター」は高い完成度、捜狗が発表

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

7日、浙江省烏鎮で開催された「第5回世界インターネット大会」で、中国インターネット検索大手「捜狗(Sogou)」と国営メディア「新華社」が共同開発した世界初の「AI(人工知能)ニュースキャスター」が披露された。

この「AIニュースキャスター」は、人間のニュースキャスターが話す声、唇の動き、表情の変化などの特性を抽出し、それらを合成。リアルな声と表情、自然な唇の動きが再現されており、実際のキャスターと比較しても違和感のない完成度を誇る。

捜狗と言えば、先日開催された「2018年音声翻訳技術のための国際評価ワークショップ(IWSLT)」で、ライバルのアイフライテック(科大訊飛、iFLYTEK)やアリババ(阿里巴巴)、AppTek(Applications Technology)、KIT(カールスルーエ工科大学)、AFRL(米空軍研究所)といった世界トップレベルの企業や研究機関を抑え、見事に優勝した。

IWSLT2018のコンペティション結果
捜狗がこれまで獲得してきた賞

捜狗のAI戦略は音声を中心に展開されており、対話、問答、翻訳、言語による自然なコミュニケーション技術を開発している。

2012年、同社は音声認識技術研究に着手。ディープラーニング技術の研究を進め、音声入力ツールや地図の音声ナビなどに活かされた。2015年には、E2Eのニューラルネットワークを用いた機械翻訳が盛んになり、同社も参入。2016年8月、音声対話エンジン「知音」をローンチし、ウェアラブル端末、車載設備、テレビ、家具などに搭載できる「知音OSプラットフォーム」を開発した。2017年7月にはテレマティクスサービスを提供し、ユーザーが「搜狗地図」を使用する際に音声で操作できるようになった。そして翌8月には、音声を自動でテキスト化するアプリ「捜狗聴写」をローンチ。今年は旅行者向けポータブル翻訳機「旅行翻訳宝」、ペン型音声翻訳レコーダー「搜狗録音翻訳筆」も発売した。スマホ向け入力アプリ「捜狗手機輸入法」では、1日平均5億回の音声入力があったという。

搜狗は、ライバルのアイフライテックよりもかなり遅れて音声認識の分野に参入したが、飛躍的な発展を遂げた。この点について、捜狗の音声技術研究チームは「かつてはGMM-HMM理論の骨組みに基づいて作られていたが、2010年のディープラーニング技術の登場によって開発環境が大きく変わり、結果として捜狗など後発企業に挽回するチャンスをもたらした」と36Krに見解を述べた。
(翻訳・飯塚竜二)

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録