原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
2年前2017年の10月24日、人工知能を活用した音声認証分野最大手の「科大訊飛(iFLYTEK)」が安徽省で第一回AI開発者向けイベントを開催し、初めて「1024計画」を発表した。そして、今年の10月24日の第3回イベントをもって、同計画もバージョン3.0にアップデートされた。
同イベントでは、輪番総裁の胡郁氏が、今後1024計画の規模を拡大し、商品やサービスの質の向上を目指していると語った。規模の拡大は実現しつつあるが、質の高上は容易ではない。ハードウェアについては、同社は今年5月、一気に翻訳機、スマートボイスレコーダー、転写機、子供向けスマート勉強機等、5種類の商品を発表した。
ソフトウェアについても、教育、医療、司法、自動車等の応用シーンに関してより多くのサービスを提供し始め、AIoT(AIとIoTを組み合わせた造語)のOSのiFLYOSもアップグレードされ、AIとの接続をより速くした。
また、ICタグの開発も進んでいる。今年の開発者向けイベントでは、「穹天科技(Qiongtian Technology)」と連携して、家電製品専用音声ICタグCSK400Xシリーズを発表した。
新しい技術
科大訊飛は「名探偵コナン」が使うようなボイスチェンジャーも開発した。これは音声合成技術の成果だ。
これまでにAIが人間を驚かせた時と同様に、ボイスチェンジャー技術のデモンストレーションも印象深いものだった。しかし、より印象深いのは、この技術を第三者にオープンにすると発表されたことである。
以前、Google、マイクロソフトやバイドゥ(百度)も人間の声を模倣し電話ができるロボットを発表した。そのいずれに対しても、技術が詐欺やいたずらに悪用されるのではないかとの懸念がささやかれた。科大訊飛の技術は、上記の先行企業より危険に思われる。
同社の技術担当者によると、同技術の第三者へのオープンは慎重に進める予定だという。技術の濫用を防ぐために、善良な目的のみの使用になるよう、信頼性の高い業者にしかオープンにしないとのことだ。
また、それほど危険ではなさそうな技術もある。例えば、機械の読解力の向上がその一例だ。医療分野での応用が可能で、これまでの生活習慣病の診断サポートから、難病の診断サポートへ発展し、900余りの治療分野をカバーできるようになった。それに伴い難易度が高まったにも関わらず、正確度は60%超に至っている。また、科大訊飛が不得手だった画像認識技術も進歩した。
2つの新しいプラットフォーム
科大訊飛はオープンプラットフォームについても調整を行い、開発者により多くの権限を与える。また、開発者向けに簡便な方法で各種機能の組み合わせができる「帰雲プラットフォーム」を発表した。
同社の開発担当者によると、翻訳機が翻訳ソフトウェアより使いやすい理由は、前者が同時に音声認識、機械翻訳、音声合成の3つの技術を利用できるからだ。しかし、仮にソフトウェアのユーザー端末で同時に3つの技術を運用すると、時間が大幅に増えるという。
今後は、帰雲プラットフォームでも3つの技術を統合し、1つのインターフェースで対応可能となり、プロトコルデータの互換性の懸念もなくなるという。
もう一つ「飛雲プラットフォーム」の開発も進んでいる。科大訊飛によると、AI研究開発能力があるがサービス化が困難な開発者向けに、飛雲プラットフォームを開発したという。このプラットフォームは開発者が開発能力をクラウドにアップロードし、クラウドプラットフォームがサービスを提供する形だ。開発者たちは開発の効果と効率のみに集中すればよいとのことだ。
上記2つの製品は近いうちにローンチされるという。
今回のイベント終了後、科大訊飛は最新の業績報告を公表した。財務データによると、2019年1月~9月の売上が65.73億元(約1050億円)、前年同期比で24.41%増加した。親会社に帰属する経常利益が3.74億元(約60億円)で、前年同期比70.51%増加。親会社に帰属する営業利益が6981.43万元(約11億円)で、前年同期比で183.49%増加した。1株当り利益が0.18元(約3円)で、前年同期比63.64%増加となった。
この成長率は大手AI企業の中でもトップクラスに当たる。また、同報告によると、2019年第1~第3四半期の業績が大幅に伸びた要因として、AI産業の持続的な成長が挙げられる。また、オープンプラットフォームや一般消費者に関わる教育、医療等の分野での成長も著しいという。
(翻訳:小六)
※トップ画像は科大訊飛提供
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録