36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国EC大手京東(JD.com)主導のEC商戦「618セール」(6月18日前後に行われる中国ECサイトのスーパーセール)が今年も幕を開けた。今年ではAIショッピングアドバイザーのチャットボット「JOY」が注目を集まった。これは京東のキャラクターをモチーフにしたAIロボットで、ユーザーからの「618」に関するさまざまな質問に答えてくれる上、雑談も可能だという。
この「JOY」のすぐれた対話能力は、ニューラルネットワークとディープラーニングのコアテクノロジーに特化したAI企業「深思考人工智能(iDeepWise.ai)」のオープンドメインターゲットによる生成型対話サービス技術によるものだ。新しい技術の進歩にともない、AIのビジネス化が着実に推し進められている。
AIチャットボットの背後にあるテクノロジーとは
AIによるマンマシン対話の実用化は多くのシーンで見られる。これらの対話の背後にはマンマシン対話技術があり、最も中核となるのが自然言語処理(NLP)だ。AIによるカスタマーサービスが最もよく見かけるシーンではないだろうか。ただ、AIの自然言語処理がうまくできない、または意味の理解がしっかり行えないことが多い。
これまでのマンマシンインターフェースによる対話は、そのほとんどが一定の「ルール」によって行われていた。システム内で決められたキーワードがあり、ユーザーがそのキーワードを発すると設定されたフレーズでの対話を行う。しかし複雑な質問になると歯が立たず、とんちんかんなやりとりとなっていたのが現状だ。
前掲の画像のようなかみ合わないやりとりでもiDeepWise.aiの自然言語理解とマンマシン対話技術を用いれば、以下のような対話が可能となる。
iDeepWise.aiは、データとAIモデルによる自然言語処理、機械読み取り理解(MRC)を組み合わせたマンマシン対話製品を中心的なプロダクトとしている。自社開発のマルチモーダル自然言語理解エンジンは、自然言語生成(NLG)、MRC、DM(対話管理)などのタスクをベースに改良を加え、AIにユーザーの自然言語を理解させ的確に回答させる仕組みだ。
ユーザーが意図することを正確に読み取るのと同時に、マルチモーダル自然言語理解エンジンによって対話中にユーザーへの理解を深め、ユーザーごとの対話やリコメンドを行うことが可能だ。
このほか、チャットボットはシーンごとに異なる「キャラ設定」ができ、ユーザーはAIチャットボットと感情を通い合わせるような独自の体験ができる。
高度なマルチモーダル自然言語理解技術により、iDeepWise.aiはAIによるマンマシン対話分野でトップを走っている。今年6月、世界の企業・機関1000社余りが集まった「言語・スマート技術コンテスト2020」では、優秀な成績でロボット部門とAI部門のいずれにおいても1位となり、世界チャンピオンとなった。
iDeepWise.aiの開発チームが開発した「多ソース整合デコーダ」のディープニューラルネットワークモデル技術は、AIマンマシン対話においてユーザーとのスムーズなやりとりや自発的な意志疎通をサポートする。また、MRCシステムによるユーザー意図の読取り、ユーザー画像、ゴールプログラミングなどと結びつけることで、より多くのシーンでの応用が可能となり、複数シーンへのマイグレーションも瞬時に可能となる。
マルチモーダル自然言語理解エンジン「iDeepwise.ai 5.0」はすでに正式に発表されており、このバージョンでは非構造化音声、動画、テキストの読取りと理解が可能だ。チャットボットにインターネット上の音声、動画、テキストを常に読み取らせれば、チャットボットが人間の言語をより正確に理解する日もそう遠くはないと思われる。
「iDeepwise.ai 5.0」は、EC、銀行、保険業、スピーカー、スマホ、車載デバイス、スマートテレビなどのスマート端末、ゲーム、バーチャルアイドルなど多くのシーンでの実用化が可能だ。
上述のマルチモーダル自然言語理解とは、簡単に言えば、ロボットが人間の言葉を「見て、聞いて、読んで分かる」ことだ。同社のAIマルチモーダル自然言語理解技術では、チャットボットが動画や画像を理解できるほか、音声を聞き取り、テキストの内容を理解できるなど非構造化情報の背後にある含意までも理解することが可能だ。
チャットボットはいかにして読取り理解しているのかといえば、MRC技術によるところが大きい。MRC分野においてもiDeepwise.aiの業績は優れている。19年の中国語機械読取り理解コンテストで、同社開発の「BMANet2.0モデル」が日本のヴイストン社のコミュニケーションロボット「Sota(ソータ)」の記録を刷新し、世界一となった。
AIのビジネス化の新型インフラとなる
産業界では現在、マルチモーダル自然言語理解が各業界、業種におけるAIの大規模なビジネス化に向けた重要なインフラであるとの見方が広がっている。この背後にあるロジックは単純明快で、現実世界自体が多元的であるというものだ。
マルチモーダル自然言語理解には多情報処理能力が備わっており、医療、EC、オンライン教育など応用シーンはより広範に及ぶ。現実のシーンも多種多様にわたり、人間の社交シーンも多様化しているからだ。人間は面と向かって相手の様子、仕草、表情、声のトーンを見たり聞いたりしつつ、対話と音声、視覚などの多くの情報から相手の意図するところを読み取ろうとしている。
AIによる自然言語処理は多くのビジネスチャンスを含んでいる。AI業界の新たなインフラとなることが期待されている。
マンマシン対話、MRC、マルチモーダル自然言語理解分野での技術の蓄積により、スマート医療、スマートライフ、スマートビジネスの三大AI応用シーンでiDeepWise.aiの技術が取り入れられている。「iDeepWise5.0」マルチモーダル自然言語理解エンジンの応用シーンも広がり続けており、バーチャルアイドル、二次元プラットフォーム、ゲーム分野などで新天地を開拓している。iDeepWise.aiは、チャットボットに人間を理解させ、未来へつながる道を常に模索している。
(翻訳:lumu)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録