アリババのインテリジェントビジョンシステム　「AI機能が感知から認知へと進化」

2020年3月6日011124

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

近年、ディープラーニング、データ処理能力の向上、クラウドインフラの迅速な発展により、インテリジェントビジョンの実用化が広がってきた。この流れの中で、アリババ・グループの「アリババクラウド・インテリジェントビジョンオープンプラットフォーム」（以下「プラットフォーム」と略称）が2019年12月にβテストを終え、無事ローンチされた。

この度は、36Krは同プラットフォームの責任者である謝宣松氏に取材し、サービスの詳細とプラットフォームを開発した「阿里達磨院（Alibaba DAMO Academy for Discovery）」のインテリジェントビジョンにおける考え方を聞いた。

ーー達磨院はアリババのなかで最先端技術の研究を行う部署ですが、具体的にはどのような位置づけでしょうか。

「達磨院は2017年に設立された。研究開発においては、より長期的な影響力を持つ技術を中心に行い、また実用化のためのサポートもしている。現在の達磨院は他部署との共同開発が増えている。総じて言えば、達磨院はアリババクラウドを技術面から支えることで、アリババ・グループの内部システムに関する基礎的な業務に従事しているということだ」

ーーなぜオープンプラットフォームを開発したのでしょうか。

「アリババ・グループ内にはインテリジェントビジョンに関する基礎的な能力が多数蓄積されているが、これらの能力を一括管理できる窓口やブランドがなかった。そこでプラットフォームを新たに作ろうと考えた」

「このプラットフォームはインテリジェントビジョンの中核部品のサプライヤーのようなものだ。アリババ自身が開発した部品もあれば、サードパーティのものもある。また、プラットフォームには大量の実用化事例があり、開発者はここでより効率よく開発をすることができる。グループの内外を問わず、すべてのユーザーがプラットフォームを使用できるようになっている」

ーープラットフォームにはどのような基礎的な能力が集約されているのでしょうか。

「プラットフォームはインテリジェントビジョンに関するAIをベースにした能力を提供している。その中には、例えば画像認識、文字認識、動画解析などがある」

ーープラットフォームの料金はいくらでしょうか。

「このサービスはインクルーシブなものだ。現在公開済みのサービスでは、少量、短期間の利用なら無料で、基礎的なユーザーはこれで十分な機能を利用できる」

「プラットフォームの持続的な運営のために、今後はビジネス展開も考えている。プラットフォームには様々な能力があるため、ビジネス展開の戦略も多様なものが考えられる。この点は現在模索中だ」

ーー今年1月初頭、達磨院は2020年技術トレンドトップ10を発表し、その際に最初に挙げたのが「AI機能が感知から認知へと進化」というものでした。これを実現するためにはどのような点でブレークスルーが必要でしょうか。

「感知から認知への変化は単に一歩前進するだけのことではない。この変化が意味するのは、理解することから思考することへの変化、データの蓄積から知識の蓄積への変化であり、さらにコスト削減と実用化の能力も問われる」

「技術面では、少なくとも3つのブレークスルーが必要だと考えている。まずアルゴリズム自体の進化だ。意思決定、推理、生成モデルの強化が必要となる。次に関連技術との連携だ。インテリジェントビジョンとNLP（自然言語処理）、ナレッジグラフなどの連携は、AIの認知機能にとって非常に重要だ。最後に、システム工学における能力の向上だ」

ーーコンピュータビジョン分野でのAI認知機能の実現は、どのシーンで最初に実現されるとお考えでしょうか。

「具体的な予測は難しい。法則に従って考えれば、その条件は、まずデジタル化が進んだ業界であること、次にインテリジェントビジョンが当該業界のアルゴリズムにおいて中心的な役割を果たすこと、さらにスマート化によって大きなビジネスチャンスが期待できることだ」

ーーインテリジェントビジョン分野で注目すべき新たな動きは何でしょうか。

「具体的な例を挙げると、2019年に大きな人気を集めた顔入れ替えアプリや、デジタルヒューマン、2D画像から3Dモデルの製作、自動ファッションデザインなどがある。これらは2Dと3Dの融合、静止画像から動的画像への変換などの技術が使われている。技術としてはまだまだ未熟だが、今後バーチャルとリアルがインタラクションをするために不可欠な技術だ」

（翻訳：小六）

原文はこちら