深層学習技術を活用したOCR「睿琪」、伝票の入力効率100倍に

36Kr Japan | 中国No.1スタートアップメディア日本版

中国最大のタートアップメディア、36Krの日本版です。先端企業の技術開発、業務提携、ファイナンス状況など中国の「今」を現地から届けるとともに、日本人向けの解説などのオリジナル記事を発信します。36Kr日本版を見れば、中国が分かります。

ビジネス注目記事

深層学習技術を活用したOCR「睿琪」、伝票の入力効率100倍に

続きを読む

企業管理の業務効率化には大量の構造化データの蓄積が不可欠だが、財務部門ではいまだに領収証などの伝票を手入力しており、効率が悪くミスも避けられない。こうした問題を解決するのが「睿琪(Glority)スマート伝票識別プラットフォーム」(以下、睿琪)だ。AIを活用して伝票を自動的に処理することで、手入力だと50時間かかる1000件分の入力時間を30分にまで短縮できる。

睿琪は紙の伝票をスキャンまたは撮影するだけで、その画像を構造化データに変換することが可能。画像1件あたりの識別に要する時間は1秒足らずで、サイズを自動で検出したり、複数枚を一括で識別したりする機能もある。さらに、データの重複排除処理、指定されたフォームへの取り込み、伝票の分類と画像データ保管を自動的に行うこともできる。

明確なニーズがあることや文書形式の標準化が進んだことから、伝票識別のOCR(光学文字認識)市場は他の分野に比べて成熟している。この数年、深層学習の発展でOCR技術の実用性が一段と高まった。睿琪を開発した「杭州睿琪软件有限公司(Hangzhou Glority Software)」CEOの徐青松氏によると、従来のOCR技術の弱点はテンプレートマッチングや特徴抽出に依存し、画像認識における要求水準が高く、字体の差異、不鮮明さ、背景など識別を妨害する要因への対応力に欠けていることだった。一方、睿琪が採用する畳み込みニューラルネットワーク(CNN)を用いたOCR技術は文字記号や画像の特徴を自動的に抽出して分類することが可能で、認識率は95%(伝票の正解率が95%)に上り、画像の質に対する高い適合性を持つ。

睿琪は、すでに増値税領収書のほか、タクシー・バス・有料道路通行料金の領収書、国際線航空券など13種類の書類を識別する機能を備え、既存製品の中で識別対象範囲が最も広い。機能の拡張性も高く、ニューラルネットワークを開発・訓練することにより、2週間で新たな伝票タイプを識別できるようになるという。

製品形態としては大企業向けのソフト・ハード一体型モデル、多国籍企業向けプライベートクラウド対応モデルがある。さらに、中小企業向けのコストパフォーマンスに優れた手軽なSaaS対応モデル、識別機能を導入したい財務系ソフトウエア企業向けのモバイルSDKとAPI、エンドユーザー向けのアプリ「票小秘(PiaoXiaoMi)」がある。

昨年9月の発売以降、睿琪を導入した企業は100社を超えた。ソフトウエア大手「金蝶集団(Kingdee)」、経費精算サービスの「毎刻報銷(maycur.com)」や「易快報(EKuaibao)」、OAソフトウエア「泛微OA(Weaver)」などのメーカーも睿琪の伝票識別技術を導入している。

ところで、紙の伝票の効率の低さに関しては、AI活用よりも伝票自体の電子化が根本的な解決となると思われる。国を挙げての電子化推進により、伝票識別製品市場は圧迫されるようになるのではないだろうか。

その問いに対する徐氏の答えは「イエス」だ。だが、現時点では膨大な数の紙の伝票が存在しており、3~5年はスマート識別ツールの需要がなくなることはないとみている。睿琪も対応言語を徐々に増やし、グローバルな貿易環境の中で海外の伝票もスピーディーに処理できるようにするほか、対応する伝票タイプも拡大していく構えだ。さらに、証明書・ドキュメント・契約書など、より多くの対象をデータ構造化の範囲に組み入れることも計画している。(翻訳・池田晃子)

関連キーワード

メールアドレスを登録して中国最新情報入手