36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
AR(拡張現実)とAIを組み合わせた企業向けサービスを展開する「亮亮視野科技(LLVision Technology)」が、音声をテキストにリアルタイム変換する聴覚障害者向けのARグラスを発表した。
亮亮視野はAR関連の光学およびディスプレイモジュールを開発・製造する。AR機器の設計・製造、AR関連のソフトやアルゴリズムの開発、顧客企業の複雑な業務環境にあわせたカスタマイズ開発、AR導入シナリオに基づくSaaSを手がけている。
聴覚障害者のメタバース(仮想世界)
ARはまったく新しいインタラクションの形式だ。AR機器は視覚に近い位置で画像を主体としたインタラクションを展開する。パソコンやモバイル端末、スマートウォッチなどのウェアラブル端末と同様に、将来的には多くの人にサービスを提供し、スマートフォンなどのモバイル端末と長期的に共存する、あるいは代替するようになる可能性もある。
聴覚障害者向けのAR製品については、亮亮視野は事前調査でユーザーのニーズや大量のデータを掴んでいた。聴覚障害者はマイノリティとして多くの悩みを抱えている。主に生活上の負担が健常者よりも多いことだが、人工内耳手術は30〜50万元(約510〜840万円)と高額になることも多く、手術以外にも電池などの消耗品に費用がかかる。健常者との会話では読唇法を使うため、相手の口元をずっと注視し続ければならない。それでも理解できるのは会話の半分ほどで、会話の間は緊張状態が続く。就業環境ではさらなる困難にさらされる。相手とのコミュニケーションが対面でない場合、相手の口元を見ることはできず、誰かが替わってくれなければ会話に反応することもできない。
亮亮視野は聴覚障害者のリアルな需要に応える合理的なソリューションをずっと探してきた。AIの重要な応用分野であるNLP(神経言語プログラミング)が進化したことで、音声からリアルタイムで語義を認識し、自動翻訳を行うプロセスは高い正確度で行えるようになった。エッジ処理を行うAIチップ、5G通信、クラウド処理もリアルタイムかつ双方向にデータ通信を行うのに十分な能力を備えた。さらにウェーブガイド(導波管)やディスプレイモジュールが軽量化できたことで、長時間の装着も可能になった。これらを背景に、同社は次世代ARグラスとクラウドネイティブの音声認識機能(バイトダンス傘下のビッグデータ&AIサービス「火山引擎(VolcEngine)」が提供)、機械翻訳サービスを統合し、聴覚障害者がバリアフリーで交流できるプラットフォームを構築した。
試しに装着し、複数の人と会話をしていると、確かに重みがあり、一日中装着し続けることは無理だ。しかし透光性や視野角(FOV)は良好で、フレームの太い眼鏡をかけているのと感覚は大差ない。表示される文字もはっきりしており、音声をテキスト表示するまでは3〜5文字分の遅れにとどまっている。距離や方向の異なる複数の人物との会話でもテキストの表示はスムーズで、同音異義語は文章の前後関係から即時修正される。
産業での実用化を模索
亮亮視野はARおよびAI関連の技術を統合し、企業向けにSaaSを提供する。
一例としては、航空会社に機体整備用のARプラットフォームを提供している。また、従来型の製造企業にはARをベースとした運用・保守プラットフォームを提供する。技術者がSaaSを用いれば、遠隔でなおかつ精確に、複数の現場のオペレーションが可能になる。また、操作画面を通じて各工程の操作規定を受信し、業務過程を記録した動画などのデータを保存できる。
中国南方航空との提携プロジェクトでは、現場の地上人員とともに機体の全整備作業を完了させ、同社のソリューションは一次資料を入手した。これを南方航空から提供された十数年分の運営データと統合し、スマートアノテーションや機械学習を通じて整備業務用のスマートプラットフォームを開発。導入によって50%以上の効率化を果たしたという。
(翻訳・愛玉)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録