うつ病、30秒の会話音声で診断 北京大学の病院とAIスタートアップが共同研究

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

日経スタートアップ注目記事

うつ病、30秒の会話音声で診断 北京大学の病院とAIスタートアップが共同研究

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

世界では10億人がメンタル面の問題を抱えているというデータがある。中でもうつ病は健康を大きく損なう深刻な病気だ。

WHO(世界保健機関)のレポートによると、世界では3億人以上がうつ病に罹患していると推測され、平均発症率は4.4%とされている。中国では生涯有病率が6.8%にもなるという。また、疾病負荷ではうつ病が2030年までに世界最大になると予想されている。

多くのうつ病患者は医療アクセシビリティなどが理由で誤診を受けたり、必要な支援にたどり着けなかったりするのが現状だ。うつ病の診断はこれまで精神科の専門医が問診や患者の観察を行い、診断基準に基づいて行われてきた。しかし中国では精神科の医師が不足し、うつ病の診断が一層困難になっている。中国の精神科医は2017年時点で2万7000人。国民10万人に対して平均2人の割合だった。WHOのデータによると、ロシアでは国民10万人に対して精神科医は11人、米国では12人だ。中国でも20年になると精神科医は4万人にまで増えたが、中国の人口を考慮するとそれでもかなり不足している。

また、患者自身が症状の重さを自覚していなかったり、医師に対して病状を偽ったりすることもあり、従来の診断方法では診断を誤るケースもしばしば存在する。

近年、生理データや心理データを非侵襲的かつ継続的に観測するのにモバイル端末向けのAI技術やウェアラブル端末が大いに活躍している。同時に、意味認識や機械翻訳などの技術が徐々に成熟し、音響学や音声コマンド処理が進歩したことで、診断に用いられる新興分野として機械学習が浮上してきた。

人間の声は神経や筋肉が複雑に協調しあう過程で生じる。肺からの空気が声帯を通過することで声帯を震わせ、声帯の共鳴や共振によって声が生じるのだが、人間の声は音響学的なデータに加え、言語、感情といった複雑な情報も伝える。また、うつ病患者の話し声は抑揚に欠け、単調で声量もないことが過去数十年の研究からわかっている。

現在では声帯音源特性、周波数特性、韻律的特徴など一連の音響学的な特徴がうつ病の特定要素になっている。機械学習ならば人の耳では捉えられないような音響学的特徴の客観的変化を検出することができ、うつ病など精神疾患の発見にも目覚ましいポテンシャルを発揮する。

中国では19年、北京大学第六医院の岳偉華教授の研究チームと音声AIを手がける企業「宇音数康(Voice Health Tech)」が音声を用いたうつ病スクリーニング評価の共同研究プロジェクトを開始している。同プロジェクトは研究デザイン、倫理審査、データ収集、技術開発などの段階を経て、現在は臨床研究に進んでいる。

プロジェクトチームは22年11月、国際精神医学誌「Frontiers in Psychiatry」で臨床研究論文を発表した。純粋な音響信号処理用深層学習モデルをベースにした方法を用い、スマートフォンからの約30秒の音声でうつ病診断が可能になり、感度は82.14%、特異度は80.65%に達したという。より厳しい評価基準(DSM-5:精神疾患の診断・統計マニュアル第5版)を用いても、この深層学習モデルが臨床研究で発揮したパフォーマンスは欧米の関連企業が出した数値を超えるものだったという。

同プロジェクトの音声モデルは4万3000もの臨床会話から成るデータセットを用いてトレーニングを施したもので、独立した検証用データセットでもテストと研究を重ねてきた。会話データを採取した患者はいずれもDSM-5に基づいて診断を受けており、収録はさまざまなスマートフォンを使い、さまざまな環境で行われた。

「これは世界の関連領域でも現段階で最高品質のデータセットかもしれない」。宇音数康の共同創業者でCMO(最高医学責任者)の何恭誠氏はこう述べている。

遠くない将来、うつ病などのメンタル問題に悩む人々がプライバシーが保たれた環境でたった30秒の音声収録をするだけで、客観的かつ専門的な診断結果が簡単に得られるようになるかもしれない。

(翻訳・山下にか)

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録