中国AIユニコーンの大規模言語モデル、「幻覚症状」評価でChatGPTやGemini超え

生成AIがもっともらしい誤答をするハルシネーション(幻覚)の発生率を比較する評価モデル「HHEM-2.1-Open」で、中国の智譜AI(Zhipu AI)が開発したオープンソースの大規模言語モデル「GLM-4-9B」が、OpenAIのChatGPTやGoogleのGeminiを抑えて首位に立った。評価対象は85モデル。GLM-4-9Bの解答率は100%で、幻覚率は1.3%(正答率98.7%)だった。

智譜AIは2023年3月、パラメーター数1000億のオープンソースの対話型AI「ChatGLM」を発表した。その後も独自の大規模言語モデル「GLM」を4回アップデートし、すでに20以上のAIモデルやプロダクトを公開している。GLM-4-9Bは、2024年6月初めにGLMシリーズの第4世代として発表された。

同社は2019年に設立され、清華大学が開発した大規模言語モデルをベースに技術を発展させてきた。24年12月に30億元(約630億円)を調達した際は、すでに事前の評価額が200億元(約4200億円)に達していた。

中国の生成AIユニコーン「Zhipu AI」が新たに660億円調達。OpenAIに追随、AIエージェントもリリース

*1元=約21円で計算しています。

(36Kr Japan編集部)

日本企業のDXを促進するプラットフォーム「CONNECTO」
無料コンテンツ公開中

最新記事