大ヒットSF小説「三体」80万字をわずか数秒で要約!中国の大規模言語モデル、超長文処理の時代へ

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

EXCITEのRSSに登録大企業スタートアップ注目記事

大ヒットSF小説「三体」80万字をわずか数秒で要約!中国の大規模言語モデル、超長文処理の時代へ

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

話題の中国の人工知能(AI)企業「月之暗面(Moonshot AI)」は3月18日、同社が開発した大規模言語モデル(LLM)に基づく生成AI「Kimi」が200万字の長文に対応できるようになったと発表した。5カ月前の公開当初の対応文字数20万字の10倍にあたる。Kimiのアップグレードは、長文対応の大規模言語モデル「LLLM」分野の競争が激化するきっかけとなった。

話題の中国LLMユニコーン「Moonshot AI」、独自のAIチャットボットが200万字の超長文対応可能に

アリババグループはこのほど、同社の生成AI「通義千問(Tongyi Qianwen)」が最大1000万字の長文処理能力を完全無料で一般公開すると発表した。これにより、金融や医療、科学研究分野に携わるユーザーが、より迅速に重要なキーワードを抽出し、文書の要約や資料をまとめる時間を節約できるようになる。 

百度(バイドゥ)もこのほど、4月から同社の生成AI「文心一言(ERNIE Bot)」が200万~500万字の長文処理機能を無料公開すると発表した。従来の最大2万8000字に比べ、処理能力が100倍以上に向上した。

処理能力を具体的に示すと、Kimiは20万字の長編小説を約20秒でまとめられる。通文千義ならば、約80万字の超長編SF小説「三体」を数秒で要約できる。

「通文千義」によるSF小説「三体」の要約

ちなみに、米OpenAIの「GPT-4 Turbo-128k」が処理可能なテキストは漢字約10万字、長文に特化した米Anthropicの「Claude3-200K」でも約16万字だという。

長いコンテキストを扱えるようになれば、生成AIアプリの使い勝手や専門性は高まる。しかし、処理可能なコンテキストが長いだけでは不十分で、ユーザーは記憶や推論の能力も求めている。長さを過度に追求すると、演算能力の不足につながる可能性もある。

(36Kr Japan編集部)

7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録