36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国の人工知能(AI)スタートアップ「DeepSeek」がオープンソースの実験的な大規模言語モデル(LLM)「V3.2-Exp」を公開した。計算量を減らし効率化する技術「スパース・アテンション」を初めて採用し、出力精度にほとんど影響を与えずに、長文の学習と推論効率を大幅に向上させた。同社はこれを「次世代のアーキテクチャに向けた中間的なステップ」と位置付けている。
この改善によりサービスコストが低下したため、同社はV3.2-Expの価格を改定し、 API利用コストを50%以上引き下げた。値下げ幅最大は出力トークンで、100万トークンあたり3元(約63円)と、8月に公開された「V3.1」の25%程度にとどまる。
中国通信機器大手、華為技術(ファーウェイ)のクラウド部門、華為雲(ファーウェイクラウド)やクラウドコンピューティングサービス「派欧雲計算(PPIO)」「優刻得科技(U Cloud)」などは、既にV3.2-Expの提供を開始している。ファーウェイのほか、AI向け半導体メーカー「中科寒武紀科技(カンブリコン)」「海光信息技術(HYGON)」などもV3.2-Expへの対応を発表している。
同社によると、「V3.2-Exp」は実験的なバージョンであり、公開評価セットで有効性は確認されたものの、特定の場面で十分に機能しない可能性を排除するため、実際の利用環境でより大規模な検証が必要だという。
*1元=約21円で計算しています。
(36Kr Japan編集部)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録