中国DeepSeekの衝撃・創業者独占取材「中国AIがいつまでも米国の追随者であることはない」

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ編集部お勧め記事注目記事36Krオリジナル

中国DeepSeekの衝撃・創業者独占取材「中国AIがいつまでも米国の追随者であることはない」

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

中国のAIスタートアップ「DeepSeek」が世界のテック業界に衝撃を与えている。驚くほどの低コストで、世界トップレベルの性能を持つAIモデルを提供できることが証明されたからだ。

米OpenAI「o1」に匹敵する性能のAIモデル「DeepSeek-R1」が公開されたのは1月20日。それからわずか1週間後の27日には、そのiOS版アプリが米国と中国のAppStore無料アプリランキングで1位を獲得した。AI関連のアプリがOpenAIの「ChatGPT」を抜いて、米国AppStoreのトップに立ったのは初めてのことであり、あまりの人気ぶりにアクセス過多でサーバーがダウンしたほどだ。

昨年12月末に公開されたオープンソースの「DeepSeek-V3」は、「GPT-4o」並みの性能を目指して開発されたが、桁違いのコストパフォーマンスを誇る。GPT-4oはNVIDIAの高性能GPU「H100」を1万枚以上使用し、そのトレーニングコストは約1億ドル(約155億円)と言われる。一方、DeepSeek-V3のトレーニングにかかった費用はわずか557万7000ドル(約8億6000万円)で、しかも米国の輸出規制に対応した中国専用の型落ちGPU「H800」を2048枚利用したという。

OpenAIの共同創業者であるアンドレイ・カーパシー氏は、DeepSeek-V3クラスの性能を実現するには、通常1万6000枚近くのGPUクラスタを必要とすると、SNSに投稿している。

現時点で、DeepSeek-R1のトレーニングに要したコストは公表されていない。しかしDeepSeekが提供しているR1のAPI価格は入力100万トークンあたり1~4元(約20~90円)、出力100万トークンあたり16元(約340円)となっており、OpenAI o1の運用コストの約30分の1にとどまる。

AIトレーニングデータを提供する米ユニコーン企業のScale AIの創業者アレグザンダー・ワン氏も、DeepSeekのAIモデルが米国最高水準の性能に匹敵することを認め、「この10年、AI開発競争において米国はずっと中国の先を行っていたかもしれないが、DeepSeekのAIモデルが登場したことで事態が一変する可能性がある」と語った。

これまで無名の存在だったDeepSeekだが、実は早くも2023年5月に初代モデル「DeepSeek-V1」をリリースしていた。当時の中国メディアは、国内で1万枚以上のGPUを保有する企業は5社以下だとし、そのうちの1社がDeepSeekだと報じている。その背後で支援してきたのは、クオンツ系ヘッジファンドの幻方量化(High-Flyer Quant)だということもわかった。

そして2024年5月6日に、専門家混合(MoE)方式を採用したオープンソースの「DeepSeek-V2」が公開されると、その並外れたコストパフォーマンスに業界は沸いた。推論コストが100万トークンあたりわずか1元(約20円)と、米Meta「Llama3」の7分の1、「GPT-4 Turbo」の実に70分の1にまで抑えられたからだ。

こうしたなか36Krは2024年7月、ほとんど表舞台に姿を現さないDeepSeek創業者の梁文鋒氏にインタビューを行った。同氏はAI研究で知られる中国名門大学の浙江大学出身で、前述の幻方量化の共同創業者でもある。

梁氏はインタビューの中で、今の中国テック業界に特に欠けている考え方――「損得」よりも「価値観」を優先し、「オリジナル」のイノベーションを追究すべきだというスタンスを示した

以下は、そのインタビュー内容を一部編集したもの。

36Kr:DeepSeek-V2の登場によって、中国国内でAIモデルの価格競争を引き起こしました。DeepSeekをAI業界の「ナマズ」(編集部注:異質な存在が外から加わることで市場全体の活力が高まる「ナマズ効果」になぞらえて)だとする見方もありますが、どう思われますか。

梁文鋒氏:決して狙ったわけではなく、結果的に「ナマズ」になったというだけだ。正直ここまで価格(コスト)に対する反応が大きいとは思っていなかった。我々はただ自分たちのペースで開発を進め、そのコストに基づいて適正な価格を決めたに過ぎない。暴利をむさぼるつもりはなく、少しの利益が出ればそれでいいという方針だ

低価格でユーザーを囲い込もうというのではない。AIは誰もが手軽に利用できるものであるべきだと私は考えている。

36Kr:これまで、多くの中国企業は、現行バージョンのLlamaフレームワークをそのまま使ってアプリを開発していました。DeepSeekが新たにAIモデルのフレームワークから手がけたのはどうしてですか?

梁文鋒氏:もしアプリケーション開発が目的なら、Llamaフレームワークをそのまま活用し、短期間で製品を完成させるのも合理的な選択と言える。しかし我々の目指すところはAGI(汎用人工知能)だ。それを実現するには、限られたリソースの中でさらに高い性能を発揮できる新たなフレームワークが必要になる。これはAIモデルをスケールアップするのに欠かせない基礎研究だ。

これ以外にも、データの構築方法や、AIをもっと人間らしくする方法などにも取り組んでいる。これまでに行ってきた膨大な研究が、全て我々のAIモデルに反映されている。しかもLlamaフレームワークは、トレーニング効率や推論コストの面で、海外の最先端レベルと比べて2世代分ほど遅れていると感じる。

36Kr:AIモデルを開発する中国企業の多くが実用面(商業化)で模索を続けているなか、DeepSeekがまず基礎研究に専念することにしたのはなぜですか?

梁文鋒氏:それは今、世界的なイノベーションの流れに乗ることが何よりも重要だと考えているからだ。中国企業はこれまで、誰かが発明した革新技術を応用して速やかに商品開発し、儲けを出すことを得意としていた。しかしこれだけが進むべき道だと考えてはいけない。我々の原点は短期的な利益を追求するのではなく、テクノロジーの最前線に立ってエコシステム全体の成長を推進することだ。

36Kr:インターネット時代やモバイルインターネット時代を通じて、米国は「0から1」へと新たな技術を生み出すことに強みがあり、一方で中国は、技術を製品やサービスに応用して「1から10」にするスキルが優れていると言われることが多いですよね。

梁文鋒氏:中国はいつまでも他者の功績に便乗するのではなく、経済成長に伴って徐々にイノベーションに貢献する側に回らなければならない。過去30年以上にわたるIT化の波の中で、中国はイノベーションに身を投じるよりも、お金儲けに走ってきた。イノベーションは単なる「ビジネスドリブン」によるものだけではなく、好奇心や創造意欲から生まれるものでもある。

中国AIの真の課題:オリジナルと模倣の差

36Kr:DeepSeek-V2がシリコンバレーに衝撃を与えたのはなぜだとお考えですか?

梁文鋒氏:米国では、日々大量のイノベーションがごく普通に生まれている。その中で、DeepSeek V2はとりたてて特別な存在ではない。彼らが驚いたのは、これが中国企業の手によって生まれたことだと思う。これまで追随するばかりだった中国企業が、今回はイノベーターとしてそのフィールドに参入したからだ。

36Kr:とはいえ、せっかく生み出したイノベーションをオープンソースで公開すれば、他社に流用されませんか? 公益団体ではなく営利目的の企業として、どのように自社の競争優位性を形成していくのでしょうか?

梁文鋒氏:常識を打ち破る革新的な技術の前では、クローズドな環境で守られた競争優位性は一時的なものにすぎない。OpenAIは今ソースコードを非公開にしたが、競合他社の追い上げを阻むことはできていない。我々はこうしたプロセスの中で成長し、多くのノウハウを蓄積することで、イノベーションを生み出せる組織や文化を形成していく。これこそが当社の強みと言える。

オープンソースにしたり、論文を発表したりしても何かを失うわけではない。技術者にとっては、むしろ追いかけられる存在になることが何より誇りに思えるのだ。

36Kr:しかしAIモデルの開発では、単に先端技術を持っているだけで絶対的な優位性を築けるわけではありません。今、DeepSeekが追求したいものはいったい何ですか?

梁文鋒氏:我々は、中国のAI技術がいつまでも追随する立場にいるわけではないと考えている。よく「中国のAIは米国に1~2年遅れている」と言われるが、二国間にある本質的なギャップは「オリジナル」と「模倣」という違いにある。

米半導体大手のNVIDIAが今の地位を確立できたのは、単なる一企業の努力というより、西洋の技術コミュニティや産業全体の努力が結実したからだ。中国のAIもこのようなエコシステムの形成が不可欠だ。中国で国産チップの開発がなかなか進まないのも、技術コミュニティのサポートが不足しており、最新の情報が手に入らないからだ。だからこそ、中国でテクノロジーの最前線に立つ人が必要なのだ。

36Kr:OpenAIやMistral AIがオープンソースからクローズドソースへと方針を変えたように、今後ソースコードを非公開化する可能性もありますか?

梁文鋒氏:そのつもりはない。まずは強力な技術エコシステムを作り上げることが何よりも重要だと考えているからだ。

36Kr:資金調達の予定はありますか? 親会社の幻方がDeepSeekの分離上場を計画していると報じたメディアもありましたが。

梁文鋒氏:短期的には資金調達の予定はない。我々にとっては、資金よりも米国による高性能チップの禁輸措置のほうが大きな問題だ。

36Kr:DeepSeekは「桁外れの天才技術者たち」を雇っているとの声もありますが、DeepSeek-V2を支えるのはどんな人材なのでしょうか?

梁文鋒氏:桁外れの天才技術者というわけではない。メンバーは中国国内のトップ大学(編集部注:北京大・清華大が多い)の新卒生のほか、博士後期課程の院生や卒業して間もない若者ばかりだ。

36Kr:中国のAI開発企業の多くは海外からの人材引き抜きに必死になっていますが、「AI分野で特に優れた人材トップ50人のうち中国企業に在籍している人はいない」とも言われています。

梁文鋒氏:V2モデルの開発に関わった当社のスタッフに海外組はいない。世界のトップ50の人材が中国にいないとしても、そのような人材を自分たちで生み出すことができるかもしれない。

トップレベルの人材が強い興味を示すのは、世界的な難題に取り組み、それを解決することだと思う。中国では優秀な人材が過小評価されている。社会的なレベルで真のイノベーションが少なく、優秀な人材にスポットが当たる機会がないためだ。我々は最も困難な課題に取り組んでいるので、この環境は彼らにとって魅力的に映るだろう。

36Kr:今、あなた自身が最も力を入れているのはどんなことですか?

梁文鋒氏:次世代のAIモデルの研究にエネルギーを注いでいる。解決すべき問題はまだ山ほどある。

36Kr:「オリジナル」のイノベーションの話に戻りますが、現在、国内の経済成長が減速し、資金調達も「冬の時期」を迎えている状況は、イノベーションを生み出すことに対してもマイナスの影響を与えるでしょうか。

梁文鋒氏:そうは思わない。中国の産業構造が再編されれば、本質的なイノベーションへの依存は高まるだろう。これまでのビジネスがかなりの程度、運や勢いに頼ったものだったと多くの人が気付けば、じっくりと腰を据えて「オリジナル」のイノベーションに取り組む人が増えていくはずだ。

36Kr:つまり、あなたは将来に対して楽観的な見方を持っているのですね?

梁文鋒氏:これからは本当に価値のあるイノベーションがますます増えていくはずだ。今はまだ理解されないかもしれないが、功績を挙げた真のイノベーターが高く評価される社会になれば、全体の見方も変わるだろう。必要なのは「事実の積み重ね」と「プロセス」なのだ。

*1ドル=約155円、1元=約21円で計算しています。

(編集:36Kr Japan編集部、翻訳:畠中裕子)

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録