たった150人で世界に激震! 話題の「AI天才少女」を擁するDeepSeekの人材採用論

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

スタートアップ特集編集部お勧め記事注目記事

たった150人で世界に激震! 話題の「AI天才少女」を擁するDeepSeekの人材採用論

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

2024年末、中国で1人の若い女性に突如注目が集まった。中国スマートフォン大手・シャオミ(小米科技)の雷軍CEOが、「AI天才少女」として知られる羅福莉さんを年俸1000万元(約2億円)で大規模言語モデル(LLM)開発チームの責任者にスカウトしたからだ。ただ、現時点で羅さんはシャオミに入社しておらず、「まだ検討中」だとメディアは報じている。

破格の年俸もさることながら、羅さんが世間からこれほど注目される理由は、彼女がいま話題沸騰のAIスタートアップ「DeepSeek」のメンバーとしてAIモデル開発に関わってきたことにある。

ネット上の情報をまとめると、羅福莉さんは1995年生まれで、いわゆる「Z世代」に属する若き開発者だ。北京師範大学でコンピュータサイエンスを学び、学部卒業後は北京大学でコンピュータ言語学の修士課程に進学した。その後、アリババグループの最先端研究機関「DAMOアカデミー(達摩院)」の機械知能研究所に加わり、多言語事前学習モデル「VECO」や「AliceMind」のオープンソースプロジェクトに携わった。2022年、羅さんはアリババを離れ、DeepSeekに深層学習リサーチャーとして入社し、専門家混合モデル (MoE) 「DeepSeek-V2」の開発に参加した。

実は2019年の時点で、彼女はすでにSNS上で注目を集めていた。当時、まだ修士課程在学中だった羅さんは、人工知能分野のトップ国際会議であるACL(Association for Computational Linguistics)で8本の論文を発表(うち2本は筆頭著者)。これをきっかけに、「AI天才少女」という称号が彼女の代名詞となった。

(羅福莉さん:ネットより)

DeepSeekには「桁外れの天才技術者たち」ばかり?

DeepSeekは、驚くほどの低コストで世界トップレベルの性能を持つAIモデルを開発し、アメリカをはじめとする世界のテック業界に大きな衝撃を与えている。

そして羅さんのニュースをきっかけに、世間は「DeepSeekとは何者か」ということに関心を向け始めた。なにしろ、わずか600万ドル(約9億円)というコストで(この金額の算出方法には懐疑的な見方もあるが)、米OpenAIの「ChatGPT-4o」に匹敵する性能の「DeepSeek-V3」を開発するという快挙を成し遂げたからだ。

OpenAIの元ポリシーディレクター、ジャック・クラーク氏は過去に、DeepSeekには「桁外れの天才技術者たちが集まっている」とコメントしたが、DeepSeek創業者の梁文鋒氏は36Krのインタビューで次のように答えている。「私たちのチームに『桁外れの天才技術者』がいるわけではない。メンバーの多くは、中国国内のトップ大学(編集部注:北京大・清華大が多い)の新卒生や博士後期課程の院生、そして卒業して間もない若手研究者だ」

DeepSeekが目標に掲げる汎用人工知能(AGI)の実現には、才能ある人材を集めるだけでは十分でない。複数の関係者へのインタビューから明らかになったのは、DeepSeekがこれら優秀な人材の能力を最大限に引き出すうえで、チームマネジメントが鍵を握っているということだ。

DeepSeekは2023年5月の設立以来、スタッフの規模を150人ほどに抑え、役職にこだわらないフラットな組織で、研究やリソース配分を進めてきたという。目下、AI開発企業の多くが数百人、ひいては数千人規模の開発チームを編成し、AI分野の経験豊富なベテランを高給で引き抜いているのとは対照的に、DeepSeekは職歴のない若者たちを好んで採用している。

DeepSeekと関わりのあるヘッドハンターの話では、DeepSeekが求めるのはベテラン技術者ではないという。「せいぜい社会経験3~5年までで、社会人になって8年以上だと採用はほぼ見送られる」

例えば、数学的推論に特化したAIモデル「DeepSeekMath」を開発した主要メンバー3人は、博士課程のインターン期間中にこの研究を行った。またDeepSeek-V3の研究者の1人は2024年に北京大学で博士号を取得したばかりの若手だ。

職歴のない新卒生の能力を測るうえで、出身大学のほかにコンテストでの実績が重要な指標となっているそうだ。複数の関係者によると、同社がコンテストの受賞歴を非常に重視しており、「基本的に金メダル以外は眼中にない」と明かしている。

実際、DeepSeekのメンバーの1人がネット上で公開した経歴は驚くべきものだった。北京大学を卒業後、ACM国際大学対抗プログラミングコンテストに3度出場し、いずれも金メダルを獲得。さらに、学部在学中にトップクラスの学会で6本(うち2本は共著)の論文を発表するなど、際立った実績を持っている。

「トップ人材を自分で育てればいい」

では、DeepSeekはこれら若き天才たちをいかにつなぎ止め、その能力を発揮できる環境を整えているのだろうか。

まず、当然ながら惜しまず資金をつぎ込むことだ。DeepSeekの親会社は、クオンツ系ヘッジファンドの「幻方量化(High-Flyer Quant)」とのこと。中国メディアは、国内で1万枚以上のGPUを保有する企業は5社以下だとし、そのうちの1社が幻方量化だと報じている。

事情に詳しい人物によると、DeepSeekの給与水準はバイトダンス(TikTok親会社)の研究開発職を参考にしており、「バイトダンスから提示された報酬をもとに、さらに上乗せされる」という。加えて、梁氏が見込みありと判断した技術的提案に対しては、演算リソースを上限なく提供するという「ぜいたくな環境」も用意されている。

人材サイトで公開されている情報を見ると、DeepSeekはこれまでに複数の職種で採用を行っており、一部の給与データも明らかになっている。同社は「年収=月給×14ヶ月分」という給与制度を採用しており、過去の求人情報(詳細は下表)では、最も高い年収の職種は「深層学習リサーチャー」で、月給は8万〜11万元(約168万〜230万円)。年間14カ月分で計算すると、年収は税引き前で最高154万元(約3230万円)に達する

(データ:求人プラットフォーム「BOSS直聘」、図表作成:資事堂)

さらに、DeepSeekでは非常にフラットなマネジメント方式を採用している。前述のヘッドハンターによると、DeepSeekでは従来のチーム制の代わりに、特定の目標に基づいてメンバーがさまざまな研究グループに分かれているという。グループ内には決まった役割も上下関係もなく、各人が自分の得意分野を担当し、難しい問題にぶつかったら一緒に話し合ったり、ほかのグループのエキスパートにアドバイスを求めたりする

梁氏は過去の36Krのインタビューで、自社組織の特徴を「ボトムアップ」「自然な分業」と表現している。「メンバーにはそれぞれの生い立ちがあり、独自の考え方があるため、無理強いする必要はない。(中略)もし有望なアイデアが出されれば、我々もトップダウン方式でリソースを配置する」

「自然な分業」の代表的な成果の一つが、訓練アーキテクチャ「MLA」だ。DeepSeek-V3の訓練コストを大幅に削減したのがMLAだが、その開発はある若い研究者の個人的な興味から始まったという。「この研究のために専門チームを組織し、完成までに数カ月を費やした」と梁氏は振り返る。

DeepSeekは、まだ学術的な実績を得ていないものの、大きなポテンシャルを秘めた人材にも注目している。同社に入社する若者の中には、AIモデルの訓練に関わった経験のない人や、コンピューター技術を専攻していない人も多い。実際、物理専攻出身でありながら、独学でコンピューター技術を習得し、DeepSeekの一員となったメンバーもいる。

「イノベーションを生み出すには、チームが『惰性』から脱する必要がある」と、あるAI関係者は指摘する。現在、中国のAI開発企業の多くはOpenAIの安易な模倣に走るという惰性に陥っており、Transformerモデルやスケーリング則など、すでに検証された手法を使って失敗のリスクを回避しているというのだ。これに対し、DeepSeekはAIのフレームワークそのものを見直し、効率化を図るための新しい手法の基礎研究に注力してきた。「DeepSeekでは融通の利かない『KPI(重要業績評価指標)』を設定することも、『商用化』のプレッシャーもない。AIモデルの訓練に関して経験が少ないからこそ、OpenAIの『模範解答』を真似することもないのだ

上述の関係者は、DeepSeekメンバーから聞いた話を次のように紹介した。「現時点でTransformerモデルに手を加える企業はほとんどいないが、DeepSeekがまず初日に取りかかったのがアルゴリズム・アーキテクチャの見直しだった。ほかの企業もMLA(DeepSeek独自のアーキテクチャ)を開発できるかもしれないが、彼らはすでにある『模範解答』を崩すつもりはないのだ」

現在、多くの中国のAI開発企業は海外から優秀な人材を引き抜くことに必死になっているが、「AI分野で特に優れた人材トップ50人のうち、中国企業に所属している者は一人もいない」とも言われている。それに対して梁氏はこう述べた。

「世界のトップ50の人材が中国にいないとしても、そのような人材を自分たちで育てることができるかもしれない。トップレベルの人材が最も強く惹かれるのは、世界的な難題に取り組み、それを解決することだと思う。中国では優秀な人材が過小評価されている。社会的なレベルで『真のイノベーション』が少なく、優秀な人材にスポットが当たる機会がないためだ。我々は最も困難な課題に取り組んでいるので、この環境こそが、彼らにとって魅力的に映るだろう」

中国DeepSeekの衝撃・創業者独占取材「中国AIがいつまでも米国の追随者であることはない」

*1ドル=約156円、1元=約21円で計算しています。

(編集・36Kr Japan編集部、翻訳・畠中裕子)

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

原文はこちら

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録