原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
自然な受け答えができる対話型AI「ChatGPT」の登場によって、大量のデータで事前学習を施した大規模事前学習モデルが一躍注目を集めている。中国IT業界で先陣を切ったのは大規模事前学習モデル「文心」を有する百度(バイドゥ)で、3月にも大規模言語モデル「文心一言(ERNIE Bot)」を発表するという。その後、「美団(Meituan)」共同創業者の王慧文氏、AIスタートアップ「出門問問(Mobvoi)」創業者の李志飛氏、検索エンジン「捜狗(Sogou)」元CEOの王小川氏などIT界のベテラン起業家たちが、「中国のOpenAI」となるべく動き出している。
これまでAIアルゴリズムを駆使して成長を遂げてきた「バイトダンス(字節跳動)」も忘れてはならない。バイトダンスはすでに大規模事前学習モデルに着手しており、言語モデルと画像モデルの開発に注力していることを、複数の情報源が明らかにしている。この件に関して、バイトダンスの関連技術責任者は「まだごく初期段階であり、十分にまとまってはいない」と回答している。
バイトダンスの大規模言語モデルチームは検索事業部門が主導しており、十数人規模のチームであることが、事情に通じた人物の話から分かっている。別の情報筋も、同チームが主に検索や広告など川下事業との連携を探る目的で今年設立され、検索事業部門やAIラボ、応用機械学習(AML)チームから一部の人員がサポートに入っていることを明かしており、今年半ばには大規模言語モデルを発表する見込みだという。
大規模言語モデルと大規模画像モデルのチーム責任者にとって、間接的また直属の上司となるのがTikTok製品技術責任者の朱文佳氏だ。バイドゥで検索部門のチーフアーキテクトを務めていた朱氏は、2015年からバイトダンスの運営するニュースアグリゲーター「今日頭条(Toutiao)」に加わり、「今日頭条のアルゴリズム技術のトップスリー」と呼ばれるようになる。4年後に今日頭条のCEOに就任し、21年2月にはTikTokの周受資CEO直属の製品技術責任者となった。
最終的に大規模事前学習モデルでバイドゥに対抗できるのは、恐らくバイトダンスだろうと多くの人は考えている。
資金、人材、演算能力、これらは大規模モデルを訓練するために必要ないわば入場料だ。IT大手にとって資金と人材を確保することはそれほど難しくはない。しかし米政府の輸出規制によりNVIDIAの高性能チップ「A100」が中国で入手できなくなったため、大規模モデルの訓練に必要な高性能GPUは希少かつ重要な資源になっている。
しかし、バイトダンスはGPUに困ってはいないと、あるAI業界関係者は明かす。バイトダンスは2021年、法人向け技術サービスプラットフォーム「火山引擎(Volcano Engine)」を通じてクラウドインフラ市場に参入し、大規模事前学習モデルに必要な演算能力の基礎を固めていたのだ。
バイトダンスはAI分野に対して、これまでも素早い対応を見せてきた。すでに今日頭条のコンテンツ制作やTikTokのコンテンツ生成には、AI生成コンテンツ(AIGC)技術が活用されている。例えば、21年に中国版TikTokの抖音でリリースされた新機能「漫画顔」は、人の顔をアニメ風に変える特殊効果で大人気となった。
とはいえ、ChatGPTの成功が実証したのは、大規模モデルの訓練が長期戦であり、なおかつ高額な入場料を支払う必要があるということだ。ChatGPTの公開前、バイトダンス社内では「製品ラインナップから見れば、現在のアルゴリズムで十分」として、大規模事前学習モデルへの投資に二の足を踏んでいたという。
バイトダンスが大規模事前学習モデルに対してどのような答えを出すのか、今はただ見守るしかない。
(翻訳・畠中裕子)
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録