動画生成が100倍速くなる!清華大×生数科技、高速化フレームワーク「TurboDiffusion」発表

36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

日本最大級の中国テック・スタートアップ専門メディア。日本経済新聞社とパートナーシップ提携。デジタル化で先行する中国の「今」から日本の未来を読み取ろう。

EXCITEのRSSに登録スタートアップ注目記事

動画生成が100倍速くなる!清華大×生数科技、高速化フレームワーク「TurboDiffusion」発表

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

続きを読む

中国・清華大学のAI研究グループ「TSAILラボ」はこのほど、マルチモーダルAIを手がける「生数科技(Shengshu Technology)」と共同で、動画生成を高速化するフレームワーク「TurboDiffusion」をオープンソースで公開した。動画生成AIの品質を維持したまま、生成速度を100〜200倍高速化できる点が、世界のAI関係者の関心を集めている。

生成AIでゲーム開発効率30%アップも、中国版Sora「生数科技」が数十億円以上の資金調達

大規模言語モデルの性能向上に伴い、テキストや画像の生成に続いて、動画生成がコンテンツ生成の主な方向性となりつつある。しかし、現実的なボトルネックも存在する。米エヌビディアの「H100」をはじめとする高性能GPUを用いても、ショート動画の生成に数分かかってしまうため、実際の利用には限界がある。多くのクリエイターは「GeForce RTX 4090」や「GeForce RTX 5090」といったコンシューマー向けGPUを利用しているが、できることはさらに限られてくる。

TurboDiffusionは、動画生成AIで主流となっているDiffusion(拡散)モデルの高速化を目的として開発されたツールで、RTX 5090を100~200倍高速化する効果がある。テキストからの動画生成(T2V)や画像からの動画生成(I2V)に対応し、高解像度・長時間の動画でも超高速で生成できる。

実測データでも高速化効果は明らかで、パラメータ数140億(14B)規模のI2Vモデルを用いて720P(1280×720画素)で5秒の動画を生成した結果、通常の処理では4549秒(約76分)を要したが、TurboDiffusionを用いると38秒で完了した。

*1元=約22円で計算しています。

(36Kr Japan編集部・茶谷弥生)

36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。

セミナー情報や最新業界レポートを無料でお届け

メールマガジンに登録

関連記事はこちら

関連キーワード

次の一手をひらくヒントがここに。

会員限定ニュース&レポートをお届け。