36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国・清華大学のAI研究グループ「TSAILラボ」はこのほど、マルチモーダルAIを手がける「生数科技(Shengshu Technology)」と共同で、動画生成を高速化するフレームワーク「TurboDiffusion」をオープンソースで公開した。動画生成AIの品質を維持したまま、生成速度を100〜200倍高速化できる点が、世界のAI関係者の関心を集めている。
大規模言語モデルの性能向上に伴い、テキストや画像の生成に続いて、動画生成がコンテンツ生成の主な方向性となりつつある。しかし、現実的なボトルネックも存在する。米エヌビディアの「H100」をはじめとする高性能GPUを用いても、ショート動画の生成に数分かかってしまうため、実際の利用には限界がある。多くのクリエイターは「GeForce RTX 4090」や「GeForce RTX 5090」といったコンシューマー向けGPUを利用しているが、できることはさらに限られてくる。

TurboDiffusionは、動画生成AIで主流となっているDiffusion(拡散)モデルの高速化を目的として開発されたツールで、RTX 5090を100~200倍高速化する効果がある。テキストからの動画生成(T2V)や画像からの動画生成(I2V)に対応し、高解像度・長時間の動画でも超高速で生成できる。

実測データでも高速化効果は明らかで、パラメータ数140億(14B)規模のI2Vモデルを用いて720P(1280×720画素)で5秒の動画を生成した結果、通常の処理では4549秒(約76分)を要したが、TurboDiffusionを用いると38秒で完了した。
*1元=約22円で計算しています。
(36Kr Japan編集部・茶谷弥生)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録





フォローする
フォローする



