36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国の新興AI企業「生数科技(Shengshu-AI)」がこのほど、清華大学と共同開発したトランスフォーマー「U-ViT(Universal Vision Transformer)」を採用した動画生成AI「Vidu」を発表した。U-ViTは、米OpenAIの動画生成AI「Sora」が採用する「DiT(Diffusion Transformer)」と同様、拡散モデルとトランスフォーマーモデルを組み合わせたトランスフォーマーで、2022年9月にはすでに発表されていた。
Viduは、最長16秒・解像度1080Pの高画質動画をワンクリックで生成することができる。Soraの最大60秒には及ばないものの、中国で開発された他の動画生成AIに比べればかなり長い。その動画は滑らかにつながり、細部と論理に一貫性を備えている。プロモーション動画の出来映えはSoraに匹敵する。
生数科技は2023年3月に設立され、画像や3D、動画など複数種類のデータを同時に扱えるマルチモーダル大規模言語モデル(LLM)の開発に注力している。中心メンバーには、 中国で最も早く深層生成モデルの研究を開始した清華大学人工知能研究院の出身者がそろう。同社は24年3月、啓明創投(Qiming Venture Partners)などから数億元(数十億円超)を調達したばかりだ。
(36Kr Japan編集部)
36Kr Japanで提供している記事以外に、スタートアップ企業や中国ビジネスのトレンドに関するニュース、レポート記事、企業データベースなど、有料コンテンツサービス「CONNECTO(コネクト)」を会員限定にお届けします。無料会員向けに公開している内容もあるので、ぜひご登録ください。
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録