7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国のAIスタートアップ「生数科技(Shengshu-ai)」がこのほど、エンジェルラウンドで約1億元(約20億円)を調達した。出資を主導したのはアントグループ(螞蟻集団)で、百度風投(Baidu Ventures)と卓源資本(Z&Y Capital)も加わった。現時点で評価額は1億ドル(約144億円)に達している。
生数科技はマルチモーダル型生成AIモデルとアプリケーション開発に特化した企業で、AIインフラ・ソリューション開発の瑞莱智慧(Real AI)、アントグループ、百度風投の支援のもと2023年3月に設立された。チームメンバーは主に清華大学人工知能研究院の出身者で、瑞莱智慧の前副総裁・唐家渝氏がCEOを務める。
対話型AI「ChatGPT」の巻き起こしたブームから半年、大規模モデルの開発レースが続いているが、主な競争力となるのは基盤となるアルゴリズムだと唐CEOは考える。「3Dや動画などマルチモーダル生成のクオリティーはビジネス利用できるレベルには遠く及ばない。見方を変えると、アルゴリズムには大きな改良の余地があると言える」。一方で、ゼロから大規模モデルを構築し訓練するスキルの重要性がこれまで以上に高まっている。
目下、マルチモーダルモデルの開発で克服すべき課題は、画像や動画、音声など異なる種類の情報を統一的にモデリングする汎用アーキテクチャを構築することだ。唐CEOによると、市場に出回っている多くの大規模モデルはマルチモーダル機能を備えているといいながら、実際にはシングルモーダルやクロスモーダルのモデルを単に組み合わせただけなのだという。ベース部分であらゆる種類の情報をまとめているわけではないため、本当の意味でのマルチモーダルとは言えない。
唐CEOは例を挙げて説明する。「人は目や耳、口、手足などさまざまな器官を通じて外部の情報を取得したり表現したりするが、そのやり取りは全て脳がつかさどっている。音や視覚、動作などさまざまな種類の情報を同時にインプット・アウトプットすることで、物事を正確に認識し表現できるのだ」
生数科技は2023年初めに、深層学習モデルTransformerをベースに開発したマルチモーダル型拡散モデル「Unidiffuser」のソースコードを公開した。U-ViT Transformerアーキテクチャを採用し、拡散モデルで初めてマルチモーダル機能を実装したもので、1つの基盤モデルを使ってテキストからの画像生成、画像からのテキスト生成、画像とテキストの混合生成などさまざまなタスクを高いクオリティーで実行できる。Unidiffuserの事前学習には20億を超えるデータが使用されたほか、開発中の新たな大規模モデルは100億クラスのデータでトレーニングしているという。
現在、同社が開発を進めている産業用マルチモーダルモデルは急ピッチで改良を進めている段階だが、画像生成や3Dコンテンツ生成、動画生成などのタスクではすでに高い水準を実現している。例えば、三面図に基づく業界初の3Dコンテンツ自動生成技術や、3Dデータの学習不要でテキストから3Dコンテンツを生成する技術などを開発してきた。このモデルの生成クオリティーは産業応用が可能なレベルに迫り、Open AIの「Shap-E」、Google「DreamFusion」、エヌビディア「Magic3D」など大手の3Dモデル生成AIを上回っている。画像生成ではすでに最新版のStable Diffusionの基盤モデルを超えており、年内にはMidjourneyの最新版に追いつく見込みだという。
生数科技は基盤モデルとアプリケーションという2本柱のビジネスモデルを貫いている。オープンソースのAIモデルに基づいたアプリケーションは一般ユーザーでも手軽にコンテンツ制作ができ、エンタメ要素が強いため、一定のユーザー層を集めることができる。同時に商品デザインやゲーム・映像制作などに携わるプロのニーズにも対応するため、業界団体と協力しつつ基盤モデルのアーキテクチャの最適化を進め、独自機能の向上を目指していく。そのために、独自開発した産業用マルチモーダルモデルをベースにさまざまな分野に特化したアプリケーションを開発しており、一般消費者と法人顧客の双方に向けてビジネスを展開している。現在、複数のゲーム制作会社やデザインプラットフォームと提携を結んでおり、アプリケーションも近く発表する予定だという。
(翻訳・畠中裕子)
7月1日より、これまで36Kr Japanのメディアで提供していた記事のうち、一部スタートアップ企業に関するニュースについては、有料コンテンツサービス「CONNECTO(コネクト)」の会員限定で提供します(初期段階では無料会員も対象とします)。まだ登録されていない方は、ぜひそちらをご利用ください。
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録