原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録
中国で大規模言語モデルをめぐる争いがスマホメーカーにまで及んでいる。
中国のスマートフォン大手vivoが11月1日、10億、100億、1000億規模のパラメーター数をカバーする大規模言語モデル(LLM)「藍心(BlueLM)」5種類を発表した。スマートフォン・IoT機器大手のシャオミ(Xiaomi、小米集団)も先月、大規模言語モデルを搭載したAIアシスタント「小愛同学(Xiao AI)」を自社の新しい「Xiaomi HyperOS(小米澎湃OS)」に組み込んだ。ファーウェイも8月に独自OS「HarmonyOS 4」のAIアシスタント「小芸」に大規模言語モデルを導入したことを発表、OPPOやHonor(栄耀)も大規模言語モデルをベースにAIアシスタントを刷新すると表明している。
スマホメーカーは大規模言語モデルにかなりの投資をしている。vivo副総裁の周囲氏によると、同社は6年にわたり大規模言語モデルの開発と改良に取り組み、200億元(約4200億円)を超える資金を投入、1000人以上のスタッフが関わってきたという。
スマホに大規模言語モデル搭載、高いハードル
vivoとHonor、シャオミの大規模言語モデルはいずれもパラメーター数60億や70億というところから始め、徐々に規模を大きくしているようだ。
vivoの周副総裁は社内テストの結果を踏まえ、簡単な文書の要約や分析をするにはパラメーター数70億の規模で十分だが、本当の意味で「創発(AIが予想外の能力を開花させること)」を実現するにはまだ改良の余地が大きく、130億のほうが好ましいだろうとした。
例えば、「深圳から北京への航空券を買う」ことを指示したとする。この簡単な指示にも実は、ユーザーの予算はどれくらいか、何時のフライトに乗りたいのか、好みの航空会社はどこか、などといった多くのタスクが含まれている。「複雑なタスク分析にはパラメーター数10億では不十分で、70億なら辛うじて使えるレベル、130億でぴったり」だという。
使用されているコンピューティング技術には2通りあり、Honorとシャオミはエッジコンピューティングを使い、vivoはエッジコンピューティングとクラウドコンピューティングを併用している。
この2つの方式にはそれぞれ長所と短所がある。クラウドコンピューティングの欠点は費用がかかりすぎることだ。業界関係者によると、クラウドコンピューティングを利用した大規模言語モデルの演算処理には1回あたり0.12元(約2.5円)かかる。もし3億人が毎日10回利用したとすれば、スマホメーカーは年間に100億元(約2100億円)以上の余分な出費を負担することになる。
これに対し、エッジコンピューティングはコストを抑えられる。データをクラウドで保管しないので、セキュリティが高く、計算効率もいい。その一方で、スマホ端末自体に高いスペックが求められる。パラメーター10億の大規模言語モデルにはメモリーが1G、70億なら4G必要で、これが130億になると7Gにもなってしまうが、現在のハイエンドスマホでも大半がメモリーは12Gか16Gだ。使い勝手のいい大規模言語モデルをスマホ端末に導入しようとすればメモリーの半分以上を使ってしまい、スマホの動作に影響する可能性がある。
大規模言語モデルをスマホに搭載するには、メモリーだけにとどまらず、チップにも高い処理能力が必要になる。現在供給可能なチップのうち、台湾Media Tek(聯發科技)の「Dimensity 9300」と米クアルコム(Qualcomm)の「Snapdraon8 Gen3」だけが大規模言語モデルのエッジコンピューティングに対応できるという。
スマホのスペックが限定されるため、大規模言語モデルはしばらくの間はハイエンドスマホのみに許される機能になるだろう。
スマホの大規模言語モデルと未来のAIアシスタント
ほぼすべてのスマホメーカーが期せずして大規模言語モデルをAIアシスタントにも導入している。かつてはメーカーごとに独自のAIアシスタントを開発し、OPPOなら「小布」、ファーウェイは「小芸」、vivoは「小V」を搭載していたが、ほとんど役に立たなかった。ユーザーの指示を理解できず、できることも限られていたため、ユーザーの業務や生活の中心的ツールになるのは難しかった。
しかし大規模言語モデルを使えば、AIアシスタントの理解力は幼稚園レベルから高校生レベルへと徐々に進化する。どのメーカーも明らかに、ユーザー個人をサポートできる新たなAIアシスタントを作り上げたいと考えている。
OPPOのチーフプロダクトオフィサー劉作虎氏は「大規模言語モデルの知識は個人の知識を超え、あたかも人のようにユーザーの言葉を理解し、毎日観察して学習し、習慣を把握して、最適なアシストでタスクを完遂する」と語る。
各メーカーが公開している情報によると、各社の大規模言語モデルはいずれも言語理解やテキスト生成、自然対話、ロールプレイングなどの機能にフォーカスしており、ユーザーが特定の画像検索や文章の作成、文章の要点整理をするのに利用できるようだ。
しかし大規模言語モデルを活用したAIアシスタントが本当に役に立つ存在となるにはさらに難しい課題がある。それは上位レイヤーのアプリと連携させ、そのデータと機能を使えるようにすることだ。
AIアシスタントに航空券を購入させるという指示をもう一度例にしてみよう。タスクを完遂するには、決済サービスのアリペイ(支付宝)やWeChat Pay(微信支付)などの決済情報や、ユーザーのスケジュール、過去の航空機利用などの情報にアクセスする権限が必要になる。ある関係者によると、過去の閲覧に伴うトラフィックやデータはアプリ側が所有し、アプリ側はこれを差し出したくはないのだという。
このため、今後大規模言語モデルをスマホ端末に搭載できるか否かは、スマホメーカーがスマホという限られた空間内で大規模言語モデルの能力をいかに最大限に発揮させられるか、そして大規模言語モデルとアプリをいかに緊密に連携させられるかということにかかっている。
*2023年11月21日のレート(1元=約21円)で計算しています。
(翻訳・36Kr Japan編集部)
原文はこちら
セミナー情報や最新業界レポートを無料でお届け
メールマガジンに登録