JDドットコム、「人類最大のデータ収集センター」始動 50万人超が“AIの教師”に
人型ロボット(ヒューマノイド)を核とするエンボディドAI(身体性を持つ人工知能)の産業化が急速に進んでいる。しかし、その意思決定の要となる大規模AIモデルのは、現実世界でのデータが足りず、充分な学習(トレーニング)が行えないというジレンマを抱えている。
この状況を打破すべく、中国の電子商取引(EC)大手、京東集団(JDドットコム)はこのほど、世界最大規模で、最も幅広い実運用環境をカバーするエンボディドAIデータ収集センターを建設すると発表した。
計画によると、同センターは今後2年以内に人間の実世界における行動を中心に1000万時間を超える高品質データを収集するほか、ロボット本体から得られる約100万時間分の運用データもあわせて蓄積する方針だ。この目標を実現するため、JDドットコムは「人類史上最大規模のデータ収集プロジェクト」を始動させる予定だ。
プロジェクトには、同社グループの10万人を超える従業員に加え、外部から最大50万人規模の参加者が関与する見込みだ。例えば、創業者の劉強東(Richard Liu)氏の故郷である江蘇省宿遷市だけでも、10万人以上の市民が動員される。収集対象となるデータは、家庭、オフィス、工場、物流、店舗、飲食、医療、環境衛生など、100を超える分野に及び、AIモデルの学習基盤として活用される予定だ。
JDドットコムはすでに、自社が展開するサプライチェーン、小売、物流、ヘルスケア、工業サービス、フードデリバリー、家事支援などの多様な事業基盤を活用し、業界でも突出した規模のデータ収集体制を構築している。視覚情報、触覚情報、空間軌跡などの多次元データを、「収集―アノテーション(注釈付け)―学習―検証」まで一貫して処理する統合パイプラインも整備されている。
(36Kr Japan編集部)