当前位置: 首页 > news >正文

百度智能云AI数据服务「Ego-Centric采集解决方案」正式发布

具身智能的竞争,上半场是模型,下半场是数据。

当机器人需要“看懂世界”

数据基础设施必须升级

当机器人从“执行设定动作”走向“理解世界”,数据正在成为新的核心基础设施。VLA与世界模型正在改变学习范式:机器人不再只学动作,而是学习连续感知与决策。但现实是,主流遥操作采集仍依赖重硬件、短时序、单场景,无法支撑规模化训练。行业正在转向第一视角(Ego-Centric)数据范式,然而关键瓶颈依然存在:成本高、标准乱、精度不足、缺乏数据、难以规模复制。

百度智能云凭借深厚的行业积淀,率先在大湾区建成高标准真实具身智能采标实验室,构建覆盖采、标、管、仿、训、测的全栈数据基础设施。以此为基石,百度智能云AI数据服务「具身智能Ego-Centric采集解决方案」焕新发布!目标只有一个:用更低成本,生产更高保真、可规模化、可训练的具身智能数据资产。

为什么是Ego-Centric?

在探索机器人真正自主化的道路上,相比传统的遥操机械臂、外骨骼、数据手套等高昂方案,行业正在经历一场底层逻辑的重构:

  • 更低成本:轻量化穿戴,摆脱高价专用设备依赖

  • 更易规模化:快速复制到大规模、多场景、多人物的真实世界交互

  • 更真实学习信号:保留人类第一视角交互,涵盖真实物理常识和因果关系

👉本质变化:从“设备驱动采集”→“人人可参与的数据生产方式”

行业痛点,逐一击破

当前行业Ego数据采集仍面临五大核心挑战:硬件方案复杂、标准不统一、数据质量缺乏统一标准、手部轨迹精度不足、缺少真值评估体系,数据无法形成标准化闭环。

我们要解决的不只是“采集数据”,而是——如何把真实世界的交互,转化为可训练、可验证、可复现的具身智能数据资产。

五大技术支柱

构建数据护城河

一、软硬一体:轻量化Ego数采套件

构建低门槛、可复制的第一视角数据采集底座,集成RGB+深度+SLAM+IMU多模态能力,四大亮点直击痛点:

  • 120FPS:高速动作无拖影

  • 150°视场:完整覆盖操作空间

  • 毫米级定位:稳定捕捉空间轨迹

  • 毫秒级同步:多模态数据天然对齐

这套轻量化套件,让采集从“专业设备依赖”走向“可规模部署的数据生产工具”,大幅降低成本与落地难度。

二、核心突破:毫米级“手势识别+动作重定向”

本次发布实现关键技术突破,首次构建无本体(Body-free)Ego数据采集方案,打通从数据采集到动作生成的全链路闭环,形成“第一视角RGB视频 → SLAM轨迹恢复 → 三维手部姿态估计 → 逆运动学求解 → 动作重定向”的完整技术链路,核心优势在于:

  • 行业首创无本体设计:彻底摆脱昂贵本体设备束缚,大幅降低硬件投入;

  • 毫米级轨迹映射:直接生成高精度机械臂末端轨迹,实现“人手动作→机器人轨迹”的毫米级映射。

这一突破在大幅降低硬件成本的同时,保持了工业级轨迹精度。

三、真值评估体系:不仅能采,更能验证

直击“数据是否可信”的核心痛点,搭建六相机真值采集环境,通过多相机、多角度同步采集,构建起具身智能数据的“度量衡”:

  • 极限抗遮挡:在手部重度遮挡、手指交错、高速运动的极端工况下,依然稳定输出连续精准的人手3D姿态真值

  • 全链路校准:为轨迹精度评估、动作重建验证及模型训练Benchmark提供不可撼动的工业级基准线

最终让数据从“可用数据”升级为“可验证数据”,大幅提升模型训练效果。

四、全链路数据质检——让数据真正可训练

从源头保障模型输入质量,将数据从“原材料”升维为“核心资产”核心亮点在于三层防御质检机制:

  • 覆盖原始数据、仿真验证与真机执行全流程;

  • 严格把控轨迹一致性与物理可执行性。

确保进入模型训练的每一条数据都“干净、可信、可落地”

五、数据管理平台——让Ego数据真正流动起来

数据价值不在于堆积,我们打造智能化数据管理平台,一体化能力全覆盖:

  • 数据可视化、管线处理、时序行为标注;

  • 多维度检索与质量管理。

推动Ego数据从“原始素材”升级为“标准化数据资产”

目前,我们的具身智能数据采标能力,已深度支持北京、上海、浙江、四川创新中心等国家力量,并成功服务于智元机器人、星海图等产业链上下游超过30家重点企业。未来我们将持续推进Ego-Centric数据采集方案在真实机器人训练场景中的落地应用。

从“教动作”到“懂世界”

过去,我们试图用昂贵硬件去“定义”机器人的动作。

现在,我们正在用低成本、高质量的Ego数据,帮助机器人理解:人为什么这样行动,世界为什么这样运转。

百度智能云AI数据服务,正在重新定义具身智能时代的数据生产方式。当海量、真实、具备工业级真值的人类操作数据开始规模化流动,机器人真正理解物理世界的“iPhone时刻”,也将加速到来。

当AI进入物理世界,具身模型如何重构生产力?

点击“阅读原文”,立即合作咨询!

http://www.cnnetsun.cn/news/2590322.html

相关文章:

  • 做短视频总卡在智能切片,5款工具横评实测:访谈金句提取与上下文连贯如何兼顾
  • Go语言文件上传:OSS集成
  • (论文)系统分析师系列(一)测试
  • 不踩坑!OpenClaw 2.7.5 Win11 完整部署,零基础也能 10 分钟上手
  • 柔性变形机翼关键结构的拓扑优化【附代码】
  • Air1601 LCD 显示开发全解析
  • Unity ShaderGraph实战:用Input节点5分钟搞定一个动态水面材质(附完整节点图)
  • cmux:专为 AI 编程 Agent 打造的 macOS 终端神器
  • 从开发者角度观察Taotoken平台模型更新与路由优化的及时性体验
  • 从闲鱼淘件到成功首飞:我的低成本PX4无人机DIY全记录(附电调、电池选购心得)
  • 3步掌握Steam成就管理:SteamAchievementManager导出导入实战指南
  • 保姆级教程:在CentOS 7上用源码编译安装Netdata性能监控面板(附常见启动失败排查)
  • 告别NTPD:用Chrony和GPS 1PPS信号把Linux系统时间精度拉到纳秒级
  • 让你的 Claude Code 满血复活,Anthropic 在 GitHub 上开源了个插件。
  • 从游戏开发视角理解毁伤计算:破片、冲击波与坐标变换在Unity/C++中的实现思路
  • 别再只会用主相机了!Unity Camera组件这5个隐藏功能,让你的游戏画面瞬间高级
  • 使用taotoken cli工具一键配置团队多成员的开发环境
  • 用ESP32C3和PCM5102A做个高音质蓝牙音频接收器:从硬件焊接到Arduino代码调试
  • 拆解EfficientNet的‘乐高积木’:手把手复现MBConv与SENet模块(TensorFlow 2.x版)
  • 告别告警风暴:手把手教你用华为gCastle库挖掘时序告警的因果根因
  • HALCON 22.11深度模型加密实操:保护你的AI训练成果与商业机密
  • VMware vCenter磁盘空间管理的‘潜规则’:/storage下log、core、archive目录的日常维护与自动化清理方案
  • 别再乱用yum clean all了!CentOS/RHEL 7/8下yum缓存管理的正确姿势与避坑指南
  • 别再傻等!Flutter项目卡在gradle assembleDebug?我用这套‘借壳生蛋’法5分钟搞定
  • STM32G431串口通信实战:用CubeMX和HAL库搞定蓝桥杯嵌入式赛题(附完整代码)
  • C++26概述
  • 当每一行代码都可能是“AI代笔”:你会为“零AI介入”的汽车支付溢价吗?
  • 微软MAI三模型实战:语音转写、文字转语音与文生图全链路部署指南
  • 提升算法原理与工程实践:从AdaBoost到XGBoost全解析
  • Linux timeout命令的隐藏玩法:不只是限时,还能优雅终止和前台调试