Do as I Do: Dexterous Manipulation Data from Everyday Human Videos
Do as I Do: 从日常人类视频中获取灵巧操作数据
专题命中 机器人学习 :从人类视频重建灵巧操作数据
AI总结 提出DO AS I DO算法,从单目RGB人类视频中重建手-物交互并重定向到多指灵巧机器人手,生成可执行的操作数据,优于现有方法。
Comments Project website: https://do-as-i-do.com/
视觉与机器人
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
Do as I Do: 从日常人类视频中获取灵巧操作数据
专题命中 机器人学习 :从人类视频重建灵巧操作数据
AI总结 提出DO AS I DO算法,从单目RGB人类视频中重建手-物交互并重定向到多指灵巧机器人手,生成可执行的操作数据,优于现有方法。
Comments Project website: https://do-as-i-do.com/
R2BC: 从单智能体演示进行多智能体模仿学习
专题命中 机器人学习 :多机器人模仿学习,核心是机器人学习
AI总结 提出R2BC方法,通过轮换单智能体演示训练多机器人系统,无需联合动作空间演示,在模拟和实物任务中性能媲美或超越基于特权同步演示的基线方法。
Comments 8 pages, 6 figures. In Proceedings: IEEE International Conference on Robotics & Automation (ICRA 2026)
恢复、发现、规划:从机器人失败中学习技能与概念
专题命中 机器人学习 :从机器人失败中学习技能与概念,实现长期规划。
AI总结 提出ReSYNC方法,通过技能学习与概念发现的交替过程,从失败恢复经验中逐步构建抽象谓词,实现全局失败避免和长期规划,性能提升超50%。
Comments 9 pages, 6 figures. Website: https://jaraxxus-me.github.io/ReSYNC/
TactSpace: 学习富含物理信息的共享潜在空间以实现触觉模拟到现实的迁移
专题命中 机器人学习 :学习共享潜在空间实现触觉模拟到现实迁移。
AI总结 提出多模态表示学习框架TactSpace,通过共享潜在空间对齐异构触觉模态,实现零样本模拟到现实迁移,在力预测和形状重建任务中分别降低误差16.7%和45.8%。
Comments 9 pages, 6 figures, 4 tables, accepted into IROS 2026
通过基于人类反馈的迭代强化学习利用大语言模型生成自然且富有表现力的机器人手势
专题命中 机器人学习 :机器人手势生成,RLHF优化表达。
AI总结 针对社交机器人手势生成僵硬问题,提出将ChatGPT集成到Pepper机器人中生成共语手势,并引入基于人类反馈的迭代强化学习(RLHF)优化手势,实验表明RLHF提升了手势的表现力、相关性和流畅性。
Comments 8 Pages, 6 Figures
利用能量特征进行基于深度学习的表面分类:三个独立数据集的比较分析
专题命中 机器人学习 :移动机器人表面分类,使用能量特征
AI总结 研究评估能量特征作为表面分类的独立或辅助模态的可行性,在三个数据集上比较多种深度学习架构,发现CNN性能最优,纯能量特征准确率85-90%,与惯性特征结合可达96-99%,且能量特征可稳定提升1-2%准确率。
高自由度轻量化仿生腿:提升小型机器人机动性
专题命中 机器人学习 :微型机器人高自由度仿生腿设计
AI总结 针对微型机器人腿部自由度受限问题,提出一种四自由度并联腿机构,通过同心设计简化运动学,实现轻量化(18.9g)和大工作空间(>22255 mm³),显著提升运动灵活性。
Journal ref 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
一种可扩展的具身智能平台,用于家庭移动操作任务的无缝真实-仿真-真实迁移
专题命中 机器人学习 :家庭移动操作任务的真实-仿真-真实迁移平台
AI总结 提出BestMan平台,通过自动化场景生成、仿真引导任务形式化和硬件无关中间件,解决真实-仿真-真实迁移中的场景重建、策略评估和部署兼容性挑战,实现家庭移动操作的无缝迁移。
Comments CCF Transactions on Pervasive Computing and Interaction
R2D-RL:用于多智能体强化学习的RoboCup 2D足球环境
专题命中 机器人学习 :多智能体强化学习环境,机器人足球
AI总结 提出R2D-RL环境,通过共享内存通信和周期级同步连接RCSS2D与Python MARL接口,支持全场和场景训练,提供可配置对手、离散/混合动作空间、EPV奖励塑造及并行执行。
Comments Code is available at: https://github.com/open-starlab/R2DRL
动态杂乱环境下的任务分配与运动规划:基于CBBA与凸集图
专题命中 机器人学习 :多智能体任务分配与运动规划
AI总结 针对动态杂乱环境中的多智能体任务规划,提出结合凸集图(GCS)进行轨迹优化与共识捆绑算法(CBBA)进行分布式任务分配的方法,实现安全高效的轨迹规划和任务协调。
Comments 15 pages single column, 10 figures, AIAA-Scitech 2027 Submission
Tilt-Ropter: 一种带有倾转旋翼和被动轮的全驱动混合空中-地面车辆
专题命中 机器人学习 :提出混合空中-地面车辆Tilt-Ropter,属于机器人。
AI总结 提出全驱动混合空中-地面车辆Tilt-Ropter,通过倾转旋翼和被动轮实现高效多模态运动,并设计统一非线性模型预测控制器实现低跟踪误差和地面运动功耗降低92.8%。
Comments 8 pages, 10 figures. Accepted by the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
如您所愿:利用LLM在精准农业中进行形式化验证的任务规划
专题命中 机器人学习 :LLM任务规划用于精准农业机器人
AI总结 针对自然语言歧义性,提出基于线性时序逻辑(LTL)反馈循环的LLM任务规划系统,通过双LLM分工实现规范生成与验证,提升精准农业任务规划的可靠性。
Journal ref Published in Proceedings of 2026 International Conference on Robotics and Automation (ICRA)
VLA 甚至知道基础知识吗?衡量视觉-语言-动作模型中的常识和世界知识保留
专题命中 机器人学习 :VLA模型在机器人任务中评估常识知识
AI总结 提出 Act2Answer 协议,通过动作回答评估 VLA 模型的知识保留,发现模型在简单概念上表现良好,但在丰富语义类别上存在差距,且 VQA 联合训练有助于知识保留。
Comments Project page: https://tttonyalpha.github.io/act2answer/
N(CO)$^2$: 基于机会约束的神经组合优化求解随机定向问题
专题命中 机器人学习 :神经组合优化求解随机定向问题
AI总结 提出N(CO)$^2$框架,结合强化学习求解随机定向问题,无需手工启发式,在不确定环境下优化路径选择,性能媲美MILP。
Journal ref In Proceedings of the IEEE International Conference on Automation Science and Engineering (CASE), 2025
TRIDENT: 打破混合安全-物理耦合以实现可证明安全的多智能体强化学习
专题命中 机器人学习 :提出可证明安全的多智能体强化学习框架。
AI总结 针对混合离散-连续动作、训练时安全约束和物理动力学形成的耦合问题,提出TRIDENT框架,通过Richardson-Romberg梯度校正、Lyapunov约束序列信任域更新和物理信息残差评论家,实现可证明的安全收敛,显著降低训练违规并提升奖励。
Comments 16 pages, 4 figures