视觉与机器人
机器人 / 具身智能
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
1. 机器人基础模型 3 篇
Qwen-RobotManip Technical Report: Alignment Unlocks Scale for Robotic Manipulation Foundation Models
Qwen-RobotManip 技术报告:对齐解锁机器人操作基础模型的规模
专题命中 机器人基础模型 :机器人操作基础模型,大规模预训练
AI总结 提出 Qwen-RobotManip,通过统一的对齐框架(表示、运动和行为维度)实现多源异构操作数据的大规模协同训练,构建约38,100小时预训练语料,在零样本指令跟随、跨本体迁移等泛化能力上超越先前模型。
Comments 44 pages
2. 机器人操作 13 篇
DexSynRefine: Synthesizing and Refining Human-Object Interaction Motion for Physically Feasible Dexterous Robot Actions
DexSynRefine:合成与精炼人-物交互运动以实现物理可行的灵巧机器人动作
专题命中 机器人操作 :提出DexSynRefine框架,实现灵巧机器人操作。
AI总结 提出DexSynRefine框架,通过HOI-MMFP运动先验合成手-物轨迹,结合任务空间残差强化学习和接触动力学适应,将人-物交互数据转化为物理可行的灵巧操作,在五个任务上成功率提升50-70个百分点。
Comments Project page: https://dexsynrefine.github.io/
3. 机器人学习 10 篇
Do as I Do: Dexterous Manipulation Data from Everyday Human Videos
Do as I Do: 从日常人类视频中获取灵巧操作数据
专题命中 机器人学习 :从人类视频重建灵巧操作数据
AI总结 提出DO AS I DO算法,从单目RGB人类视频中重建手-物交互并重定向到多指灵巧机器人手,生成可执行的操作数据,优于现有方法。
Comments Project website: https://do-as-i-do.com/
R2BC: Multi-Agent Imitation Learning from Single-Agent Demonstrations
R2BC: 从单智能体演示进行多智能体模仿学习
专题命中 机器人学习 :多机器人模仿学习,核心是机器人学习
AI总结 提出R2BC方法,通过轮换单智能体演示训练多机器人系统,无需联合动作空间演示,在模拟和实物任务中性能媲美或超越基于特权同步演示的基线方法。
Comments 8 pages, 6 figures. In Proceedings: IEEE International Conference on Robotics & Automation (ICRA 2026)
Recover, Discover, Plan: Learning Skills and Concepts from Robot Failures
恢复、发现、规划:从机器人失败中学习技能与概念
专题命中 机器人学习 :从机器人失败中学习技能与概念,实现长期规划。
AI总结 提出ReSYNC方法,通过技能学习与概念发现的交替过程,从失败恢复经验中逐步构建抽象谓词,实现全局失败避免和长期规划,性能提升超50%。
Comments 9 pages, 6 figures. Website: https://jaraxxus-me.github.io/ReSYNC/
TactSpace: Learning a Physics-enriched Shared Latent Space for Tactile Sim-to-Real Transfer
TactSpace: 学习富含物理信息的共享潜在空间以实现触觉模拟到现实的迁移
专题命中 机器人学习 :学习共享潜在空间实现触觉模拟到现实迁移。
AI总结 提出多模态表示学习框架TactSpace,通过共享潜在空间对齐异构触觉模态,实现零样本模拟到现实迁移,在力预测和形状重建任务中分别降低误差16.7%和45.8%。
Comments 9 pages, 6 figures, 4 tables, accepted into IROS 2026
Generating Natural and Expressive Robot Gestures through Iterative Reinforcement Learning with Human Feedback using LLMs
通过基于人类反馈的迭代强化学习利用大语言模型生成自然且富有表现力的机器人手势
专题命中 机器人学习 :机器人手势生成,RLHF优化表达。
AI总结 针对社交机器人手势生成僵硬问题,提出将ChatGPT集成到Pepper机器人中生成共语手势,并引入基于人类反馈的迭代强化学习(RLHF)优化手势,实验表明RLHF提升了手势的表现力、相关性和流畅性。
Comments 8 Pages, 6 Figures
Leveraging Energy Features for Surface Classification with Deep Learning: A Comparative Analysis Across Three Independent Datasets
利用能量特征进行基于深度学习的表面分类:三个独立数据集的比较分析
专题命中 机器人学习 :移动机器人表面分类,使用能量特征
AI总结 研究评估能量特征作为表面分类的独立或辅助模态的可行性,在三个数据集上比较多种深度学习架构,发现CNN性能最优,纯能量特征准确率85-90%,与惯性特征结合可达96-99%,且能量特征可稳定提升1-2%准确率。