视觉与机器人
机器人 / 具身智能
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
1. 机器人基础模型 2 篇
Qwen-RobotManip Technical Report: Alignment Unlocks Scale for Robotic Manipulation Foundation Models
Qwen-RobotManip 技术报告:对齐解锁机器人操作基础模型的规模
专题命中 机器人基础模型 :机器人操作基础模型,大规模预训练
AI总结 提出 Qwen-RobotManip,通过统一的对齐框架(表示、运动和行为维度)实现多源异构操作数据的大规模协同训练,构建约38,100小时预训练语料,在零样本指令跟随、跨本体迁移等泛化能力上超越先前模型。
Comments 44 pages
2. 机器人操作 12 篇
3. 机器人学习 12 篇
Do as I Do: Dexterous Manipulation Data from Everyday Human Videos
Do as I Do: 从日常人类视频中获取灵巧操作数据
专题命中 机器人学习 :从人类视频重建灵巧操作数据
AI总结 提出DO AS I DO算法,从单目RGB人类视频中重建手-物交互并重定向到多指灵巧机器人手,生成可执行的操作数据,优于现有方法。
Comments Project website: https://do-as-i-do.com/
Recover, Discover, Plan: Learning Skills and Concepts from Robot Failures
恢复、发现、规划:从机器人失败中学习技能与概念
专题命中 机器人学习 :从机器人失败中学习技能与概念,实现长期规划。
AI总结 提出ReSYNC方法,通过技能学习与概念发现的交替过程,从失败恢复经验中逐步构建抽象谓词,实现全局失败避免和长期规划,性能提升超50%。
Comments 9 pages, 6 figures. Website: https://jaraxxus-me.github.io/ReSYNC/
TactSpace: Learning a Physics-enriched Shared Latent Space for Tactile Sim-to-Real Transfer
TactSpace: 学习富含物理信息的共享潜在空间以实现触觉模拟到现实的迁移
专题命中 机器人学习 :学习共享潜在空间实现触觉模拟到现实迁移。
AI总结 提出多模态表示学习框架TactSpace,通过共享潜在空间对齐异构触觉模态,实现零样本模拟到现实迁移,在力预测和形状重建任务中分别降低误差16.7%和45.8%。
Comments 9 pages, 6 figures, 4 tables, accepted into IROS 2026
Generating Natural and Expressive Robot Gestures through Iterative Reinforcement Learning with Human Feedback using LLMs
通过基于人类反馈的迭代强化学习利用大语言模型生成自然且富有表现力的机器人手势
专题命中 机器人学习 :机器人手势生成,RLHF优化表达。
AI总结 针对社交机器人手势生成僵硬问题,提出将ChatGPT集成到Pepper机器人中生成共语手势,并引入基于人类反馈的迭代强化学习(RLHF)优化手势,实验表明RLHF提升了手势的表现力、相关性和流畅性。
Comments 8 Pages, 6 Figures
Leveraging Energy Features for Surface Classification with Deep Learning: A Comparative Analysis Across Three Independent Datasets
利用能量特征进行基于深度学习的表面分类:三个独立数据集的比较分析
专题命中 机器人学习 :移动机器人表面分类,使用能量特征
AI总结 研究评估能量特征作为表面分类的独立或辅助模态的可行性,在三个数据集上比较多种深度学习架构,发现CNN性能最优,纯能量特征准确率85-90%,与惯性特征结合可达96-99%,且能量特征可稳定提升1-2%准确率。
High-Degree-of-Freedom Lightweight Bioinspired Leg for Enhanced Mobility in Small Robots
高自由度轻量化仿生腿:提升小型机器人机动性
专题命中 机器人学习 :微型机器人高自由度仿生腿设计
AI总结 针对微型机器人腿部自由度受限问题,提出一种四自由度并联腿机构,通过同心设计简化运动学,实现轻量化(18.9g)和大工作空间(>22255 mm³),显著提升运动灵活性。
Journal ref 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
A Scalable Embodied Intelligence Platform for Seamless Real-to-Sim-to-Real Transfer of Household Mobile Manipulation Tasks
一种可扩展的具身智能平台,用于家庭移动操作任务的无缝真实-仿真-真实迁移
专题命中 机器人学习 :家庭移动操作任务的真实-仿真-真实迁移平台
AI总结 提出BestMan平台,通过自动化场景生成、仿真引导任务形式化和硬件无关中间件,解决真实-仿真-真实迁移中的场景重建、策略评估和部署兼容性挑战,实现家庭移动操作的无缝迁移。
Comments CCF Transactions on Pervasive Computing and Interaction