视觉与机器人
机器人 / 具身智能
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
1. 具身导航 2 篇
2. 机器人操作 8 篇
TaCauchy: An Extensible FEM Framework for Vision-Based Tactile Simulation
TaCauchy:面向视觉触觉仿真的可扩展有限元框架
专题命中 机器人操作 :触觉仿真框架用于机器人操作中的力计算
AI总结 提出TaCauchy框架,基于UIPC求解器在Isaac Sim中集成有限元法,直接计算柯西应力张量并投影为接触力,实现高保真触觉仿真,支持多种传感器,物理验证SSIM>0.93。
Comments Accepted to IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2026
One Demo is Worth a Thousand Trajectories: Action-View Augmentation for Visuomotor Policies
一个演示胜过千条轨迹:用于视觉运动策略的动作-视角增强
专题命中 机器人操作 :提出动作-视角增强框架提升操作策略成功率
AI总结 提出一种数据增强框架,通过高斯泼溅和轨迹优化生成逼真的鱼眼图像序列和物理可行的动作轨迹,提升操作策略在场景变化和障碍物下的成功率。
Comments Project website: https://chuerpan.com/1001-demos.github.io/. Published at CoRL 2025
Journal ref Proceedings of The 9th Conference on Robot Learning, PMLR 305:3902-3914, 2025
3. 机器人学习 19 篇
CoLI: A Reproducible Platform for Continuum Robot Learning via Monolithic 3D Printing and Isomorphic Teleoperation
CoLI: 通过整体3D打印和同构遥操作实现连续体机器人学习的可复现平台
专题命中 机器人学习 :连续体机器人学习平台,支持模仿学习和遥操作。
AI总结 提出一种基于多材料3D打印和同构遥操作的连续体机器人平台,简化制造流程并实现无奇异映射控制,支持模仿学习自主控制,通过硬件表征和操作任务验证其可复现性和学习就绪性。
Comments 8 pages, 7 figures, 1 table, accepted by IROS2026
Robust Assembly State Reasoning from Action Recognition for Human-Robot Collaboration
面向人机协作的基于动作识别的鲁棒装配状态推理
专题命中 机器人学习 :人机协作中的装配状态推理。
AI总结 研究从动作识别输入跟踪装配状态的方法,比较逻辑、HMM和神经网络方法,发现最优方法因任务而异,逻辑方法在多变场景更鲁棒。
Comments Preprint accepted to the 35th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2026). 8 pages, 9 figures, 3 tables
Start Right, Arrive Right: Asynchronous Execution via Initial Noise Selection
开始正确,到达正确:通过初始噪声选择实现异步执行
专题命中 机器人学习 :通过初始噪声选择解决机器人异步执行中的动作块不一致。
AI总结 针对流式策略异步执行中的动作块边界不一致问题,提出无需训练的PAINT方法,通过初始噪声选择而非轨迹引导实现前缀一致性,在12个模拟和6个真实操作任务中提升执行一致性与任务性能。
Comments First version 19 pages, project site: https://paint-action-chunking.github.io
ImageWAM: Do World Action Models Really Need Video Generation, or Just Image Editing?
ImageWAM:世界动作模型真的需要视频生成,还是只需要图像编辑?
专题命中 机器人学习 :用图像编辑模型进行机器人动作预测
AI总结 提出ImageWAM框架,利用预训练图像编辑模型替代视频生成进行机器人动作预测,通过编辑去噪的KV缓存作为世界动作上下文,在多个模拟和真实实验中优于基线,计算量降至1/6,延迟降至1/4。
Comments Project Page: https://zhangwenyao1.github.io/ImageWAM/
Superhuman Safe and Agile Racing through Multi-Agent Reinforcement Learning
通过多智能体强化学习实现超人类安全且敏捷的赛车
专题命中 机器人学习 :多智能体强化学习用于四旋翼赛车
AI总结 本文提出通过多智能体强化学习在高速四旋翼赛车中实现安全且敏捷的性能,展示了多智能体交互对真实世界交互安全性的关键作用,同时在高速赛车中超越人类飞行员并减少碰撞率。
Comments 12 pages (+4 supplementary). Website: https://rpg.ifi.uzh.ch/marl