视觉与机器人
机器人 / 具身智能
机器人、具身智能、机器人学习、操作、导航和具身世界模型。
1. 机器人学习 18 篇
High-Degree-of-Freedom Lightweight Bioinspired Leg for Enhanced Mobility in Small Robots
高自由度轻量化仿生腿:提升小型机器人机动性
专题命中 机器人学习 :微型机器人高自由度仿生腿设计
AI总结 针对微型机器人腿部自由度受限问题,提出一种四自由度并联腿机构,通过同心设计简化运动学,实现轻量化(18.9g)和大工作空间(>22255 mm³),显著提升运动灵活性。
Journal ref 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
A Scalable Embodied Intelligence Platform for Seamless Real-to-Sim-to-Real Transfer of Household Mobile Manipulation Tasks
一种可扩展的具身智能平台,用于家庭移动操作任务的无缝真实-仿真-真实迁移
专题命中 机器人学习 :家庭移动操作任务的真实-仿真-真实迁移平台
AI总结 提出BestMan平台,通过自动化场景生成、仿真引导任务形式化和硬件无关中间件,解决真实-仿真-真实迁移中的场景重建、策略评估和部署兼容性挑战,实现家庭移动操作的无缝迁移。
Comments CCF Transactions on Pervasive Computing and Interaction
R2D-RL: A RoboCup 2D Soccer Environment for Multi-Agent Reinforcement Learning
R2D-RL:用于多智能体强化学习的RoboCup 2D足球环境
专题命中 机器人学习 :多智能体强化学习环境,机器人足球
AI总结 提出R2D-RL环境,通过共享内存通信和周期级同步连接RCSS2D与Python MARL接口,支持全场和场景训练,提供可配置对手、离散/混合动作空间、EPV奖励塑造及并行执行。
Comments Code is available at: https://github.com/open-starlab/R2DRL
Task Allocation and Motion Planning in Dynamic, Cluttered Environments via CBBA and Graphs of Convex Sets
动态杂乱环境下的任务分配与运动规划:基于CBBA与凸集图
专题命中 机器人学习 :多智能体任务分配与运动规划
AI总结 针对动态杂乱环境中的多智能体任务规划,提出结合凸集图(GCS)进行轨迹优化与共识捆绑算法(CBBA)进行分布式任务分配的方法,实现安全高效的轨迹规划和任务协调。
Comments 15 pages single column, 10 figures, AIAA-Scitech 2027 Submission
Tilt-Ropter: A Fully Actuated Hybrid Aerial-Terrestrial Vehicle with Tilt Rotors and Passive Wheels
Tilt-Ropter: 一种带有倾转旋翼和被动轮的全驱动混合空中-地面车辆
专题命中 机器人学习 :提出混合空中-地面车辆Tilt-Ropter,属于机器人。
AI总结 提出全驱动混合空中-地面车辆Tilt-Ropter,通过倾转旋翼和被动轮实现高效多模态运动,并设计统一非线性模型预测控制器实现低跟踪误差和地面运动功耗降低92.8%。
Comments 8 pages, 10 figures. Accepted by the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026)
As You Wish: Mission Planning with Formal Verification using LLMs in Precision Agriculture
如您所愿:利用LLM在精准农业中进行形式化验证的任务规划
专题命中 机器人学习 :LLM任务规划用于精准农业机器人
AI总结 针对自然语言歧义性,提出基于线性时序逻辑(LTL)反馈循环的LLM任务规划系统,通过双LLM分工实现规范生成与验证,提升精准农业任务规划的可靠性。
Journal ref Published in Proceedings of 2026 International Conference on Robotics and Automation (ICRA)
Does VLA Even Know the Basics? Measuring Commonsense and World Knowledge Retention in Vision-Language-Action Models
VLA 甚至知道基础知识吗?衡量视觉-语言-动作模型中的常识和世界知识保留
专题命中 机器人学习 :VLA模型在机器人任务中评估常识知识
AI总结 提出 Act2Answer 协议,通过动作回答评估 VLA 模型的知识保留,发现模型在简单概念上表现良好,但在丰富语义类别上存在差距,且 VQA 联合训练有助于知识保留。
Comments Project page: https://tttonyalpha.github.io/act2answer/
2. 具身导航 3 篇
3. 机器人基础模型 3 篇
Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation
Qwen-RobotWorld技术报告:通过语言条件视频生成统一具身世界模型
专题命中 机器人基础模型 :具身世界模型,用于机器人操作等任务
AI总结 提出Qwen-RobotWorld,一种以自然语言为统一动作接口的语言条件视频世界模型,通过双流MMDiT、大规模具身世界知识语料和渐进式课程训练,在机器人操作、自动驾驶等任务中实现物理一致的未来视觉轨迹预测,在多个基准上取得最优结果。
4. 具身推理 1 篇
5. 机器人操作 2 篇
Self-Supervised Mask-Aware Transformers for Fault-Tolerant FBG Force Sensing in Minimally Invasive Surgical Robotics
自监督掩码感知Transformer用于微创手术机器人中容错FBG力传感
专题命中 机器人操作 :微创手术机器人中FBG力传感的容错方法
AI总结 针对微创手术机器人中FBG传感器因通道耦合和断裂导致的力估计退化问题,提出统一的自监督掩码感知Transformer,通过掩码通道重建预训练和动态损坏课程微调,实现多通道故障下的优雅降级,在8通道数据集上达到0.0066 N均方根误差。
6. 其他机器人 3 篇
Dual-Channel Grounded World Modeling (DCGWM): Structural Prevention of Objective Interference Collapse via Heterogeneous External Grounding with Inward-Only Gradient Flow
双通道接地世界建模 (DCGWM):通过异构外部接地与内向梯度流结构性防止目标干扰崩溃
专题命中 其他机器人 :世界模型表示学习,双通道接地
AI总结 提出双通道接地世界建模(DCGWM),通过分区潜空间和内向梯度流,结构性防止联合嵌入预测架构中多目标接地导致的目标干扰崩溃。
Comments Position paper. Experimental validation in progress