机器人 / 具身智能 - arXivDaily 专题

2606.18888 2026-06-18 cs.AI 新提交专题 90

Generative-Model Predictive Planning for Navigation in Partially Observable Environments

部分可观测环境下导航的生成模型预测规划

Thomas Quilter, Yifan Zhu, Guorui Quan, Mingfei Sun, Samuel Kaski

专题命中具身导航：部分可观测环境导航，结合扩散模型与MPC

AI总结提出BeliefDiffusion框架，结合扩散模型和模型预测控制，显式建模多模态信念分布并进行前瞻规划，在合成地图环境中显著优于无模型强化学习和生成方法。

URL PDF HTML

2606.18426 2026-06-18 cs.RO 新提交专题 90

VEGA: 从野外自我中心视频中通过几何轨迹监督学习导航VLA

Gershom Seneviratne, Yohan Abeysinghe, Jianyu An, Vaibhav Shende, Dinesh Manocha

专题命中具身导航：训练导航VLA模型，利用自我中心视频

AI总结提出VEGA方法，利用未标注的自我中心视频通过重建场景几何生成障碍感知轨迹，训练流匹配VLA导航策略，在VEGA-Bench上碰撞减少33.0%，真实世界成功率提升至少150.0%。

URL PDF HTML

2606.18847 2026-06-18 cs.AI 新提交专题 85

WorldLines: 对长时域有状态具身智能体进行基准测试与建模

Yehang Zhang, Jianchong Su, Haojian Huang, Yifan Chang, Tianhao Zhou, Xinli Xu, Yingjie Xu, Yinchuan Li, Zexi Li, Ying-Cong Chen

专题命中具身导航：长时域具身智能体基准，家庭任务规划。

AI总结提出WorldLines基准，通过构建带时间跨度的家庭轨迹（含对话、动作、状态变化等）评估具身智能体的长时记忆与任务规划能力，并设计ObsMem记忆框架提升状态感知决策。

Comments 27 pages, 18 figures

URL PDF HTML

2606.18634 2026-06-18 cs.RO cs.AI 新提交专题 85

EffiNav: 融合深度与视觉语言实现高效物体目标导航

Zecheng Yin, Benedict Jun Ma

专题命中具身导航：融合深度与视觉语言实现物体目标导航

AI总结提出EffiNav框架，融合深度信息与视觉语言模型，通过预测探索边界和语义先验指导导航，在HM3D和OVON数据集上匹配或超越基线，提升路径效率与泛化性。

URL PDF HTML

2606.01605 2026-06-18 cs.RO 版本更新专题 85

将语义风险嵌入距离场和CBF用于在线单目安全控制

Dawei Zhang, Nuo Chen, Shuo Liu, Roberto Tron, Zhiwen Fan

专题命中具身导航：单目安全控制，语义风险嵌入距离场用于导航

AI总结提出一种在线单目感知到控制框架，通过将语义风险直接嵌入欧几里得符号距离场（ESDF），在控制优化前编码风险，实现基于控制障碍函数（CBF）的语义感知安全导航与遥操作。

URL PDF HTML

2606.19122 2026-06-18 cs.RO 新提交专题 70

基于混合2D-3D学习的人行道机器人单目3D占用感知

Yukai Ma, Joe Lin, Liu Liu, Honglin He, Lulu Ricketts, Brad Squicciarini, Yong Liu, Bolei Zhou

专题命中具身导航：人行道机器人导航，属于具身导航

AI总结提出WalkOCC框架，通过混合射线行进单目3D占用感知，结合LiDAR-RGB配对数据与大规模无配对单目图像学习，提升人行道机器人导航的预测精度和泛化能力。

URL PDF HTML