视觉与机器人

图像生成

图像生成、文生图、图像编辑、扩散模型和可控生成。

今日/当前日期收录 3 篇信号源：cs.CV, cs.GR, cs.MM

2606.16849 2026-06-18 cs.NE cs.GR cs.HC 新提交专题 80

Evolution & Foundation: AI Shares Creative Control

进化与基础模型：AI共享创意控制

Dylan Banarse, Stephen Todd, William Latham, Frederic Fol Leymarie

专题命中可控生成：遗传算法与多模态AI生成3D有机形态

AI总结提出一种结合遗传算法与多模态AI基础模型的框架，实现自动化设计3D有机形态，将艺术家角色从直接选择转变为系统设计，加速创意探索。

URL PDF HTML

2606.13768 2026-06-18 cs.CV cs.AI 新提交专题 80

CineOrchestra：面向电影视频生成的统一实体中心条件控制

Sharath Girish, Tsai-Shien Chen, Zhikang Dong, Mukesh Singhal, Hao Chen, Sergey Tulyakov, Aliaksandr Siarohin

专题命中可控生成：扩散模型实现细粒度条件控制

AI总结提出CineOrchestra，一种统一控制主体、事件、相机和镜头切换的视频扩散模型，通过实体中心条件原语和参数无关的旋转位置编码实现多轴联合控制，在密集描述跟随和镜头切换时序上超越六种专用方法。

URL PDF HTML

2606.18788 2026-06-18 cs.CV cs.CL 新提交专题 75

HandwritingAgent: 语言驱动的可缩放矢量空间手写合成

Jaward Sesay, Yue Yu, Börje F. Karlsson

专题命中可控生成：语言驱动的手写笔画序列生成

AI总结提出HandwritingAgent，利用大推理模型在SVG格式中自动回归生成手写笔画序列，无需风格特定训练，通过自然语言和参考图像控制风格，在模仿、识别、多语言及复杂数学表达式合成等任务上达到或超越现有最优方法。

URL PDF HTML