图像生成 - arXivDaily 专题

2606.19103 2026-06-18 cs.CV cs.AI 新提交专题 90

ProductConsistency: Improving Product Identity Preservation in Instruction-Based Image Editing via SFT and RL

ProductConsistency：通过SFT和RL改进基于指令的图像编辑中的产品身份保持

Mukund Khanna, Raj Singh Yadav, Kunal Singh

专题命中图像编辑：基于指令的图像编辑，保持产品身份。

AI总结针对基于指令的图像编辑中产品特征保持不足的问题，提出ProductConsistency数据集和循环一致性奖励，结合监督微调与强化学习，显著提升产品一致性、文本渲染和视觉质量。

Comments CVPR HiGen 2026

URL PDF HTML

2606.18906 2026-06-18 cs.CV 新提交专题 90

BindEdit: 驯服注意力泄漏以实现精确的多目标图像编辑

Chaewon Park, Soyoon Lee, Naeun Lee, Minjung Shin, Seogkyu Jeon, Kibeom Hong

专题命中图像编辑：提出多目标图像编辑方法抑制注意力泄漏

AI总结针对多目标图像编辑中的语义混合和对象重复问题，提出BindEdit方法，通过联合正则化交叉注意力和自注意力、交叉注意力重平衡机制及区域保真项，在单次扩散轨迹内抑制注意力泄漏，实现精确编辑。

Comments Preprint

URL PDF HTML

2606.19073 2026-06-18 cs.CV 新提交专题 85

驯服I2V模型用于图像HOI编辑：认知基准与智能体自校正框架

Jiayi Gao, Qingchao Chen, Yuxin Peng, Yang Liu

专题命中图像编辑：图像HOI编辑，利用I2V模型。

AI总结提出HOI-Edit基准和SCPE框架，利用I2V模型的时间生成能力进行动态人-物交互编辑，通过自校正提示迭代优化，实现与SOTA竞争的性能。

URL PDF HTML

2605.21431 2026-06-18 cs.CV 版本更新专题 85

iTryOn: 通过空间-语义引导掌握交互式视频虚拟试穿

Jun Zheng, Zhengze Xu, Mengting Chen, Jing Wang, Jinsong Lan, Xiaoyong Zhu, Kaifu Zhang, Bo Zheng, Xiaodan Liang

专题命中图像编辑：交互式视频虚拟试穿，属于图像生成与编辑。

AI总结本文提出iTryOn框架，通过空间-语义引导解决交互式视频虚拟试穿中的语义模糊和复杂服装变形问题，实现了更动态可控的虚拟试穿体验。

Comments Project Page: https://zhengjun-ai.github.io/itryon-page. Accepted by ICML 2026

URL PDF HTML

2604.03156 2026-06-18 cs.CV 版本更新专题 85

CAMEO: 一种条件感知与质量驱动的多智能体图像编辑编排器

Yuhan Pu, Hao Zheng, Ziqian Mo, Zirui Pang, Hill Zhang, Tianyi Fan, Shuhong Wu, Jiaheng Wei

专题命中图像编辑：多智能体框架进行条件图像编辑，含质量评估

AI总结提出CAMEO多智能体框架，将条件图像编辑重构为质量感知的反馈驱动过程，通过分解编辑阶段、嵌入评估循环，在异常插入和人体姿态切换任务中平均胜率提升20%。

URL PDF HTML