图像生成 - arXivDaily 专题

2508.03483 2026-06-18 cs.CV cs.AI 版本更新专题 90

When Cars Have Stereotypes: Auditing Demographic Bias in Objects from Text-to-Image Models

当汽车有刻板印象：审计文本到图像模型中对象的群体偏见

Dasol Choi, Jihwan Lee, Minjae Lee, Minsuk Kahng

专题命中文生图：审计文本到图像模型中的群体偏见，涉及图像生成。

AI总结提出SODA框架，通过三个指标系统测量文本到图像模型在生成对象中的群体偏见，发现中性提示隐含偏向中年和白人，且人口统计线索导致高度偏斜的刻板输出。

URL PDF HTML

2606.11615 2026-06-18 cs.CV cs.CR cs.LG 新提交专题 85

Adv-TGD: Adversarial Text-Guided Diffusion for Face Recognition Impersonation Attacks

Adv-TGD：面向人脸识别冒充攻击的对抗性文本引导扩散

Omid Ahmadieh, Nima Karimian

专题命中文生图：文本引导扩散生成对抗人脸

AI总结提出Adv-TGD框架，利用Stable Diffusion和LoRA微调生成逼真对抗人脸，在保持视觉质量的同时实现高成功率身份冒充攻击，平均ASR达85.90%。

URL PDF HTML

2605.14877 2026-06-18 cs.CV 版本更新专题 85

HeatKV: Head-tuned KV-cache Compression for Visual Autoregressive Modeling

HeatKV：针对视觉自回归建模的头部调制KV缓存压缩

Jonathan Cederlund, Axel Berg, William Isaksson, Durmus Alp Emre Acar, Chuteng Zhou, Pontus Giselsson

专题命中文生图：提出HeatKV压缩方法用于视觉自回归图像生成。

AI总结本文提出HeatKV方法，通过根据每个头部对先前生成尺度的注意力进行调整，实现更高效的KV缓存压缩，提升内存利用率并保持图像生成质量。

Comments 18 pages total including appendix; 6 main-paper figures, 2 appendix figures; 4 tables

URL PDF HTML

2606.18555 2026-06-18 cs.CV 新提交专题 70

Rethinking Text-to-Image as Semantic-Aware Data Augmentation for Indoor Scene Recognition

重新思考文本到图像作为室内场景识别的语义感知数据增强

Trong-Vu Hoang, Quang-Binh Nguyen, Dinh-Khoi Vo, Hoai-Danh Vo, Minh-Triet Tran, Trung-Nghia Le

专题命中文生图：利用稳定扩散生成合成图像

AI总结针对室内图像数据不足，提出利用稳定扩散生成合成图像进行数据增强，并通过扩散重建误差防止滥用，在MIT室内场景数据集上验证了有效性。

Comments MAPR 2024

URL PDF HTML

2606.18554 2026-06-18 cs.CV 新提交专题 60

Forged Calamity: Benchmark for Cross-Domain Synthetic Disaster Detection in the Age of Diffusion

伪造灾难：扩散时代跨域合成灾难检测基准

Duc-Manh Phan, Quoc-Duy Tran, Duy-Khang Do, Anh-Tuan Vo, Hai-Dang Nguyen, Trong Le Do, Mai-Khiem Tran, Vinh-Tiep Nguyen, Tam V. Nguyen, Isao Echizen, Minh-Triet Tran, Trung-Nghia Le

专题命中文生图：检测扩散模型生成的合成图像

AI总结针对扩散模型生成的逼真灾难图像难以检测的问题，提出包含30000张图像（6000张真实、24000张合成）的基准数据集，实验发现微调检测器在未知生成器上准确率下降50%，零样本检测器也不稳定，凸显了跨域检测的迫切需求。

Comments SOICT 2025

URL PDF HTML