视觉与机器人
图像生成
图像生成、文生图、图像编辑、扩散模型和可控生成。
1. 图像编辑 2 篇
Relighting as a Probe of Visual Priors via Augmented Latent Intrinsics
通过增强潜在本征属性将重光照作为视觉先验的探针
专题命中 图像编辑 :重光照属于图像编辑范畴
AI总结 提出增强潜在本征属性(ALI)方法,融合密集像素对齐视觉特征到潜在本征重光照模型,平衡语义与光度保真度,提升复杂材质重光照质量。
Comments Camera-ready version for ICML 2026. Project page: https://augmented-latent-intrinsics.github.io
2. 扩散模型 3 篇
3. 可控生成 3 篇
Text2Structure3D: Graph-Based Generative Modeling of Equilibrium Structures with Diffusion Transformers
Text2Structure3D: 基于扩散变换器的图生成建模平衡结构
专题命中 可控生成 :从文本生成平衡结构图,属于可控结构生成。
AI总结 提出Text2Structure3D,结合潜在扩散、变分图自编码器和图变换器,从自然语言提示生成接近平衡状态的结构图,并通过残余力优化确保完全满足静力平衡。
Journal ref Results in Engineering 31 (2026) 111375
MeshPad: Interactive Sketch-Conditioned Artist-Reminiscent Mesh Generation and Editing
MeshPad: 交互式草图条件艺术家风格网格生成与编辑
专题命中 可控生成 :草图条件生成3D网格,涉及可控生成。
AI总结 提出MeshPad,一种基于草图输入的交互式3D网格生成与编辑方法,通过分解为网格区域的删除和添加操作,结合Transformer和顶点对齐推测策略,实现快速迭代编辑,在Chamfer距离上提升22%以上质量,并获90%用户偏好。
Comments Project page: https://derkleineli.github.io/meshpad/ Video: https://www.youtube.com/watch?v=_T6UTGTMZ1E
4. 文生图 2 篇
How Creatives Approach GenAI Image Generation: Tensions Between Structured Guidance, Self-Experimentation, and Creative Autonomy
创意人士如何接近生成式AI图像生成:结构化指导、自我实验与创意自主之间的张力
专题命中 文生图 :研究创意人士使用GenAI图像生成工具的行为
AI总结 研究探讨创意人士在使用生成式AI图像工具时如何平衡结构化指导与自我实验,发现尽管指导有助于理解AI,但许多人仍倾向于自我探索以保持创意自由。
Comments Accepted at ACM Creativity & Cognition 2026
5. 其他图像生成 1 篇
Graph Diffusion-Based AeBS Deployment and Resource Allocation in RSMA-Enabled URLLC Low-Altitude Wireless Networks
基于图扩散的RSMA使能URLLC低空无线网络中AeBS部署与资源分配
专题命中 其他图像生成 :图扩散模型用于资源分配,弱相关。
AI总结 针对低空无线网络中频谱受限和同频干扰问题,提出基于速率分割多址接入(RSMA)的传输设计,并利用生成式图扩散模型联合优化AeBS部署、用户关联和资源分配,以最大化总速率和覆盖率。
Comments 13 pages, 9 figures