A Persona-Based Evaluation Framework for Pluralistic Alignment in Generative AI
基于人格的生成式AI多元对齐评估框架
发表机构 * Atahan Karagöz(阿塔汗·卡拉戈兹)
AI总结 提出一种状态空间约束仿真框架,通过合成认知轮廓替代单一评估函数,实现反映真实世界共识变异性的多元、视角依赖的基准测试,并分析仿真评估者的稳定性问题,论证动态调节机制的必要性。
基于人格的生成式AI多元对齐评估框架
发表机构 * Atahan Karagöz(阿塔汗·卡拉戈兹)
AI总结 提出一种状态空间约束仿真框架,通过合成认知轮廓替代单一评估函数,实现反映真实世界共识变异性的多元、视角依赖的基准测试,并分析仿真评估者的稳定性问题,论证动态调节机制的必要性。
一种高效且可扩展的保结构图压缩方法
发表机构 * Southwest University(西南大学)
AI总结 提出一种解耦节点压缩与图结构生成的保结构图压缩方法(SP-ESGC),通过热核特征传播和混合聚类策略实现高效图压缩,并利用预训练边预测器生成可迁移的结构模式,在保持高计算效率的同时提升跨GNN架构的泛化能力。
物理信息粗化用于多重网格图神经网络代理
发表机构 * Amir Bazzi(阿米尔·巴齐) ; David Cardinaux(大卫·卡迪纳克斯) ; Ramy Nemer(拉米·纳默) ; José Alves(若泽·阿尔维斯) ; Arjun Kalkur(阿鲁金·卡尔库) ; Matpadi Raghavendra(马特帕迪·拉吉文德拉) ; Elie Hachem(埃利·哈克)
AI总结 针对固体力学中的非线性弹性、塑性和瞬态行为,提出一种结合物理信息粗化策略的多重网格图神经网络,通过基于残差的局部活动评分保留高应变/应力区域,实现分层消息传递,提升长期滚动稳定性和精度。
Comments Accepted at ICML 2026. 16 pages, 5 figures
MoG:用于基于图的检索增强生成的混合专家模型
发表机构 * The Hong Kong Polytechnic University(香港理工大学) ; Monash University(墨尔本大学) ; Tencent Youtu Lab(腾讯优图实验室)
AI总结 提出MoG框架,通过组织知识为中心枢纽图和稀疏激活的专家图,利用拓扑感知路由器动态选择相关专家图,以解决检索增强生成中统一知识库引入无关信息的问题,在MuSiQue上相对提升超过20%。
DEM:面向生理传感器网络中可解释异常检测的蒸馏解释模型
发表机构 * Department of Computer Science and Information Systems(计算机科学与信息系统系) ; Department of Electrical and Electronics Engineering(电气与电子工程系)
AI总结 提出一种三阶段玻璃箱框架DEM,通过将梯度提升专家模型的知识蒸馏到基于线性基线残差的决策树中,实现高精度与内在可解释性的异常检测,并引入蒸馏保真度指标量化解释可信度。
Comments 21 pages, 10 figures, 7 tables. Code: https://github.com/Jyotirmoy17/dem-model
通过 Sheaf-ADMM 学习多智能体协调
发表机构 * universityofwarsaw(华沙大学)
AI总结 提出一种可微优化框架,利用细胞层(sheaf)和ADMM实现多智能体协调,在迷宫路径规划、图像分类和数独任务中验证了其有效性,并展现出优于标准消息传递架构的可解释性和鲁棒性。
Comments 17 pages, 8 figures, 6 tables. Accepted at ICML 2026
分割指纹数据增强的迭代框架
发表机构 * Federal University of Technology (UTFPR) Pato Branco, Parana Brazil(联邦技术大学(UTFPR)帕托布兰科,巴西南里维亚州)
AI总结 针对婴儿指纹数据稀缺问题,提出一种迭代数据增强方法,通过在训练用于提取指纹脊线和谷线的卷积神经网络中引入错误,生成多样化的分割指纹变体,实验证明该方法能有效扩展指纹变异性且保持视觉相似性。
Journal ref Anais do XV Workshop de Sistemas de Informação 2024
专家特征向量是无需训练的非崩溃路由器
发表机构 * Applied Artificial Intelligence Intiative (A2I2), Deakin University, Victoria, Australia(应用人工智能倡议(A2I2),德肯大学,维多利亚,澳大利亚)
AI总结 针对稀疏混合专家模型中专家崩溃问题,提出基于专家权重矩阵特征向量的无需训练路由框架SSMoE,通过奇异值分解利用谱特性提升模型性能。
Comments 24 pages
Journal ref ICML 2026
推理时奖励对齐中的并行回火初始采样
发表机构 * Department of Artificial Intelligence(人工智能系) ; Department of Computer Science(计算机科学系)
AI总结 针对推理时奖励对齐中标准SMC方法因初始采样陷入局部模式的问题,提出基于并行回火的PATHS方法,通过耦合多条回火链实现高效探索,提升对齐质量。
Comments 31 pages, 11 figures
动态环境下基于实时VR的机械臂遥操作框架研究
发表机构 * Department of Robotics, Hanyang University(韩世大学机器人系) ; Department of Smart Construction Engineering, Hanyang University(韩世大学智能建造工程系) ; Department of Interdisciplinary Robot Engineering Systems, Hanyang University(韩世大学跨学科机器人工程系统系) ; School of Smart Convergence Engineering, Hanyang University, Ansan(韩世大学智能融合工程学院,安山)
AI总结 提出一种集成GPU加速逆运动学和轨迹优化的VR遥操作框架,在静态和动态障碍物环境中实现低延迟、碰撞感知的实时机械臂控制。
Comments This manuscript has been submitted for possible publication
多对象3D高斯泼溅场景的单步修复方法基准测试
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心)
AI总结 针对3D高斯泼溅场景中的对象移除与修复任务,比较了2D修复器在3D一致性上的表现,发现基于重建的修复器优于生成扩散模型,且从头初始化场景比微调现有场景效果更好,同时引入了一个带真实数据的新多对象场景。
Comments Accepted as an extended abstract to the CVEU Workshop at CVPR 2026
生成报告还是重复模板?测量和缓解三维CT报告生成中的模板崩溃
发表机构 * Technical University of Munich (TUM)(慕尼黑技术大学) ; TUM Hospital(TUM医院) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心)
AI总结 针对三维CT报告生成中模型输出多样性低、病理检测能力差的模板崩溃问题,提出解耦框架CLarGen,通过分离临床检测与语言合成,显著提升临床准确性并保持报告流畅性。
BEV感知能否在传感器故障下优雅降级?
发表机构 * Tianjin Key Laboratory of Intelligent Unmanned Swarm Technology and System(天津智能无人群技术与系统重点实验室) ; School of Electrical and Information Engineering, Tianjin University(天津大学电气与信息工程学院) ; Key Laboratory of System Control and Information Processing, Ministry of Education of China(系统控制与信息处理重点实验室,中华人民共和国教育部)
AI总结 针对多模态BEV感知在传感器损坏时性能骤降的问题,提出Grace-BEV框架,通过主动可靠性评估和动态特征重校准实现优雅降级,在极端LiDAR故障下将mAP从0.0%恢复至34.7%。
自回归Transformer中的认知疲劳:形式化与测量
发表机构 * Guru Gobind Singh Indraprastha University, India(古鲁·戈宾德·辛格·印度普拉斯塔大学) ; Artificial Intelligence Institute, University of South Carolina, USA(人工智能研究所,南卡罗来纳大学) ; Indian Institute of Technology, Kanpur, India(印度理工学院,坎浦尔) ; Indian AI Research Organization, India(印度人工智能研究组织)
AI总结 本文形式化自回归语言模型在长程生成中的退化现象为认知疲劳,并提出轻量级诊断指标疲劳指数(FI),通过聚合注意力衰减、表征漂移和熵校准三个信号实现实时监测,实验表明FI能高精度预测任务退化和重复生成。
Comments 9 pages, 7 figures. Accepted at the 43rd International Conference on Machine Learning (ICML 2026)
BiSegMamba: 用于3D医学图像分割的高效双向三向Mamba
发表机构 * School of Computer Science and Engineering, Beihang University(北航计算机科学与工程学院) ; State Key Laboratory of Virtual Reality Technology and Systems, Beihang University(北航虚拟现实技术与系统国家重点实验室)
AI总结 提出BiSegMamba,一种基于双向三向Mamba的高效3D医学图像分割网络,通过渐进压缩主干、多尺度空间混合器、双向正交Mamba块和自适应方向融合,在降低计算成本的同时提升分割精度。
Comments 10 pages, 7 figures, 5 tables. Code is available at: https://github.com/bakhtzadaabshare/BiSegMamba
全监督运动编辑:通过正负学习平衡变化与不变性
发表机构 * Shanghai Institute of Artificial Intelligence for Education, East China Normal University, China(上海人工智能教育研究院,华东师范大学,中国) ; School of Computer Science and Technology, East China Normal University, China(华东师范大学计算机科学与技术学院,中国) ; School of Statistics, East China Normal University, China(华东师范大学统计学院,中国) ; The 27th Research Institute of CETC, Zhengzhou, China(中国电子科技集团第27研究所,郑州,中国) ; Key Laboratory of Advanced Theory and Application in Statistics and Data Science, MOE, China(教育部统计与数据科学先进理论与应用重点实验室,中国) ; Shanghai Key Laboratory of Computer Software Evaluating and Testing, China(上海计算机软件评测测试重点实验室,中国) ; School of Computer Science, Shanghai Jiao Tong University, China(上海交通大学计算机科学学院,中国)
AI总结 提出OmniME框架,通过正负学习结合回顾特征监督、运动保持机制和三元组语义对齐,平衡运动编辑中的变化与不变性,在MotionFix和STANCE Adjustment数据集上达到最优性能。
变分适配器用于跨模态相似性表示
发表机构 * School of Remote Sensing and Information Engineering(遥感与信息工程学院) ; Wuhan University(武汉大学) ; School of Data Science and Engineering(数据科学与工程学院) ; East China Normal University(华东师范大学) ; State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing(测绘遥感信息工程国家重点实验室)
AI总结 针对跨模态匹配中细粒度标注稀缺导致二元分类边界压缩和假负样本问题,提出变分适配器VACSR,将匹配任务重构为变分推断问题,通过构建潜在相似性空间和正则化缓解过拟合,在图像-文本检索、域泛化和基类到新类泛化任务上验证了有效性。
Comments Accepted by the 43rd International Conference on Machine Learning (ICML 2026)
EvoGens:一种基于种群的启发式搜索框架用于科学思想生成
发表机构 * Southwest Petroleum University(西南石油大学) ; Sichuan Police College(四川警察学院)
AI总结 针对现有LLM方法生成科学思想时语义趋同、多样性和新颖性不足的问题,提出EvoGens框架,通过进化搜索(变异、交叉、选择)增强思想探索,显著提升新颖性和多样性。
Comments 21 pages, 6 figures
重新审视零阶Hessian近似:单步策略优化视角
发表机构 * Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Shanghai University of Finance and Economics(上海财经大学)
AI总结 本文通过单步策略优化视角统一零阶Hessian估计,提出方差缩减的ZoVH框架,实现全Hessian矩阵、正则化逆及偏差校正逆Hessian-梯度积的高效估计。
PRISM: 通过迭代槽记忆进行渐进推理的视觉架构
发表机构 * Deep NeuroCognition Lab, Nanyang Technological University, Singapore(深神经认知实验室,南洋理工大学,新加坡)
AI总结 提出PRISM架构,通过迭代槽记忆进行渐进推理,在图像分类、目标检测和语义分割等任务上取得竞争性能,并在遮挡等不完整观测下展现出更强的鲁棒性。
IAF-Net:用于低光照城市道路分割的照明自适应融合网络
发表机构 * The Shandong University(山东大学) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
AI总结 提出IAF-Net,通过照明自适应融合模块动态调整RGB与几何特征的融合权重,并利用亮度调制注意力解码器增强低光照特征选择,实现不同光照条件下鲁棒的道路分割。
过参数化高斯混合模型梯度方法的局部线性收敛性
发表机构 * Electrical & Computer Engineering, University of Washington(华盛顿大学电气与计算机工程系) ; National Institute for Theory and Mathematics in Biology(生物理论与数学国家研究所) ; Amazon, Inc.(亚马逊公司)
AI总结 针对过参数化高斯混合模型,提出一种交替使用短梯度步和长Polyak步的方法,实现局部线性收敛速率,克服了过参数化导致的慢收敛问题。
Comments 45 pages, 7 figures
大型语言模型是否编码了制度经验?来自跨语言模糊道德推理的证据
发表机构 * Nanyang Technological University(南洋理工大学)
AI总结 通过跨语言道德困境实验,研究大型语言模型在模糊情境下是否通过语言编码制度经验,发现隐含制度线索会放大跨语言道德分歧,而明确框架则抑制这种差异。
Comments 44 pages
通过分层宏动作量化增强强化学习智能体的人类相似性
发表机构 * Retrocausal, Inc.(Retrocausal公司)
AI总结 提出一种分层宏动作量化框架(HiMAQ),通过两级向量量化将人类演示编码为宏动作,使强化学习智能体在保持高回报的同时生成更接近人类的行为序列,在D4RL基准上优于非分层基线并兼容多种RL算法。
MultiAct: 通过定制注意力引导从复合文本生成动作
发表机构 * Tel Aviv University(特拉维夫大学) ; Reichman University(雷赫曼大学) ; CYENS Centre of Excellence(CYENS卓越中心) ; University of Cyprus(塞浦路斯大学)
AI总结 提出MultiAct,一种无需重新训练或修改架构的推理时框架,通过自适应增强未充分表示提示组件的交叉注意力分数,解决复合文本到动作生成中语义覆盖不全的问题。
Comments Accepted to SIGGRAPH 2026 conference. Project page: https://natsala13.github.io/multiact.github.io
EMBGuard:为具身智能体安全规划构建危险感知护栏
发表机构 * Independent Researcher(独立研究者) ; Department of Biomedical Engineering(生物医学工程系) ; the Department of Intelligent Precision Healthcare Convergence, Sungkyunkwan University(智能精准医疗融合系,全州大学) ; Department of Artificial Intelligence, Yonsei University(人工智能系,延世大学)
AI总结 提出首个基于MLLM的具身安全护栏EMBGuard,通过解耦物理风险推理与智能体策略,评估(视觉观察,动作)对来识别危险配置并提供自然语言解释,同时构建训练数据集EMBHazard和基准测试EMBGuardTest,在紧凑模型尺寸下达到与专有MLLM竞争的性能并降低误报率。
Comments Accepted at ICML 2026
De-attribute to Forget for LLM Unlearning
发表机构 * Department of Computer Science, National University of Singapore(新加坡国立大学计算机科学系)
AI总结 本文提出基于数据归因奖励的LLM遗忘框架DareU,通过强化学习降低生成响应与遗忘数据的归因分数,实现有效遗忘并平衡模型效用。
福利、可改进性与方差:最优基准测试项聚合的主-代理方法
发表机构 * Department of Economics & Computer Science(经济与计算机科学系) ; Institute for Computational and Mathematical Engineering(计算与数学工程研究所) ; Department of Computer Science(计算机科学系) ; Department of Aeronautics & Astronautics(航空与航天系)
AI总结 提出将基准测试建模为多任务主-代理博弈,通过福利、可改进性和方差三个维度评估项目,并应用于OLMES数据集识别帕累托劣势项目。
用强化学习和递归推理自动化形式验证
发表机构 * Department of Electrical Engineering and Computer Science(电气工程与计算机科学系) ; Massachusetts Institute of Technology(麻省理工学院)
AI总结 研究通过可验证奖励的强化学习和验证器引导的推理搜索,提升大语言模型生成验证程序和证明的能力,在Dafny和Lean上取得显著进展。
Comments Master's thesis, 140 pages, 16 figures, 17 tables
有毒幻觉:扰动提示与追踪LLM电路
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Nimblemind
AI总结 研究有毒语言扰动对LLM事实可靠性的影响,发现有毒词汇降低准确率并增加不确定性,通过归因图分析揭示内部机制。