Islamic Large Language Models: From Knowledge Acquisition to Trustworthy and Hallucination-Resistant AI
伊斯兰大语言模型:从知识获取到可信且抗幻觉的人工智能
发表机构 * Paris Dauphine University(巴黎多芬纳大学)
AI总结 综述伊斯兰大语言模型领域,提出构建可信、抗幻觉的伊斯兰AI需结合阿拉伯语NLP、检索增强生成、教法学派推理及专家评估等关键技术。
伊斯兰大语言模型:从知识获取到可信且抗幻觉的人工智能
发表机构 * Paris Dauphine University(巴黎多芬纳大学)
AI总结 综述伊斯兰大语言模型领域,提出构建可信、抗幻觉的伊斯兰AI需结合阿拉伯语NLP、检索增强生成、教法学派推理及专家评估等关键技术。
MR-GVNO:一种面向不规则域上Mindlin-Reissner板的几何感知变分物理信息神经算子
发表机构 * Institute of Computational Mechanics × AI & College of Intelligent Robotics and Advanced Manufacturing, Fudan University(计算力学与人工智能学院及智能机器人与先进制造学院,复旦大学) ; School of Aerospace Engineering, Xiamen University(航空航天工程学院,厦门大学) ; Department of Engineering Mechanics, Tsinghua University(工程力学系,清华大学) ; Institute of Photonics, Department of Mathematics and Physics, Leibniz University(光子研究所,数学与物理系,莱比锡大学) ; Institute of Structural Mechanics, Bauhaus-Universität Weimar(结构力学研究所,魏玛 Bauhaus-Universität)
AI总结 提出MR-GVNO,一种几何感知变分神经算子,通过边界点云表示不规则几何,利用交叉注意力机制融合多物理场输入,基于离散总势能的变分物理信息损失无监督训练,实现对Mindlin-Reissner板问题的快速准确预测。
基于内环动力学估计器的强化学习在不确定性下的空中操纵
发表机构 * International Institute of Information Technology Hyderabad(国际信息技术学院海德拉巴) ; University of Manchester(曼彻斯特大学)
AI总结 提出一种分层控制框架,结合强化学习与外环与内环动力学估计器,实现直接任务驱动控制,在硬件实验中降低末端执行器跟踪误差并提高任务成功率。
熵门控潜在递归
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出熵门控潜在递归(EGLR),通过在高不确定性token处递归应用冻结模型顶层解码器,构建与温度采样正交的确定性采样轴,扩展推理时缩放空间,在数学推理任务中显著提升性能。
CoffeeBench:异构多智能体经济中的长周期LLM智能体基准测试
发表机构 * Sakana AI ; KPMG AZSA LLC
AI总结 提出CoffeeBench基准,在90天模拟中评估LLM智能体在异构多智能体经济中的长周期任务表现,发现高性能模型更积极沟通,而Claude Haiku 4.5存在空闲漂移失败模式。
Comments 23 pages, 8 figures
超越伪影:基于音乐内在特征的可泛化合成歌曲检测
发表机构 * Central Conservatory of Music(中央音乐学院) ; Southern University of Science and Technology(南方科技大学) ; Fudan University(复旦大学)
AI总结 提出Sofia框架,通过特征特定专家和自适应混合专家模型利用音乐内在特征(人声、音频效果、全局结构)进行合成歌曲检测,在MUSIC8K基准上F1提升18.5点,具有强鲁棒性。
TCHG:基于三重信任条件异构图学习的可靠动态信任预测
发表机构 * Xidian University(西安电子科技大学) ; Tsinghua University(清华大学)
AI总结 提出TCHG框架,将信任证据分解为三个通道(实体可靠性、交互行为可靠性、上下文信任),分别控制图传播中的消息准入、传播强度和模式选择,并采用非均匀衰减的时间状态处理多尺度演化,实现可靠动态信任预测。
Comments 18 pages, 10 figures, 13 tables
ARB4WM:连续控制中世界模型的对抗鲁棒性基准
发表机构 * College of Computer Science, National University of Defense Technology(国防科技大学计算机学院) ; College of Computer Science and Technology, Harbin Institute of Technology(哈尔滨工业大学计算机科学与技术学院) ; Department of New Networks, Peng Cheng Laboratory(鹏城实验室新型网络部) ; National Key Laboratory of Advanced Communication Networks(先进通信网络全国重点实验室)
AI总结 提出ARB4WM统一基准,从策略、价值和潜在动力学三个层面评估世界模型在视觉扰动下的对抗鲁棒性,发现多目标攻击和时序暴露模式对安全评估至关重要。
Comments 24 pages, 10 figures, 5 tables. Source code available at https://github.com/zaoanguai/ARB4WM
VeriGraph: 迈向可验证的数据分析智能体
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学高瓴人工智能学院)
AI总结 提出VeriGraph框架,通过构建显式异质证据有向无环图(DAG)实现数据分析智能体的可验证性,并设计基于图的策略优化提升正确性与可审计性。
Comments 10 pages
PhysGuard: 面向仿真到现实神经PDE代理的Fisher引导梯度投影
发表机构 * Faculty of Engineering and IT, University of Melbourne(墨尔本大学工程与信息技术学院) ; School of Computing, National University of Singapore(新加坡国立大学计算机学院) ; Artificial Intelligence Research Institute, IFLYTEK Co., Ltd.(科大讯飞股份有限公司人工智能研究院)
AI总结 针对神经算子模型从仿真到现实迁移时的精度下降问题,提出PhysGuard框架,利用仿真数据的Fisher信息矩阵保护物理关键参数,限制微调更新方向,在严重域偏移下将低频误差降低32%。
DifferAD-R1: 基于差异引导的多模态大语言模型工业异常定位
发表机构 * Institute of Automation, Chinese Academy of Sciences (CAS)(中国科学院自动化研究所) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院) ; CASI Vision Technology Co., Ltd.(中科慧远视觉技术有限公司) ; Shandong Laboratory of Aluminum Advanced Manufacturing in Binzhou (SLAAMB), Binzhou Institute of Technology, Weiqiao-UCAS Science and Technology Park(山东省滨州市铝先进制造实验室(SLAAMB),滨州技术学院,魏桥国科科技园) ; Space Information Research Institute, Hangzhou Dianzi University(杭州电子科技大学空间信息研究院) ; School of Software, Tsinghua University(清华大学软件学院)
AI总结 提出DifferAD-R1框架,通过差异引导双图像范式将异常定位转化为一次性差异定位问题,并设计双一致性定位奖励和难度感知策略,在AD-DualDiff数据集上优于现有方法。
Comments Submitted to IEEE Transactions on Circuits and Systems for Video Technology
WaveSync: 面向人形机器人同步共语手势的约束波前优化
发表机构 * University of Engineering and Technology, Vietnam National University(越南国立大学工程与技术大学) ; School of Information Science, Japan Advanced Institute of Science and Technology(日本先端科学技术大学院大学信息科学学院) ; School of Electronics and Computer Science, University of Southampton(南安普顿大学电子与计算机科学学院) ; Department of Robotics, Hanyang University(汉阳大学机器人学系)
AI总结 提出WaveSync框架,利用大语言模型分解语义并构建重要性波,通过动态运动基元生成手势轨迹,再经波前优化实现手势与语音的峰值同步,同时满足运动学约束,在五组对话场景中优于基线方法。
机器翻译质量能带你走多远?目标导向设置中的外在话语评估
发表机构 * Language Technology Lab, University of Amsterdam(语言技术实验室,阿姆斯特丹大学)
AI总结 研究机器翻译在静态和交互式目标导向任务中的外在话语评估,发现高内在翻译质量不能保证下游话语成功,且强系统仍存在指代不一致问题。
ArtNet:一种类似JEPA的发音预测框架,用于鲁棒的零样本音素识别
发表机构 * Fudan University(复旦大学) ; Pedawise
AI总结 提出ArtNet框架,通过基于发音特征的结构化预测任务和变分信息瓶颈抑制语言特定变化,在零样本跨语言音素识别中实现20.56%的音素错误率降低。
Comments Accepted at Interspeech 2026
基于旋转对称性的无已知3D模型点云物体姿态估计
发表机构 * Key Laboratory of Brain Machine Collaborative Intelligence of Zhejiang Province, School of Computer Science, Hangzhou Dianzi University(浙江省脑机协同智能重点实验室,杭州电子科技大学计算机学院) ; Advanced Intelligent Manufacturing Research Group, the University of Nottingham Ningbo China(先进智能制造研究组,宁波诺丁汉大学)
AI总结 提出利用工业物体的旋转对称性,通过迭代优化联合估计姿态与点云,无需已知3D模型,在合成和真实数据集上达到与有模型方法相当的性能。
LOCUS: 局部视觉线索搜索增强多模态大语言模型的细粒度感知
发表机构 * University of Science and Technology of China(中国科学技术大学) ; State Key Laboratory of Cognitive Intelligence(认知智能国家重点实验室)
AI总结 提出LOCUS训练框架,通过可验证的局部线索搜索代理任务,使MLLM内化细粒度证据选择,提升定位敏感视觉理解而不改变推理接口。
不确定性并非临床VQA的安全网,但它能预测模型失败吗?
发表机构 * Amsterdam University Medical Center, University of Amsterdam(阿姆斯特丹大学医学中心) ; Amsterdam Public Health(阿姆斯特丹公共卫生) ; LMU Munich(慕尼黑大学) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心)
AI总结 研究临床视觉语言模型的不确定性估计是否可靠,发现其质量随模型准确率变化,在模型脆弱时失效,但能预测扰动下的性能崩溃。
Comments 17 pages, 4 figures
基于专家混合的多模态时空图神经网络用于土壤有机碳预测
发表机构 * Spatialise B.V.
AI总结 提出SpTGNN,一种多模态时空图神经网络,通过异构图注意力、微调基础模型特征提取和稀疏专家混合融合,结合异方差回归与深度集成的不确定性量化,在三个区域数据集上优于XGBoost基线。
Comments Paper is 27 pages, 14 figures, 12 tables
关于实、复和四元数深度线性网络的熵公式
发表机构 * CINVESTAV-IPN(墨西哥国立理工学院高级研究中心) ; Brown University(布朗大学)
AI总结 将Menon和Yu的实深度线性网络熵公式推广到复和四元数情形,得到统一公式。
Comments 17 pages
LLM智能体能否推断世界模型?来自智能体自动机学习的证据
发表机构 * The Hebrew University of Jerusalem(海法大学) ; New York University(纽约大学) ; Google Research(谷歌研究)
AI总结 提出智能体自动机学习框架,通过成员查询和等价查询评估LLM智能体发现隐藏确定性有限自动机的能力,发现性能随DFA规模增加而急剧下降,推理模型优于非推理模型但仍存在规划、整合和假设构建缺陷。
从多模态解剖场景生成可比较投影图像的变换驱动方法
发表机构 * Institute of Theoretical and Applied Informatics, Polish Academy of Sciences(波兰科学院理论与应用信息学研究所)
AI总结 提出变换驱动框架,从多模态解剖数据生成可重复的投影空间观测,通过下颌运动场景验证,实现不同解剖配置下直接可比的虚拟X光投影生成。
Comments 36 pages, 11 figures
将生成式强化学习引导至稳定机器人控制器
发表机构 * ShanghaiTech University(上海科技大学)
AI总结 提出SteerGenPO框架,通过潜在空间强化学习将训练好的生成式策略转化为鲁棒的确定性机器人控制器,在Isaac Lab和Unitree G1任务上优于基线方法,实现更稳定的推理行为。
基于LiDAR点云和OpenStreetMap的高速公路场景自动数字孪生构建
发表机构 * Institute of Automotive Engineering, Graz University of Technology(格拉茨技术大学汽车工程研究所) ; School of Intelligent Connected Vehicle, Hubei University of Automotive Technology(湖北汽车工业学院智能网联汽车学院) ; Professorship of Autonomous Vehicle Systems, Technical University of Munich(慕尼黑工业大学自动驾驶系统教席)
AI总结 提出融合LiDAR点云与OpenStreetMap数据的自动化流程,生成地理参考的ASAM OpenDRIVE高速公路地图,实现车道级几何与拓扑的完整建模,平均横向RMSE为0.740米。
Comments 9 pages, 5 figures
PROSE: 基于视觉语言模型的无训练自我中心场景配准
发表机构 * ETH Zurich(苏黎世联邦理工学院) ; VGG, University of Oxford(牛津大学VGG实验室) ; ETH AI Center(苏黎世联邦理工学院人工智能中心)
AI总结 提出PROSE方法,利用预训练视觉语言模型将RGB序列提升为对象级3D场景图,通过对象高度先验和相同/不同查询匹配实例,无需训练或深度传感器即可实现自我中心场景配准,在Aria基准上超越几何和场景图基线。
Comments Project page: https://rckola.github.io/prose/
快速判断何时,谨慎决定谁:基于扩散增强的双过程多轮对话
发表机构 * Deakin University(迪肯大学) ; Griffith University(格里菲斯大学)
AI总结 针对多说话人对话中的轮次转换问题,提出音频两阶段流水线,先快速检测轮次边界,再轻量验证决定是否转移并预测下一说话人,扩散增强进一步改善检测性能。
TNODEV: 神经ODE验证工具箱
发表机构 * Univ Gustave Eiffel, COSYS-ESTAS(古斯塔夫·埃菲尔大学,COSYS-ESTAS实验室)
AI总结 提出TNODEV,首个集成伪造检查、区间可达性、验证循环和并行调度的神经ODE形式验证器,支持安全集包含和分类鲁棒性验证。
Comments 29 pages, 7 figures, Under review in TMLR
Local-GS:通过Tile局部Warp一致性加速3D高斯泼溅
发表机构 * State Key Laboratory of Robotics and Systems, Harbin Institute of Technology(哈尔滨工业大学机器人技术与系统国家重点实验室) ; State Key Laboratory of Intelligent Green Vehicle and Mobility, School of Vehicle and Mobility, Tsinghua University(清华大学车辆与运载学院智能绿色车辆与交通国家重点实验室) ; Department of Computer Science and Technology, Tsinghua University(清华大学计算机科学与技术系)
AI总结 提出Local-GS,通过基于SIMT执行边界组织高斯原语,设计提升、剔除和混合三阶段warp一致渲染范式,在不降低质量的前提下实现最高7.76倍加速。
Elastic ODYN:面向机器人中不可行控制与学习的可微优化
发表机构 * University of Oxford(牛津大学) ; Heriot-Watt University(赫瑞瓦特大学)
AI总结 提出Elastic ODYN,一种通过平滑平方ℓ2弹性松弛处理不可行二次规划(QP)的原始-对偶非内点求解器,支持热启动,在无可行点时收敛到最接近可行解,并基于此开发可微QP层和不可行感知SQP方法,在基准QP、奇异接触力学、可微参数辨识及四足/人形机器人轨迹优化中优于现有方法。
Comments 8 pages, 5 figures, 2 tables
MIRAGE: 审计前沿大语言模型在推理、智能体与时间耦合条件下的反穆斯林偏见
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出MIRAGE基准,包含1200个提示,覆盖直接完成、思维链推理和模拟智能体决策三种部署场景,发现思维链放大偏见、智能体决策存在不对称性、偏见与检索新闻时间耦合,现有缓解措施效果有限。
BD-LSC数据集:促进俚语与标准用法中词汇语义变化检测模型的基准测试
发表机构 * The University of Manchester(曼彻斯特大学) ; Qassim University(卡西姆大学)
AI总结 针对词汇语义双向变化及俚语与标准用法混合的挑战,构建BD-LSC和ST-WSD两个基准数据集,评估多种方法,发现稀有俚语义项仍是核心难题。