SGR: A Stepwise Reasoning Framework for LLMs with External Subgraph Generation
SGR:一种用于LLM的分步推理框架,通过外部子图生成
AI总结 SGR通过外部子图生成提升LLM推理能力,利用结构化知识支持多步推理,实验表明在多个基准数据集上均优于基线方法,提高了推理准确性和事实可靠性。
SGR:一种用于LLM的分步推理框架,通过外部子图生成
AI总结 SGR通过外部子图生成提升LLM推理能力,利用结构化知识支持多步推理,实验表明在多个基准数据集上均优于基线方法,提高了推理准确性和事实可靠性。
ShopGym: 一个集成框架,用于电子商务网络代理的现实模拟和可扩展基准测试
AI总结 本文提出ShopGym框架,通过模拟层ShopArena和基准层ShopGuru,实现电子商务网络代理的现实模拟与可扩展基准测试,验证了合成商店在结构属性和代理性能上的有效性。
Comments 32 pages, 10 figures
超越避障:紧急疏散中的多机器人让路与空间可得性
AI总结 研究通过虚拟疏散实验探讨多机器人让路策略对人类空间期望的影响,发现主动让路优于冻结和效率优先策略,并揭示环境可得性对认知预期的塑造作用。
DebiasRAG: 通过检索增强生成实现大型语言模型中公平生成的无调优路径
AI总结 本文提出DebiasRAG,一种基于检索增强生成的无调优动态查询特定去偏框架,通过生成查询特定去偏候选、构建上下文候选池和梯度更新去偏引导上下文重排序三阶段,提升生成公平性并保留LLM固有属性。
动态图变换器中的注意力分散:诊断与可迁移的修复
AI总结 本文识别动态图变换器在时间分布偏移下的注意力分散问题,并提出可迁移的差分注意力机制以提升性能,尤其在高偏移数据集上表现显著。
多级上下文令牌关系建模用于机器生成文本检测
AI总结 本文提出多级上下文令牌关系建模框架,通过局部校准和全局规则推理模块提升机器生成文本检测性能,实验显示在多种实际场景中效果显著。
符号分离的有限时间误差分析Q学习
AI总结 本文提出符号分离的有限时间误差分析方法,用于常步长Q学习。通过切换系统表示,将误差分解为负和正部分,负部分由固定最优策略关联的线性时不变系统主导,正部分由线性切换系统控制。分析揭示了Q学习误差动态中的最大诱导不对称性,并提供确定性和随机性常步长递推的有限时间界。
联邦学习下的异构特征空间中的缺失值填补
AI总结 本文提出FedHF-Impute框架,通过共享全局特征图实现跨客户端知识传递,提升联邦填补效果,在模拟数据集上优于基线方法。
集中式与去中心化联邦学习:性能权衡分析
AI总结 本文通过Fedstellar模拟器、MNIST数据集和MLP分类器,对比分析集中式、去中心化和半去中心化联邦学习架构的性能权衡,揭示不同应用场景下的优劣势。
基于组合层次图的多级自监督预训练用于分子性质预测
AI总结 本文提出MolCHG框架,通过多级自监督预训练提升分子性质预测性能,采用组合层次图组织分子结构,引入bond graph增强bond信息,实现原子与bond语义的平等聚合。
Comments 11pages, 4 figures
MIND: 通过潜在流形解耦模型诱导标签噪声
AI总结 MIND通过潜在流形解耦技术解决模型诱导标签噪声问题,通过动态投影样本到潜在结构聚类,提升噪声识别能力,验证了其在复杂基准测试中的优越性。
Comments Accepted, to appear in ICML2026
ReAlign:通过推理对齐表示实现通用图像伪造检测
AI总结 本文提出ReAlign框架,通过对比学习将LLM生成的高质量推理文本转化为轻量级AIGI检测器,提升检测准确性和泛化能力。
Comments Accepted by CVPR 2026
VideoSeeker:通过原生代理工具调用激励实例级视频理解
AI总结 VideoSeeker通过整合代理推理与实例级视频理解任务,提升视频理解精度,实验表明其在实例级任务中比基线模型提升13.7%,超越GPT-4o和Gemini-2.5-Pro。
Comments Project Page: https://gaotiexinqu.github.io/VideoSeeker/
大型语言模型能否用于临床评估中的语音模仿?基于LLM的数据增强用于认知评分预测
AI总结 本文提出基于LLM的数据增强框架,通过生成不同风格的口语独白来提升语音认知评分预测。采用相似性引导的增强策略,有效减少少数低分群体的预测误差,同时保持多数群体性能。
Comments 11 pages, 6 figures
AgriMind:一种用于多类植物疾病分类的集成深度学习框架
AI总结 本文提出AgriMind框架,利用ResNet50、EfficientNet-B0和DenseNet121模型集成,通过转移学习实现对15种植物疾病的高精度分类,集成模型在测试集上达到99.23%的准确率。
ITGPT:对不规则时间序列的生成预训练
AI总结 本文提出ITGPT,一种针对多模态不规则时间序列的注意力架构,通过自监督学习和生成预训练目标处理不规则采样数据,在医疗和预测维护任务中实现SOTA性能。
Comments 9 pages
安全量子机器学习中的变分量子分类器
AI总结 本文提出一种基于幅度编码的变分量子分类器,结合归一化幅度嵌入与有界量子可观测量,构建了结构化且平滑的假设空间,通过SAFE-AI指标评估模型可靠性,实验证明其在预测性能和噪声鲁棒性方面优于经典基线。
Comments 31 pages, 8 figures
鲁棒的先验引导分割用于可编辑的3D高斯散射
AI总结 本文提出利用SAM-HQ生成准确2D掩码,通过先验引导标签重新分配实现鲁棒的3D分割,提升编辑任务的精度和效率。
Comments Accepted at IEEE International Conference on Image Processing 2026, 6 pages
面向故障感知的视觉-语言-动作模型用于机器人故障-aware 控制
AI总结 本文提出一种故障感知的视觉-语言-动作模型,通过引入健康投影模块,使机器人在关节退化等物理故障情况下仍能完成任务。
Comments VLA Pipelines Workshop at IEEE International Conference on Robotics and Automation (ICRA) 2026
Ada-Diffuser: 面向决策制定的潜在意识自适应扩散模型
AI总结 本文提出Ada-Diffuser,通过显式建模潜在动态过程,提升决策制定的精度与适应性,实验验证其在模拟控制与机器人基准中的有效性。
Comments ICLR 2026
理由者还是翻译者?面向污染的评估与税法中的神经符号鲁棒性
AI总结 本文研究了税法推理中LLM性能受数据污染影响的问题,提出神经符号框架提升法律AI的可靠性与鲁棒性。
循环SSM:用于时间序列分类的深度递归与输入重塑
AI总结 本文探讨了循环SSM在时间序列分类中的应用,展示了深度递归和输入重塑对模型性能的提升作用,通过实验验证了这两种方法的有效性。
RecMem:基于递归的记忆巩固用于高效且有效的长运行LLM代理
AI总结 RecMem通过递归机制优化内存巩固,减少token消耗并提升准确性,有效解决长运行LLM代理的内存管理问题。
Comments Accepted to ACL 2026 Findings
从人类遥控数据中学习双臂绳子操作的模拟 grounded 策略
AI总结 本文研究了基于视觉的策略在解结任务中泛化能力不足是否源于观察空间而非策略架构或数据规模,通过比较两种基于动作分块与变压器的策略,发现基于物理状态的策略在预测初始抓取和拉拽动作时L1误差降低了30.8%。
Comments Accepted to the Beyond Teleoperation Workshop at ICRA 2026, 5 pages, 2 figures
从平铺语言标签到类型学先验:面向多语言语音到语音翻译的结构化语言条件化
AI总结 本文提出S2ST-Omni 2框架,通过结构化类型学先验改进多语言语音到语音翻译,实验显示其在多个评估指标上表现优异,且在数据受限条件下仍能提升翻译效率。
Comments Submitted to IEEE/ACM TASLP. This work extends S2ST-Omni, accepted to Findings of ACL 2026
ScreenSearch: 带有不确定性的操作系统探索
AI总结 ScreenSearch通过结合结构化屏幕检索与基于不确定性的PUCT图强化学习,在大规模桌面探索中有效平衡探索与承诺,生成具有跨应用多样性的探索语料库。
Comments 14 pages, 9 figures, 4 tables
EndoGSim: 基于多模态大语言模型的物理感知4D动态内窥镜场景模拟
AI总结 本文提出EndoGSim框架,通过MLLM引导的高斯点散布实现内窥镜场景的物理感知重建与模拟,结合预训练分割和深度估计,提升手术模拟的真实性和准确性。
Comments Early Accepted by MICCAI 2026
具有概率先验的变分自回归网络
AI总结 本文提出利用物理先验改进变分自回归网络,通过引入概率分布先验降低训练负担,提升离散自旋模型的模拟效率。
Comments 28 pages, 11 figures
加速梯度下降法用于更快收敛并最小化开销
AI总结 本文提出CT-AGD算法,通过捕捉局部曲率加速一阶方法,减少训练周期,与Adam等自适应方法具有相似的存储和计算开销。
Comments 17 pages
视觉语言模型在数学教育中能否具备适应性?一种基于学习者模型的评分研究
AI总结 本文探讨视觉语言模型在数学教育中的适应性,提出基于学习者模型的评分框架,评估模型在认知、动机和复杂度方面的适应性,并发现现有模型在有限学习者信息下难以产生一致的指导响应。