Compliance-Based Sensor Placement for Force Sensing on a Sensorized Prostate Phantom
基于柔顺性的传感器布局方法用于传感化前列腺模体的力感知
发表机构 * CRIStAL ; DEFROST ; Polytech Lille
AI总结 提出一种基于柔顺性的加权贪心传感器布局方法,用于直肠指检训练模体的力感知,相比全局QR方法将目标区域力重构性提高22.5%。
基于柔顺性的传感器布局方法用于传感化前列腺模体的力感知
发表机构 * CRIStAL ; DEFROST ; Polytech Lille
AI总结 提出一种基于柔顺性的加权贪心传感器布局方法,用于直肠指检训练模体的力感知,相比全局QR方法将目标区域力重构性提高22.5%。
通过不确定性对齐强化学习探索智能体工具调用决策
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 针对智能体工具调用中错误累积问题,提出TRUST方法,将不确定性量化作为排斥力融入奖励设计,并标注轻量关键轮次用于多轮轨迹统一后训练,显著提升决策质量与智能体性能。
MyGardenBird:针对十二种常见马来西亚鸟类的机器学习就绪鸟声数据集
发表机构 * Faculty of Computer Science and Information Technology, Universiti Malaya(马来大学计算机科学与信息技术学院) ; Faculty of Electrical Engineering, Universiti Teknologi Malaysia(技术学院电气工程学院)
AI总结 提出MyGardenBird数据集,包含来自Xeno-canto的12种马来西亚常见鸟类的7200个经过人工验证的音频片段,通过卷积神经网络基线实验达到92-96%的分类准确率。
Comments 17 pages, 9 figures
考虑情境:塑造道德信念以实现价值对齐
发表机构 * University of Oxford(牛津大学)
AI总结 本文针对价值对齐中道德多元性问题,提出在聚合道德评估时必须考虑情境因素,并形式化道德不确定性下的决策,揭示弱帕累托原则的违反是辛普森悖论的一种变体。
GenPO++:基于无雅可比似然比的生成式策略优化
发表机构 * ShanghaiTech University(上海科技大学)
AI总结 提出GenPO++框架,利用高阶可逆ODE求解器中的历史状态作为辅助记忆,实现精确可逆映射,从而无偏且高效地计算生成流策略的似然比,在连续控制任务中优于现有方法。
从视觉到文本:一种用于身份证件跨域鲁棒演示攻击检测的紧凑多模态方法
发表机构 * da/sec-Biometrics and Security Research Group, Hochschule Darmstadt(da/sec生物安全研究组,达姆施塔特应用技术大学) ; Technical University of Denmark (DTU)(丹麦技术大学(DTU))
AI总结 针对身份证件演示攻击检测中的跨域迁移问题,提出一种结合视觉与文本数据的紧凑多模态模型,发现监督微调后泛化强但零样本设置下失效,强调模型容量和真实数据的重要性。
Comments Publication under the revision process on IEEE
OpenHalDet:面向多种生成场景的幻觉检测统一基准
发表机构 * University of Technology Sydney(新南威尔士大学) ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; University of Bristol(布里斯托大学) ; The University of Queensland(昆士兰大学) ; Nanyang Technological University(南洋理工大学)
AI总结 提出OpenHalDet基准,标准化幻觉检测评估流程,支持黑盒、灰盒、白盒检测器,实现跨任务、模型和检测器的可控比较。
Comments Preprint. Code and data are available at https://github.com/Nellie179/Hallucination-Detection
MVSegNet: 一种用于产前超声中胎儿侧脑室分割和心房宽度估计的轻量级边界感知网络
发表机构 * Department of Computer Science & Engineering, Stamford University Bangladesh(计算机科学与工程系,斯坦福大学孟加拉国分校)
AI总结 提出轻量级边界感知网络MVSegNet,结合多尺度特征提取与边界细化,在584张超声图像上实现侧脑室分割,Dice达80.79%,心房宽度平均绝对误差3.40 mm,速度快且参数少。
Comments 11 pages, 3 figures, 4 tables. Code and trained models will be released upon acceptance. Supplementary material available upon request
LIMMT:少即是多的运动追踪
发表机构 * Tsinghua University(清华大学) ; GalBot ; Shanghai Jiao Tong University(上海交通大学) ; Peking University(北京大学) ; Shanghai Qi Zhi Institute(上海启智研究院)
AI总结 提出数据驱动的运动追踪框架LIMMT,通过物理可行性、多样性和复杂性三维度筛选高质量运动数据,仅用AMASS的3%数据即可超越全量训练效果。
Comments Accepted at ICML 2026
何时3D值得?肺CT中CNN和Transformer的资源-性能前沿
发表机构 * Department of Biomedical Informatics University of Arkansas for Medical Sciences(生物医学信息学系,美国阿肯色大学医学科学分校) ; Department of Information Science University of Arkansas at Little Rock(信息科学系,美国阿肯色大学小岩分校) ; Department of Neuroscience University of Arkansas for Medical Sciences(神经科学系,美国阿肯色大学医学科学分校)
AI总结 研究在肺CT中2D、2.5D和3D输入对CNN和Transformer的影响,发现2.5D CNN在判别-稳定性权衡上最优,而3D CNN和Transformer存在不稳定性或退化预测。
Comments 8 pages, 6 figures
领域自适应大语言模型中的训练数据审计:LoRA-MINT
发表机构 * University of Granada(格拉纳达大学)
AI总结 提出LoRA-MINT方法,通过成员推理测试审计LoRA微调的大语言模型训练数据,在四个模型和三个基准上达到0.77-0.92的精度,优于现有基线。
Comments IEEE Conf. on Computers, Software, and Applications (COMPSAC), 2026
T-GMP: 基于地形条件的生成式运动先验用于多功能且自然的人形机器人 locomotion
发表机构 * Harbin Institute of Technology(哈尔滨工程大学) ; Leju Robotics(莱居机器人)
AI总结 提出 T-GMP 模块,利用条件变分自编码器从少量专家演示中学习地形条件潜在运动流形,结合对抗学习与立足点惩罚,实现统一策略下适应地形变化的多功能自然运动。
SS-TPT:面向对抗鲁棒视觉语言模型的稳定性和适用性引导的测试时提示微调
发表机构 * Dankook University, Yongin, South Korea(首尔大学,韩国永兴) ; University of Seoul, Seoul, South Korea(首尔大学,韩国首尔)
AI总结 提出SS-TPT方法,通过稳定性与适用性分数评估增强视图质量,引导测试时提示微调,在保持高吞吐量的同时显著提升对抗鲁棒性。
Comments Accepted in ICML2026
Didact:面向国防的跨领域能力发现系统
发表机构 * University of New South Wales, Sydney, Australia(新南威尔士大学,悉尼,澳大利亚) ; Cyndr.ai, Australia(Cyndr.ai,澳大利亚)
AI总结 提出Didact原型系统,通过构建知识图谱和复合检索增强生成管道,整合异构国防报告与政策文档,支持自然语言对话和可视化证据追溯,解决跨领域能力发现碎片化问题。
Comments Under Review at CIKM 2026 (System Demonstration Track)
量子启发的迹增强证据选择用于结构化假设空间推理
发表机构 * School of Computing and Information Systems(计算与信息系统学院) ; Singapore Management University(新加坡管理大学)
AI总结 提出EP-HUBO方法,将CoT推理片段选择转化为组合优化问题,通过高阶二元优化聚合证据,在证据密集型法律推理基准上提升少数但正确假设的权重。
当CLIP看得更多,它反击得更猛烈:多视图引导的自适应对抗攻击用于测试时对抗鲁棒性
发表机构 * Dankook University(Dankook 大学) ; University of Seoul(首尔大学) ; Yongin, South Korea(韩国 Yongin) ; Seoul, South Korea(首尔, 韩国)
AI总结 提出多视图引导的自适应对抗攻击(MAC),通过构建输入图像的增强视图、执行对抗攻击精炼嵌入、自适应调整攻击强度并聚合视图,显著提升CLIP在测试时的对抗鲁棒性。
Comments Accepted in CVPR2026
固定点参数上GD和SGD的均匀稳定性与泛化误差
发表机构 * Department of Artificial Intelligence, Korea University(人工智能系,韩国大学)
AI总结 研究离散参数空间中梯度下降(GD)和随机梯度下降(SGD)的泛化误差与均匀稳定性,发现确定性舍入使GD泛化误差率从O(T/n)恶化到O(T/√n),而SGD在确定性舍入下仍具有非平凡稳定性保证,且随机舍入会引入随维度增长的泛化误差。
VoxCPM2 技术报告
发表机构 * VoxCPM Team(VoxCPM 团队)
AI总结 提出VoxCPM2,一种全开源多语言可控语音生成基础模型,通过层次化扩散自回归建模、非对称AudioVAE和2B参数/200万小时数据扩展,在零样本和指令跟随TTS基准上达到SOTA,平均WER为1.68%。
Comments The technical report of VoxCPM2, a TTS foundation model (GitHub: https://github.com/OpenBMB/VoxCPM)
SVHighlights: 迈向极长体育视频精彩片段检测
发表机构 * Ulsan National Institute of Science and Technology(釜山国立科学研究院)
AI总结 针对现有方法无法处理超长视频精彩片段检测的问题,提出首个基准SVHighlights(包含320个平均时长2小时的体育视频)以及无训练的分段方法TF-SELECTOR,通过大语言模型融合多模态信息预测片段级显著性分数,在多个指标上超越现有基线。
Comments Accepted to KDD 2026 (Datasets and Benchmarks Track). Project Page: https://leedongkyu2019.github.io/SVHighlights/
从采样结果到能力分布:重新思考LLM路由的监督
发表机构 * School of Artificial Intelligence, Nanjing University(南京大学人工智能学院) ; National Key Laboratory for Novel Software Technology, Nanjing University(南京大学新型软件技术国家重点实验室) ; Hong Kong University of Science and Technology(香港科学与技术大学) ; Frontier Robotics(前沿机器人)
AI总结 针对LLM路由中单次响应作为监督信号噪声大的问题,提出DARS框架,从分布视角构建路由监督,考虑输入和输出不确定性,实验表明分布感知监督更稳定有效。
知识驱动工具使用工作流中AI代理的声明式技能
发表机构 * School of Computing and Information Systems(计算与信息系统学院) ; Singapore Management University(新加坡管理大学)
AI总结 提出声明式代理(通过自然语言技能文件控制流程)在知识密集型客服工作流中优于命令式状态机和无脚手架基线,但检索质量是主要瓶颈。
微调陷阱:评估负迁移及PEFT在亚十亿参数数学推理中的作用
发表机构 * GitHub ; University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 本研究评估了五种亚十亿参数模型在数学推理任务中的微调策略,发现全量微调对小于3亿参数的模型造成负迁移,而参数高效微调(PEFT)是稳定性要求。
Comments 8 pages, 6 figures, 2 tables
DRIFT: 从鲁棒性差距到AI生成图像检测的不变流形
发表机构 * Samsung Research Institute, Bangalore, India(三星研究所,班加罗尔,印度)
AI总结 提出DRIFT方法,通过冻结视觉基础模型并学习真实图像的结构化不变流形,利用鲁棒和脆弱子空间分解及排序间隔实现AI生成图像检测,在未见生成器和分辨率上表现优异。
Comments Submitted to ECCV 2026
polyDAG:用于视觉语义图中高效连续因果发现的多项式无环性约束
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; University of California, Los Angeles(加州大学洛杉矶分校) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 提出多项式无环性约束框架polyDAG,用有限多项式迹约束替代矩阵指数约束,实现视觉语义图中高效的连续有向无环图学习,在合成图和CelebA数据集上提升了效率与结构恢复性能。
EASE-TTT: 面向长上下文问答的基于证据对齐的选择性测试时训练
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Harvard University(哈佛大学) ; Brion, ASML US LP ; Florida State University(佛罗里达州立大学)
AI总结 提出EASE-TTT框架,通过将检索到的证据块转化为软注意力监督目标,指导查询侧参数适应,从而在保留完整上下文的情况下提升小模型的长上下文问答性能。
Comments 13 pages, 4 figures, 3 tables
超越骨架:使用Same2X训练策略直接从驱动视频学习动画
发表机构 * Tsinghua University(清华大学) ; Harbin Institute of Technology(哈尔滨工业大学) ; Pengcheng Laboratory(鹏城实验室)
AI总结 提出DirectAnimator框架,通过驱动线索三元组和Same2X训练策略,绕过姿态提取直接从原始视频学习动画,实现鲁棒且高质量的人体图像动画生成。
Comments Accepted to ICLR 2026
TALAN:面向大型语言模型目标后训练的任务对齐潜在自适应网络
发表机构 * Meta AI
AI总结 提出TALAN,一种序列条件潜在旁路,插入Transformer残差流并与低秩适配器协同训练,在STEM/代码基准上平均提升LoRA 1.41点、DoRA 1.85点,仅增加<1%可训练参数和1.01-1.02倍推理开销。
LUCID:夜间摄影中图像去眩光与曝光控制的统一学习
发表机构 * MoE Key Lab of Artificial Intelligence(人工智能混合专家实验室) ; AI Institute(人工智能研究所) ; School of Computer Science(计算机科学学院) ; School of Biomedical Engineering(生物医学工程学院) ; School of Artificial Intelligence(人工智能学院)
AI总结 提出LUCID统一框架,通过眩光解缠模块和扩散驱动模块联合处理夜间图像中的眩光和噪声,并引入四模式训练实现可控恢复,支持HDR重建,性能优于现有方法。
Comments Accepted by SIGGRAPH 2026
可控光照变化下的光照感知表示学习
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 提出光照感知表示学习框架,将光照变化作为显式训练信号,通过辅助目标捕获光照依赖变化,在分类和检测任务上优于标准对比学习基线。
工作流到技能:通过路由-工作流-语义-附件分解创建技能
发表机构 * Key Laboratory of Aerospace Information Security and Trusted Computing, Ministry of Education, School of Cyber Science and Engineering, Wuhan University(航天信息安全部门与可信计算重点实验室,教育部,网络安全科学与工程学院,武汉大学) ; Nanchang University(南昌大学)
AI总结 提出RWSA中间表示和W2S框架,从异构交互证据中自动构建技能,通过分解工作流结构、执行语义和运行时附件,提升行为重放一致性10.5%。
Comments 10 pages, 2 figures