Conflict-Aware Seat Assignment in Classroom Environments
教室环境中的冲突感知座位分配
AI总结 针对教室座位分配问题,提出数学模型和迭代局部搜索启发式算法,以最小化学生间的人际冲突。
Comments This manuscript is currently under review
教室环境中的冲突感知座位分配
AI总结 针对教室座位分配问题,提出数学模型和迭代局部搜索启发式算法,以最小化学生间的人际冲突。
Comments This manuscript is currently under review
AdapShot: 自适应多示例上下文学习与语义感知的KV缓存重用
发表机构 * School of Information and Software Engineering, University of Electronic Science and Technology of China(电子科技大学信息与软件学院)
AI总结 提出AdapShot方法,通过基于熵的探针机制动态优化示例数量,并结合语义感知的KV缓存重用策略,实现高效的多示例上下文学习,性能提升约10%,速度提升4.64倍。
高效的时间Datalog物化用于复合事件识别
发表机构 * Örebro University, Sweden(奥雷布罗大学,瑞典)
AI总结 针对高速事件流中的关键情况检测需求,通过将主流事件规范语言映射到时间Datalog->-并扩展流触发图技术,实现统一的复合事件识别机制。
命题逻辑程序上的集合类操作
AI总结 本文引入命题Horn逻辑程序的集合类操作,通过将程序分解为Krom程序等简单组件,实现最小模型语义的重构或近似,为组合推理和程序构建奠定代数基础。
LLM-XTM:利用大语言模型增强跨语言主题模型
发表机构 * Hanoi University of Science and Technology(河内科学技术大学) ; VNU University of Engineering and Technology(VNU工程技术大学) ; Monash University(墨尔本大学)
AI总结 提出LLM-XTM框架,通过LLM引导的主题精炼与自一致性不确定性量化,以黑盒方式稳定提升跨语言主题模型的连贯性和对齐性,减少对双语资源的依赖。
Comments ACL 2026
CoAction: 跨任务相关性感知的帕累托集学习
发表机构 * Guangdong University of Technology(广东工业大学) ; Xiamen University(厦门大学)
AI总结 提出CoAction框架,利用任务感知Transformer同时处理多个多目标优化问题,通过自注意力机制捕获任务间相关性,提升超体积、范围和稀疏性指标。
Comments Accepted by ICIC 2026 (Oral)
SEAOTTER: 基于传感器嵌入自编码器与一次性转码的高效重建
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 提出SEAOTTER框架,结合传感器嵌入自编码器与可学习JPEG转码,在200:1压缩比下实现比AVIF快7倍编码、3.5倍解码,并提升ImageNet top-1准确率8%,同时保持JPEG兼容性。
当BBR遇上直播
AI总结 针对BBR在直播场景中带宽估计不准确导致的问题,提出辅助组件BBR-Copilot通过主动发送额外数据生成精确带宽样本,提升BBR在直播中的性能。
WavTTS:通过直接原始波形建模实现高质量零样本TTS
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai Innovation Institute(上海创新研究院) ; ByteDance Seed(字节跳动种子)
AI总结 提出WavTTS,首个基于流匹配与扩散Transformer的原始波形生成TTS模型,通过简单分块策略直接建模波形并集成多尺度梅尔频谱监督,在零样本TTS中接近潜在空间生成模型性能。
AnyAudio-Judge:基于动态评分标准的音频指令跟随基准与评估器
发表机构 * Zhejiang University(浙江大学) ; Shanghai Innovation Institute(上海创新研究院) ; Shanghai Jiao Tong University(上海交通大学) ; Tencent Hunyuan(腾讯文脉)
AI总结 针对指令引导音频生成中复杂指令解耦困难、评估缺乏可解释性和细粒度属性匹配的问题,提出基于动态评分标准的评估范式,通过自适应分解音频描述为可验证的二元评分项,并构建包含7920个样本的双语基准和105K训练语料,结合SFT与GRPO训练专用评估器,在零样本对齐检测和下游强化学习指令对齐中取得显著提升。
生成式与判别式语音增强方法的比较:鲁棒性、复杂性与幻觉
AI总结 本文比较了生成式和判别式深度学习方法在语音增强中的表现,分析了高/低信噪比、匹配/失配训练场景下的鲁棒性、复杂度与幻觉特性。
基于双差分散焦与立体一致性的深度估计
发表机构 * Purdue University(普渡大学) ; Northwestern University(西北大学)
AI总结 提出D^3S Consensus算法,融合散焦深度与立体视觉,在超出景深范围内实现高精度深度估计,通过物理独立线索的一致性选择可靠预测,以更小基线达到可比工作范围。
学习细化:用于降水临近预报的频谱解耦迭代细化框架
发表机构 * National University of Singapore(新加坡国立大学)
AI总结 提出频谱解耦迭代细化框架(SDIR),通过双路径设计(SFG-Former和FR-Refiner)和物理一致功率谱密度损失,在确定性框架中实现降水临近预报的渐进频率解耦细化,消除模糊和幻觉,在空间精度和频谱保真度上超越现有方法。
Comments 21 pages, 10 figures, accepted at ICML 2026
SVHalluc: 音频-视觉大语言模型中的语音-视觉幻觉基准测试
发表机构 * KAIST(韩国国立信息通信研究院)
AI总结 针对音频-视觉大语言模型中的语音-视觉幻觉问题,提出SVHalluc基准,从语义和时间两个维度评估模型将语音内容与视觉信号对齐的能力,发现现有模型存在跨模态理解局限。
Comments Accepted at CVPR 2026
通过AReT:解剖正则化TensoRF从数字重建放射图像进行稀疏视图肺结节体积测量
发表机构 * Amrita University(阿姆里塔大学)
AI总结 本文发现并解决了TensoRF在X射线衰减场中的默认密度偏移问题,提出解剖正则化张量辐射场框架AReT,仅用三个正交X射线投影即可实现肺结节的稳定体积重建,在LIDC-IDRI数据集上达到高精度。
Echo-POSED:用于超声心动图引导的几何自蒸馏
AI总结 提出一种自监督框架Echo-POSED,通过从3D超声心动图体积中切取2D视图训练,实现实时经胸超声心动图引导,无需专家标注视图或跟踪探头轨迹,在SO(3)×SO(3)上保持探头运动等变性,在患者内和患者间引导模拟中达到平均角度误差8.2度。
小波作为分词器:自然信号共享小波分词方案的初步结果
发表机构 * Yet Another AI
AI总结 本文研究音频、图像和视频能否共享统一的小波分词方案,通过基于Haar DWT/IDWT的连续令牌模型,在多个数据集上验证了统一分词模式的可行性,并分析了潜在容量和元数据的影响。
Comments 12 pages, 3 figures
FSA-GRPO:训练听觉大语言模型使用少样本示例
发表机构 * University of Illinois Urbana Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Tsinghua University(清华大学)
AI总结 提出基于强化学习的后训练方法FSA-GRPO,通过专门设计的奖励机制鼓励模型利用少样本示例,增强其少样本适应能力,在儿童语音识别、语音翻译和音频理解等任务上取得提升。
信号损失下广告系统的隐私鲁棒增量测量
发表机构 * Department of Mathematics, Embry-Riddle Aeronautical University(数学系,埃姆伯里-里德尔航空大学)
AI总结 针对隐私保护报告系统导致的信号损失,提出鲁棒因果决策框架,通过投影观测兼容的实验世界到增量泛函,给出尖锐决策边界,实现认证、拒绝或未决的增量判断。
扩散模型中流蒸馏的定量近似框架
发表机构 * School of Mathematical Sciences, Fudan University(复旦大学数学学院) ; Shanghai Key Laboratory of Contemporary Applied Mathematics, Fudan University(复旦大学当代应用数学重点实验室)
AI总结 针对扩散模型中的流蒸馏,提出一个定量近似框架,将少步采样视为学习流映射组合下的误差传播,通过理论分析和实验验证了稳定性平衡的非均匀时间网格能显著降低端到端相对MSE。
资源约束下的自适应推断用于顺序定价
发表机构 * Institute for Data, Systems, and Society, Massachusetts Institute of Technology, Cambridge, MA 02139(数据、系统与社会研究所,麻省理工学院,剑桥,马萨诸塞州,02139) ; Department of Industrial Engineering and Decision Analytics, Hong Kong University of Science and Technology, Hong Kong(工业工程与决策分析系,香港科技大学,香港) ; Department of Civil and Environmental Engineering and Operations Research Center, Massachusetts Institute of Technology, Cambridge, MA 02139(土木与环境工程系和运筹中心,麻省理工学院,剑桥,马萨诸塞州,02139)
AI总结 针对资源约束导致固定价格推断不可行的问题,提出一种目标感知定价控制器,通过认证可行目标带并记录连续局部密度,实现基于局部去偏的学生化区间,并分析遗憾-信息核算。
从共形p值到e值的集合保持校准
发表机构 * ETH Zurich(苏黎世联邦理工学院)
AI总结 针对共形预测中p值到e值转换的局限性,提出一种集合保持的P2E校准器,在不改变预测集的前提下实现高效转换,并在交叉共形预测和共形聚合中达到期望覆盖并提升效率。
基于长短期记忆网络的脉冲星噪声少样本预测
发表机构 * Sichuan University, College of Computer Science(四川大学计算机学院) ; Sichuan University, College of Physics(四川大学物理学院)
AI总结 针对脉冲星计时数据稀缺问题,提出一种结合模型无关元学习优化的LSTM网络,仅需少量真实计时残差即可快速适应新频域,并利用粒子群算法自动调参,在IPTA数据集上以10%数据实现高精度预测。
稀疏主成分分析的鲁棒优化方法
发表机构 * Uppsala University, Sweden(乌普萨拉大学,瑞典) ; PSL Research University / INRIA, France(巴黎社会科学大学 / INRIA,法国) ; Science for Life Laboratory, Sweden(生命科学实验室,瑞典)
AI总结 提出AdvPCA方法,通过鲁棒优化在重建目标中引入最坏情况潜在空间扰动实现稀疏性,并给出闭式解和迭代算法。
结合统计特征与深度编码的基于排练的类增量时间序列分类
发表机构 * atlanTTic – ICLAB, Universidade de Vigo(atlanTTic–ICLAB,维戈大学) ; Centro Tecnolóxico de Telecomunicacións de Galicia (GRADIANT)(加利西亚电信技术中心(GRADIANT)) ; Universidade de Vigo(维戈大学)
AI总结 提出一种双流特征提取管道(结合预训练冻结基础模型的深度时间嵌入特征与统计特征),用于多变量时间序列的类增量持续学习,在五个基准数据集上实现了有竞争力的平均准确率和低遗忘率。
校准的层次结构:分类与回归的融合
发表机构 * Goethe University Frankfurt(法兰克福歌德大学) ; University of Minnesota(明尼苏达大学) ; Heidelberg Institute for Theoretical Studies(海德堡理论研究所) ; Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院)
AI总结 本文综述、扩展并桥接了分类与回归任务中的校准概念,重点研究了不同校准概念之间的层次关系,并提出了模态校准、全校准、部分校准和平均校准等新概念。
上下文学习中思维链的渐近理论
发表机构 * Department of Physics, Graduate School of Science, The University of Tokyo(东京大学物理系研究生院) ; John A. Paulson School of Engineering and Applied Sciences, Harvard University(哈佛大学约翰·A·保罗森工程与应用科学学院) ; Kempner Institute for the Study of Natural and Artificial Intelligence, Harvard University(哈佛大学凯普勒人工智能研究 institute) ; Center for Brain Science, Harvard University(哈佛大学脑科学中心)
AI总结 通过高维随机矩阵理论,推导了线性回归中上下文学习思维链的泛化误差精确公式,揭示了推理深度、预训练数据量和上下文长度之间的相变现象。
Trans GAN-WT: 一种基于特征提取和交互学习的风电机组时间序列数据异常检测模型
AI总结 提出融合Transformer和生成对抗网络的异常检测模型TransGAN-WT,通过放大重构误差、自回归多模态特征提取和时序特征交互学习,在真实风电机组数据集上F1达96.10%,误报率仅0.06%。
高维结果与高维预测变量的快速筛选方法
AI总结 提出图独立双筛选(GIDS)框架,同时降低响应变量和预测变量的维度,以解决高维交叉模态分析中的计算负担和可解释性问题。
Comments 38 pages, 2 figures
可扩展的导数高斯过程通过精确梯度约简
发表机构 * Department of Statistics University of Wisconsin–Madison(统计学系威斯康星大学麦迪逊分校)
AI总结 提出TERA方法,利用精确梯度约简将导数高斯过程的计算复杂度从O(n^3 d^3)降至O(d m^2 + m^6),实现高维空间中的可扩展推理。