Pre-Fault Voltage Discrimination and Time-Domain Protection for Distribution Networks with Inverter-Based Resources
含逆变器资源的配电网故障前电压判别与时域保护
AI总结 针对逆变器资源导致传统过流保护失效的问题,提出故障前电压判别策略结合时域保护原理,实现快速可靠故障检测。
含逆变器资源的配电网故障前电压判别与时域保护
AI总结 针对逆变器资源导致传统过流保护失效的问题,提出故障前电压判别策略结合时域保护原理,实现快速可靠故障检测。
基于个性化深度学习的连续可穿戴心电图信号短期房颤预测
AI总结 针对可穿戴心电图中房颤预测的个体差异问题,提出通过微调全局模型实现个性化预测,在三个数据集上显著提升性能,并揭示了心率、RMSSD等临床相关前兆特征。
Comments Code is available at https://github.com/SNU-DRL/Personalized-AF-Forecasting
信息瓶颈遇上量化:有限速率分析与最优设计
AI总结 本文理论分析了高斯信息瓶颈(GIB)潜在表示的标量和向量量化对目标数据信息性的影响,并提出了在有限速率约束下的任务导向量化设计,在MMSE回归问题上验证了有效性,最后将任务导向思想扩展到非高斯场景。
Comments 16 pages, 9 figures
基于LLM的语音识别的音素优先预测
AI总结 提出在LLM中集成音素预测步骤,先预测音素再生成转录,以提升低资源场景下的语音识别准确性和可解释性。
Comments Accepted at EUSIPCO 2026
面向基于LLM的自动语音识别的语音编码器融合
AI总结 研究融合多个预训练语音编码器以增强基于LLM的ASR性能,提出多种融合策略并在多场景下验证其有效性。
Comments Accepted at Interspeech 2026
面向语音-大语言模型的基于元数据驱动推理链的宽描述深度上下文推理
AI总结 提出一种训练方法,使语音-LLM利用宽描述作为弱语义先验,通过链式推理进行上下文修正,降低罕见词和命名实体错误率。
Comments Accepted at Interspeech 2026
锚定未知:基于代理-锚点学习的开放集模型归因
AI总结 提出基于代理-锚点损失函数的度量学习框架,利用Wav2Vec2-BERT嵌入实现TTS源归因和未知系统检测,在140个TTS系统上达到99.76%准确率和2.04%误报率。
Comments Accepted to the 34th European Signal Processing Conference (EUSIPCO 2026)
基于重尾似然的复变分自编码器在海杂波中雷达目标检测
AI总结 针对海杂波重尾、尖峰特性及目标标签稀缺问题,提出无监督复变分自编码器,采用Student-t负对数似然捕获重尾重构误差,并引入时域幅度误差约束,实现恒虚警率下的雷达目标检测。
GC-LoRA:用于参数高效声学适应的门控卷积LoRA
AI总结 提出GC-LoRA适配器架构,通过注入Conformer风格的局部卷积处理到预训练Transformer编码器中,高效捕捉局部声学依赖,在多种声学失配领域实现高达10.9%的词错误率降低。
Comments Accepted for publication at Interspeech 2026
拉普拉斯混合偶极子反演用于定量磁化率成像
AI总结 提出一种基于拉普拉斯混合先验的自动偶极子反演方法(LAMDI),无需手动调参即可在定量磁化率成像中保留精细解剖结构,性能与现有方法相当。
可移动天线-RIS配置的联合移动与相位优化的最优照明
AI总结 提出可移动天线增强RIS架构,利用随机微分方程建模天线移动,通过两时间尺度框架优化长期信噪比,实现高达36 dB稳态增益和16倍能效提升。
弯曲波束赋能无线通信:建模、分析与优化
AI总结 针对障碍物场景,提出利用连续孔径阵列生成弯曲波束以提升无线通信性能,通过建模波束控制与分段信道,设计基于分数规划和增强块坐标上升的迭代算法优化加权和速率。
使用幅度和相位CSI在6 GHz频段进行人体行走感知与姿态估计
AI总结 研究利用6 GHz OFDM信号的幅度和相位CSI进行室内人体姿态估计,设计处理流程并适配四种深度学习模型,实验表明幅度CSI性能与联合幅度-相位处理相当,相位信息作为补充特征更有效。
DMT: 基于人口统计条件与形态增强Transformer的无袖带血压估计方法
发表机构 * University of California, San Diego(加州大学圣地亚哥分校)
AI总结 提出一种基于Transformer的PPG信号无袖带血压估计网络,通过FiLM风格特征调制融入人口统计信息,并添加辅助形态头引导模型关注与动脉僵硬度相关的波形形态,在PulseDB数据集上实现收缩压MAE 4.56 mmHg、舒张压MAE 2.62 mmHg。
基于CNN和GRU网络的哮喘与COPD鉴别诊断中二维输入表示和子阶段融合策略的优化
发表机构 * Dept. Electrical and Electronics Engineering Istanbul Bilgi University, Turkey(电气与电子工程系伊斯坦布尔比尔吉大学,土耳其) ; Dept. Computer Engineering Istanbul Bilgi University, Turkey(计算机工程系伊斯坦布尔比尔吉大学,土耳其)
AI总结 本研究优化了二维输入表示(MFCC、对数梅尔谱图、VAR模型)和子阶段特征融合策略(直接拼接、GRU、GRU+注意力),使用CNN和GRU网络鉴别哮喘与COPD,最佳F1分数达0.877。
在无监督术语发现中恢复齐夫分布
发表机构 * Het Jan Marais Fonds(赫特·詹·马里茨基金会)
AI总结 针对无监督术语发现中中心聚类导致分布不均匀的问题,提出图聚类方法,在三种语言上显著优于K-means等,恢复更接近齐夫分布的词汇分布。
Spatial-Omni:通过FOA编码在多模态大语言模型中实现空间音频理解
发表机构 * Zhejiang University(浙江大学) ; Tencent Hunyuan(腾讯文心)
AI总结 提出Spatial-Omni,通过SO-Encoder将一阶Ambisonics空间音频注入现有全模态大语言模型,以轻量方式实现空间音频理解,并在构建的SO-Bench基准上超越现有模型。
++nnU-Net: 基于前缀数据增强的nnU-Net扩展
发表机构 * Center Algoritmi / LASI, University of Minho, Braga, Portugal(阿尔戈里米中心/拉斯伊大学,明霍大学,布拉加,葡萄牙) ; Institute for Artificial Intelligence in Medicine, University Medicine Essen, Essen, Germany(医学人工智能研究所,埃森医学院,埃森,德国) ; Institute of Medical Informatics / Dept. of Oral and Maxillofacial Surgery, University Hospital RWTH Aachen, Germany(医学信息学研究所/口腔和颅面外科部,亚琛大学医院,德国) ; Faculty of Computer Science, University of Duisburg-Essen, Essen, Germany(计算机科学学院,杜伊斯堡-埃森大学,埃森,德国)
AI总结 提出++nnU-Net,通过图像配准进行数据增强,在预处理和训练前生成变形图像,在5个2D数据集上提升Dice系数最高约22%。
Comments 7 pages, 1 figure, 2 tables
熵感知域路由混合专家语音-大语言模型框架:多领域儿童-成人ASR案例研究
发表机构 * University of California, Los Angeles, USA(加州大学洛杉矶分校)
AI总结 提出一种混合专家语音-大语言模型,通过分类器域路由、混合投影器和混合LoRA模块以及熵感知路由机制,实现跨不同环境和年龄组的统一儿童-成人ASR,在公共儿童语料库上取得一致改进。
Comments Accepted to Interspeech 2026
SSL-GMMVC:自监督表示空间中通过局部线性GMM变换的可解释语音转换
发表机构 * The University of Tokyo, Japan(东京大学)
AI总结 提出SSL-GMMVC方法,在自监督语音空间中用高斯混合模型建模源-目标特征,通过后验加权仿射变换实现可解释的语音转换,在保持可理解性和自然度的同时提升说话人相似度。
Comments Accepted to Interspeech2026
重叠小波扩散用于低光照图像增强
AI总结 提出重叠小波扩散框架OWDiff,通过重叠小波变换消除块伪影,并引入低频引导的高频增强模块恢复细节,在LOLv1和LOLv2-real数据集上优于现有方法。
Comments Advance published in IEICE Transactions on Information and Systems. DOI: 10.1587/transinf.2026PCP0006. Code: https://github.com/FinnPeg/Overlapped-Wavelet-Diffusion
ANCHOR: 自回归非侵入式分块有序细化用于联合多分辨率语音质量建模
发表机构 * University of Southern California, USA(美国南加州大学) ; Carnegie Mellon University, USA(美国卡内基梅隆大学)
AI总结 提出ANCHOR模型,将增量语音质量评估重构为多分辨率自回归任务,通过双分辨率令牌和分辨率感知层次实现分块到整句的粗到细细化,在部分输入下显著降低误差,并揭示感知质量的时域积累机制。
Comments Accepted at Interspeech 2026
DeRA-MOS:通过解耦列表排序和模态对齐优化文本到音乐评估
发表机构 * E.SUN Financial Holding Co., Ltd.(E.SUN财务控股公司) ; United Link Co., Ltd.(联合链接有限公司) ; Institute of Information Science, Academia Sinica(学术院信息科学研究所) ; Department of Computer Science and Information Engineering, National Taiwan Normal University(台湾师范大学计算机科学与信息工程系)
AI总结 提出DeRA-MOS解耦优化框架,通过批感知列表排序损失和分数锚定模态对齐损失,分别优化音乐印象和文本对齐的排名指标,在MusicEval上显著提升评估性能。
Comments Accepted to IEEE Signal Processing Letters (SPL)
深度切片插值用于减少头部CT的穿平面各向异性和噪声
发表机构 * Department of Computer Science and Artificial Intelligence, University of Seville(塞维利亚大学计算机科学与人工智能系) ; Bioaraba Health Research Institute(Bioaraba健康研究 institute) ; IKERBASQUE, Basque Foundation of Science(巴斯克科学基金会)
AI总结 提出一种深度学习系统,通过相邻轴向切片对合成中间CT切片,将有效穿平面间距减半,同时实现隐式降噪,在结构指标上优于经典插值和视频帧插值方法。
TractFM:纤维束图基础模型
发表机构 * The State Key Lab of Brain-Machine Intelligence, Zhejiang University, Hangzhou(脑机智能国家重点实验室,浙江大学,杭州) ; Department of Radiology, Brigham and Women’s Hospital, Mass General Brigham, Boston(放射科,布里洛妇女医院,马萨诸塞总医院,波士顿) ; Harvard Medical School, Boston(哈佛医学院,波士顿) ; Academy of Medical Engineering and Translational Medicine, Tianjin University, Tianjin(医学工程与转化医学研究院,天津大学,天津) ; School of Information and Communication Engineering, University of Electronic Science and Technology of China, Chengdu(信息与通信工程学院,电子科技大学,成都) ; Psychiatry Neuroimaging Laboratory, Brigham and Women’s Hospital, Mass General Brigham, Boston(精神病神经影像实验室,布里洛妇女医院,马萨诸塞总医院,波士顿) ; Department of Psychiatry, Center for Morphometric Analysis, Massachusetts General Hospital, Boston(精神病科,形态分析中心,马萨诸塞总医院,波士顿)
AI总结 提出TractFM基础模型,直接从全脑纤维束集学习可复用表示,结合局部纤维编码器和置换等变纤维束编码器,通过密集解剖束分割预训练,实现纤维束级和受试者级任务的迁移。
全双工语音模型中的多面交互对齐
发表机构 * Kyutai ; Gradium
AI总结 针对全双工对话模型交互性问题,提出基于强化学习的后训练对齐方法,从暂停处理、话轮转换、回馈和用户打断四个维度优化,并加入LLM奖励防止语义退化,在Moshi和PersonaPlex上取得一致改进。
QUIET: 量化未充分利用的影响边以实现目标同步
AI总结 提出边中心框架QUIET,结合结构可控性和功能互信息识别能量高效的同步路径,验证其在合成网络和人类连接组中的有效性。
Comments 38 Pages; 6 Figures; 8 SIs
LLM介导的智能微电网需求响应协调
AI总结 针对智能微电网中产消者自愿合作的需求响应协调问题,提出一种结合博弈论与LLM叙事评估的混合决策架构,通过结构化指令实现33.3%的需求削减合作率,优于非结构化消息和基线。
Comments Accepted for publication in 18th International Conference on Sustainability in Energy and Buildings (SEB-26), to appear in Springer Nature proceedings (KES Smart Innovation Systems and Technologies). The final authenticated version will be available online at Springer
具有稳定性保证的非线性控制中L2有界结构化状态空间控制器的自由参数化
AI总结 提出一种新的线性时不变系统L2增益自由参数化方法,构建L2RU层,通过小增益定理保证非线性系统闭环稳定性,实现无约束优化。
基于数据驱动的着陆飞机跑道和滑行道出口预测:以哈茨菲尔德-杰克逊亚特兰大国际机场为例
发表机构 * Department of Aerospace Engineering and Engineering Mechanics, The University of Texas at Austin(德克萨斯大学奥斯汀分校航空航天工程与工程力学系)
AI总结 针对机场场面运行效率问题,提出两阶段数据驱动决策辅助模型,分别预测着陆飞机选择的跑道出口及是否穿越活跃起飞跑道,在亚特兰大机场数据上验证,XGBoost和LightGBM表现最优,进近速度是出口选择的关键因素。