Adaptive Derivative Estimation via Stein's Unbiased Risk
基于Stein无偏风险的自适应导数估计
AI总结 提出SURDE方法,通过Stein无偏风险评估候选滤波器长度并软组合输出,实现因果FIR导数滤波的噪声-偏差权衡,证明极小极大最优性,在仿真和真实数据上优于ICI和AWVE。
Comments Submitted to IEEE Transactions on Signal Processing, 23 pages
基于Stein无偏风险的自适应导数估计
AI总结 提出SURDE方法,通过Stein无偏风险评估候选滤波器长度并软组合输出,实现因果FIR导数滤波的噪声-偏差权衡,证明极小极大最优性,在仿真和真实数据上优于ICI和AWVE。
Comments Submitted to IEEE Transactions on Signal Processing, 23 pages
一种无模型策略增强的代理转移技术
发表机构 * Center for Engineering Systems and Sciences(工程系统与科学中心) ; Central University(中央大学) ; Sirius University of Science and Technology(天狼星科技大学)
AI总结 提出一种将次优基线策略嵌入强化学习训练的方法,通过逐步从基线策略向可学习策略转移代理权,提升训练效率并最终获得超越基线的独立策略。
抗干扰的稀疏时延-多普勒NOMA:酉预编码、随机激活集和超递增功率分配
AI总结 提出一种抗故意干扰的稀疏时延-多普勒NOMA方案,通过酉预编码和随机激活集实现干扰抑制,并利用超递增功率分配简化SIC,在Rician衰落中保持抗干扰性。
Comments 30 pages, 16 figures. Master version. Journal companion: arXiv:TBD. WCL companion: arXiv:TBD
信息最大化与失真最小化的最优反馈通信
AI总结 研究通过带反馈信道传输实值源的最优方案,提出信息最大化与失真最小化的联合优化条件,并证明后验匹配方案在对称离散信道中同时实现两者最优。
基于sEMG和唇读的鲁棒无声语音合成的跨模态掩蔽
发表机构 * Aholab research group within the HiTZ Center at University of the Basque Country (UPV/EHU)(巴斯克大学HiTZ中心内Aholab研究组) ; PRHLT research center, Universitat Politècnica de València (UPV)(瓦伦西亚理工大学PRHLT研究中心)
AI总结 提出掩蔽多模态语音合成框架,联合表面肌电图和唇读信号,通过训练时模态掩蔽提升鲁棒性,在多说话人设置下词错误率降低14个百分点。
Comments 12 pages, 7 figures and 6 tables. Submitted to Transactions on Audio, Speech and Language Processing
近场移动通信的吞吐量分析:波束聚焦还是焦散波束成形?
AI总结 本文针对太赫兹近场通信,通过分析波束聚焦和焦散波束成形的吞吐量,建立了切换开销阈值,证明在高移动性场景下焦散波束成形更优。
数百个浮动机器人的运动规划
发表机构 * Institute for Dynamic Systems and Control, ETH Zürich(苏黎世联邦理工学院动态系统与控制研究所)
AI总结 针对大型浮动机器人编队的无碰撞运动规划问题,提出一种可扩展的流水线方法,通过碰撞图分解为独立子问题并行求解,在500个机器人仿真和实际演示中验证了有效性。
赋能AI未来:应对欧洲能源转型与净零目标的权衡
发表机构 * Department of Chemical Engineering, Sargent Centre for Process Systems Engineering, University College London (UCL)(化学工程系、过程系统工程中心、伦敦大学学院(UCL)) ; Centre for Environmental Policy, Imperial College London(环境政策中心、伦敦帝国理工学院)
AI总结 通过21种AI增长情景下的空间优化模型,量化AI对欧洲电力需求、容量、排放和运行的影响,发现AI到2050年可能增加73-723 TWh需求,导致2030-2050年累计排放超调67-181 MtCO2,且AI基础设施选址将更依赖稳定电源和系统灵活性。
基于门限测量的多传感器跟踪伯努利滤波
AI总结 针对传感器检测门限导致的状态相关漏检问题,提出基于伯努利滤波的递归跟踪框架,联合处理杂波和目标存在不确定性,在仿真中相比固定检测概率的伯努利滤波将GOSPA指标降低62.4%。
Comments This work has been submitted to the IEEE for possible publication
你的U-Net去混响模型其实是一个RIR编码器
AI总结 本文分析NCSN++ U-Net去混响模型中间表示捕获全局房间特性的能力,发现深层编码结构化RIR嵌入,并提出基于对比学习RIR嵌入的条件训练策略,提升去混响性能并加速推理。
Comments Accepted to Interspeech 2026
一种通过可变限速实现混合交通中CAV控制的连续化方法
AI总结 提出一种基于连续化方法的CAV控制策略,通过设计PDE上的LQR控制器确定最优可变限速,再转化为各CAV的输入速度,以降低多CAV控制的计算负担。
Comments 7 pages, 5 figures. Accepted to IEEE ITSC 2026, Naples, Italy
分裂协方差交集滤波器的保证快速实现:由于w-优化的四阶凸性而提出的嵌套牛顿法
AI总结 本文证明分裂协方差交集滤波器中的w-优化问题具有四阶凸性,并基于此提出嵌套牛顿法,实现保证快速的滤波器实现。
面向战术MANET的无监督波形分类的分层联邦学习
AI总结 提出一种分层联邦学习框架,在瑞利衰落、随机移动和多跳路由损失的战术MANET中,通过无监督去噪卷积自编码器实现波形分类,两阶段聚合协议减少传输比特约12%,并发现信道驱动的子采样可作为隐式正则化器。
Comments 6 pages, 3 figures
仅多普勒低轨定位的轨道平面几何与信息条件
AI总结 针对静止接收机利用低轨机会信号进行仅多普勒定位,提出将卫星贡献建模为轨道平面上的加权投影,推导信息矩阵的特征值、条件数和最坏情况克拉美-罗下界,揭示轨道平面二面角与信息强度对条件数的影响。
Comments 5 pages, 3 figures
供应商无关的四维相位对比磁共振成像:用于速度、位移和应变分析的完整开源流程
AI总结 提出一个完全开源的4D flow PC-MRI流程,集成压缩感知加速、BART重建和应变分析,通过梯度探测序列确保速度符号正确,并在两种MRI系统和两个解剖部位验证,显著缩短采集时间。
跟踪非凸卫星的有效表面积
AI总结 提出一种框架,通过反步控制算法跟踪非凸卫星的有效表面积,以利用低地球轨道气动阻力进行轨道控制,并同时优化太阳能板朝向。
Comments 6 pages, 5 Figures
利用最优信息-功率流进行交流/多端直流电网的输电切换
AI总结 提出一种考虑通信网络影响的最优信息-功率流模型,用于解决交流/多端直流电网中的输电切换问题,并通过凸松弛等方法转化为混合整数二阶锥规划模型求解。
Comments 6 pages
输出延迟线性系统的延迟功能观测器
AI总结 针对输出测量严重滞后问题,提出一类新型延迟功能观测器,通过系统处理执行器和传感器通道的不等延迟,实现低阶框架重构延迟控制律。
Comments Short version of a chapter intended for a forthcoming research monograph
AC/MTDC电力系统高级仿真框架
AI总结 针对AC/MTDC混合电力系统的稳定性与谐波问题,提出基于C++的开源仿真框架HARMONY,集成最优潮流与谐波稳定性分析功能,提供快速可信的稳定性评估。
Comments 13 pages
文本就是一切?文本作为语音大语言模型的通用信息瓶颈
发表机构 * The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; Microsoft Corporation(微软公司) ; Microsoft Research Asia(微软亚洲研究院)
AI总结 提出Convex Gate(C-Gate)桥接语音与LLM,通过凸包约束将语音表示限制在LLM输入嵌入流形内,在ASR和情感识别上取得联合最优性能,并揭示几何结构而非离散性是关键设计因素。
重新思考深度:递归Transformer在语音识别中的研究
AI总结 本文实验研究了递归Transformer在语音识别编码器中的应用,通过潜空间有限循环递归,在保持性能的同时减少66%参数。
区域特定数据对印度自动语音识别性能影响的研究
AI总结 通过微调控制实验,研究印度语言跨区域ASR泛化能力,发现地理距离与词错误率正相关,强调区域多样性数据的重要性。
参数高效持续学习用于自动语音识别
AI总结 提出一种基于奇异值分解的头部-尾部子空间划分方法,在低能量尾部子空间进行近似旋转适应,结合权重平均减少遗忘,实现参数高效的持续学习ASR。
Comments Accepted at Interspeech 2026
影响ASR性能的因素:使用最先进的ASR模型在印度语言中的研究
AI总结 本研究通过多种开源ASR模型在零样本设置下对印度语言语音数据集进行大规模分析,探讨语言、说话者和声学因素对词错误率的影响,揭示了跨语言模式与语言特定敏感性。
可穿戴单导联心电图通过超声报告监督检测细粒度结构性心脏病
AI总结 提出AnyECG-Echo框架,利用单导联心电图与超声报告对比预训练,在外部队列中检测13种细粒度结构性心脏病亚型,实现高AUROC并具备双轴可解释性。
基于特征质量评估的动态XR渲染卸载
AI总结 提出一种边缘辅助XR渲染测试平台,利用基于深度特征嵌入和余弦相似度的感知质量指标,结合上下文赌博机学习控制器,动态优化渲染卸载决策以平衡感知质量和延迟。
预训练语音编码器与训练目标在大规模印度语种口语识别中的比较研究
AI总结 本文系统比较了Whisper和FastConformer两种预训练语音编码器结合线性分类器在42种印度语言口语识别中的表现,评估了交叉熵、监督对比损失和层次softmax三种训练目标,发现冻结FastConformer在跨域测试中表现优异,而层次softmax一致优于其他目标。
基于对偶四元数的无迹卡尔曼滤波与视觉惯性里程计在GPS拒止环境中的导航
发表机构 * Carleton University(卡尔顿大学)
AI总结 提出一种基于对偶四元数的无迹卡尔曼滤波(DQUKF)结合视觉惯性里程计(VIO),在GPS拒止环境下实现高精度状态估计,在EuRoC数据集上位置RMSE达0.2584米。
重新审视SUMO中的介观交通流仿真:局限性、分析与替代方案
AI总结 针对SUMO中Eissfeldt介观模型不遵循LWR理论的问题,提出基于链路传输模型的离散时间实现,显式考虑后向传播空间以精确捕捉拥堵动态。
Comments Presentation at SUMO Conference 2026
块项分解方法用于盲多试验功能超声分离
AI总结 提出基于块项张量分解的卷积模型,从多试验fUS数据中盲分离神经源并解卷积血流动力学响应,通过交替投影梯度下降优化,仿真验证了空间图恢复和激活时间估计的准确性。