Blind SNR Estimation for FSO Communication Systems with Deep Fading
深衰落FSO通信系统中的盲SNR估计
AI总结 针对深衰落FSO通信系统,评估M2M4和EVM方法进行实时SNR估计,实验表明M2M4估计器能可靠跟踪SNR轮廓,适用于触发收发器自适应。
深衰落FSO通信系统中的盲SNR估计
AI总结 针对深衰落FSO通信系统,评估M2M4和EVM方法进行实时SNR估计,实验表明M2M4估计器能可靠跟踪SNR轮廓,适用于触发收发器自适应。
不确定Dubins系统的曲率约束路径鲁棒跟踪
AI总结 针对具有不确定Dubins动力学的车辆/机器人,提出基于滑模控制的鲁棒跟踪控制器,保证横向和航向误差在有限扰动下收敛到零。
Comments 6 pages, 3 figures. Accepted to IFAC World Congress 2026
Alt-CC-PINN:一种用于微波逆散射成像的隐式神经表示交替优化框架
AI总结 提出基于交叉相关物理信息神经网络的交替优化框架(Alt-CC-PINN),通过解耦物理场演化与神经网络参数推断,结合解析共轭梯度法和深度学习优化器,有效解决高对比度、低信噪比环境下的微波逆散射成像局部极小问题。
创建临床验证的皮肤镜图像数据集的方法论
AI总结 提出一种结合移动皮肤镜图像采集标准操作程序、结构化元数据信息模型和多阶段专家验证的方法,构建临床验证的皮肤镜图像数据集,用于医学信息学研究。
Comments 22 pages, 5 figures, 5 tables
扩散模型视频超分辨率中的视频质量模型有多准确?
AI总结 本研究通过主观测试比较了六种扩散模型视频超分辨率方法,评估现有视频质量模型(尤其是全参考和无参考模型)在扩散VSR上的准确性,发现基于CNN的全参考模型相关性较高但均不足以替代主观测试。
Comments Accepted for the 18th International Conference on Quality of Multimedia Experience (QoMEX 2026)
Thaka at KSAA-2026 Task 2: 用于阿拉伯语音节符号化的正则化微调
AI总结 针对低资源阿拉伯语音节符号化任务,通过正则化微调CATT-Whisper多模态模型,结合R-Drop一致性正则化、Optuna优化超参数和Focal Loss,在KSAA-2026共享任务中取得第一名。
Comments 4 pages, 1 figure. Published in Proceedings of OSACT7 (LREC 2026). Winning system for KSAA-2026 Task 2 on Arabic Speech Diacritization
临床验证的基础模型用于全面肺部病理解读
AI总结 提出PulmoFoundation,一种基于Virchow2和约4万张H&E染色全切片图像进行亚专科预训练的肺部病理基础模型,通过32项临床任务和前瞻性随机对照试验验证,在诊断准确性、效率和一致性上显著提升。
对称定位问题:效率与鲁棒性的协奏曲
AI总结 本文通过半参数统计框架解决对称定位问题,在存在无限维 nuisance 参数时实现有限维参数的估计,兼顾统计效率与分布自由鲁棒性。
CINOC: 用于可扩展PDE控制的不变性基数神经算子策略
AI总结 提出基数不变神经算子控制(CINOC),通过将PDE控制重构为算子学习问题,实现策略在传感器、执行器或智能体配置变化时的零样本迁移和可扩展性。
智能城市中联网自动驾驶电动汽车的最优调度以增强短期电网灵活性
AI总结 提出一种协调的能源-出行调度框架,通过动态调度配备虚拟电池分区的联网自动驾驶电动汽车车队,在时间约束下为智能城市提供电网支持服务,并利用模型预测控制满足出行能量需求和截止时间要求。
网络攻击下离散事件系统的确定性与非阻塞监督控制
AI总结 本文利用ALTER模型研究网络攻击下离散事件系统的确定性与非阻塞监督控制,提出CA-D可控性和CA-D可观测性概念,并证明其存在性条件。
基于里德伯原子接收器阵列的鲁棒量子MUSIC波达方向估计
AI总结 针对量子MUSIC算法对异常值敏感的问题,提出用ℓ1范数替代ℓ2范数的鲁棒量子MUSIC框架,通过迭代重加权最小二乘求解相位恢复,在保持结构不变下实现抗异常值性能。
基于梅尔频谱的超低比特率神经语音编码:流匹配精化与声码器驱动重建
AI总结 提出FMelCodec,一种在梅尔频谱域的三阶段编码-精化-重建框架,通过640倍压缩、在线聚类、条件流匹配精化和HiFi-GAN声码器,在250 bps(16 kHz)和750 bps(48 kHz)超低比特率下实现高质量语音重建和说话人相似性。
Comments Published at IEEE/ACM Transactions on Audio, Speech, and Language Processing
运营约束下多模式自主出行系统的公正知情规划
AI总结 本文提出一种考虑用户预算、安全限制和基础设施容量约束的公正知情优化模型,用于多模式自主出行系统(AMoD)的运营规划,并在纽约曼哈顿案例中验证了免费公共交通政策能接近完全免费AMoD系统的公正水平且不牺牲效率。
Comments Accepted for presentation at conference IEEE ITSC 2026. This is the preprint version
在不平衡EEG数据集中基于刺激重建的听觉注意力鲁棒解码
AI总结 研究不平衡数据集对基于刺激重建的听觉注意力解码性能的影响,提出留一对包交叉验证协议以防止解码准确率膨胀。
基于CP分解张量处理的时变参数信道估计
AI总结 针对时变频率选择性信道,提出一种基于CP分解和ESPRIT初始化的快速参数信道估计算法,性能接近多起点SAGE但计算量低一个数量级。
投影多参考对齐
AI总结 针对投影多参考对齐模型,在高噪声条件下利用前三阶矩恢复信号的二面体轨道,并证明样本复杂度与噪声方差的六次方成正比。
cSTMM:一种用于基于掩码的盲语音分离中方向统计的统一复球面学生t混合模型
AI总结 提出复球面学生t混合模型(cSTMM),通过自由度参数ν统一cACGMM、cBMM和cWMM,并推导基于广义MM的参数估计方法,在无噪声混响语音分离中取得优于cACGMM的SDRi增益。
WaveNeXt 2:基于ConvNeXt的快速神经声码器,采用残差去噪和子建模用于GAN和扩散模型
AI总结 提出WaveNeXt 2统一框架,通过残差去噪和子建模使ConvNeXt架构同时适用于GAN和扩散声码器,在多说话人数据集上实现更快推理和竞争性合成质量。
Comments ICASSP 2026 - 2026 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
面向自然情感文本到语音系统:细粒度非语言表达控制
AI总结 提出一种基于EARS语料库的细粒度非语言表达合成方法,通过新标注方案编码NV类型、频率和时长,在情感TTS中显著提升表现力(eMOS 4.20)和情感识别准确率(78.8%)。
Comments 2025 28th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques (O-COCOSDA)
子空间检测前跟踪用于未知发射信号的被动多目标跟踪
AI总结 针对被动多目标跟踪中未知发射信号的问题,提出基于复Bingham分布似然的子空间检测前跟踪方法,无需显式建模或估计未知信号,在-10dB信噪比下实现双目标跟踪。
MIMO通信系统中的深度机器学习
AI总结 本文提出一种基于自编码器的端到端MIMO通信系统,通过联合优化发射机、接收机和信道,在瑞利衰落和噪声条件下显著降低误码率。
面向区域空中交通的飞机与机队规模优化:大学城案例研究
AI总结 通过联合供需优化框架,研究飞机座位配置与机队规模对区域空中交通盈利能力和吞吐量的影响,发现4座和6座配置在不同市场条件下表现最优。
Comments Submitted to International Workshop on ATM/CNS (IWAC)
模式0:面向路侧计算单元辅助安全通信的新型3GPP V2X资源分配类别
AI总结 针对现有3GPP V2X资源分配框架中基站与车辆UE二元分类的结构性缺陷,提出以路侧计算单元(RCU)为核心实体的新模式0,通过集成感知、通信与计算能力,实现高密度交通场景下的低延迟安全通信,并利用MAPPO仿真验证了其性能优势。
Comments 13 pages, 7 figures, 4 tables. Submitted to IEEE Transactions on Intelligent Transportation Systems
面向多智能体协作的令牌/KV缓存通信介质选择与资源分配策略
AI总结 针对多智能体协作中异构交互介质带来的端到端延迟权衡问题,提出一种联合通信介质选择与无线资源分配的优化方法,并设计低复杂度算法以最小化延迟。
主动应对不确定性:面向口语对话系统的因果感知错误诊断与交互式澄清
AI总结 本文提出一种因果感知的错误恢复范式,通过细粒度检测器解耦ASR中的感知、理解和删除错误,使LLM能够执行多轮针对性澄清策略,从而显著降低词错误率并提升下游任务性能。
一种用于机会频谱接入中快速信道分配的上下文增强多玩多臂老虎机算法
AI总结 针对机会频谱接入中的信道分配问题,提出一种上下文增强的多玩多臂老虎机算法,通过将信道噪声建模为奖励函数的扰动并利用信道状态信息作为上下文,分别针对线性和非线性相关性推导出两种索引策略,实现低遗憾和更合理的次优臂选择。
Comments Accepted by ISCC'24
基于深度图拉普拉斯正则化的参数高效CT重建
AI总结 提出深度图拉普拉斯正则化(Deep GLR)方法,通过将二次图正则化集成到近端前向-后向分裂优化框架中,仅用少量参数和数据即可实现低剂量CT重建的噪声抑制,在参数效率和数据效率上显著优于现有方法。
Comments 7 pages, 3 figures, conference
用于学习和规划的并行可微可达性:带认证的神经动力学与控制器
AI总结 提出一种基于JAX的并行可微可达性框架,结合泰勒模型流形构建与CROWN线性界传播,支持GPU批处理和自动微分,并用于认证训练和可达性感知的MPC,在非抓取操作和四旋翼任务中实现在线规划与有界不确定性下的认证可达集过近似。
Comments Robotics: Science and Systems XXII (RSS 2026)
TIP:一种用于声明式物联网互操作性和沙盒模式适配的去中心化意图协议
AI总结 提出去中心化声明式协议TIP,通过意图驱动、混合发现、多准则评分和WASM沙盒动态适配,解决物联网异构系统互操作性问题。
Comments 12 pages, 3 figures