arXivDaily arXiv每日学术速递 周一至周五更新

科学与医疗

AI for Science

科学智能、蛋白质、分子、药物、材料、气象、物理和数学 AI。

今日/当前日期收录 8 信号源:cs.LG, q-bio, physics, cond-mat, math, stat.ML
2508.20275 2026-06-18 cs.LG cs.CL q-bio.QM 专题 95

A Systematic Review on the Generative AI Applications in Human Medical Genomics

关于生成式AI在人类医学基因组学中的应用系统综述

Anton Changalidis, Yury Barbitoff, Yulia Nasykhova, Andrey Glotov

专题命中 蛋白质与生物分子 :系统综述生成式AI在人类医学基因组学中的应用,涉及基因组变异识别和注释。

AI总结 本文系统综述了生成式AI在罕见和常见疾病遗传研究与诊断中的应用,分析了LLM在基因组变异识别、注释及医学影像中的作用,指出其在多模态数据整合和临床应用中的挑战。

Comments 31 pages, 5 figures

Journal ref Frontiers in Genetics 16 (2026) 1694070

2606.18703 2026-06-18 cs.LG q-bio.QM 新提交 专题 90

Contextualizing Biological Language Models across Modalities via Logit-Space Contrastive Alignment

跨模态生物学语言模型的逻辑空间对比对齐

Yanjun Shao, Yundi Chen, Yashvi Patel, Aurelien Pelissier, María Rodríguez Martínez

专题命中 蛋白质与生物分子 :生物学语言模型跨模态对齐,用于蛋白质-配体预测

AI总结 提出LOGICA框架,在输出逻辑空间进行对比学习,通过门控跨模态适配器保留预训练似然接口,实现跨不同词汇表模型的上下文条件预测,在蛋白质-配体结合、TCR-肽活性和药物耐药性预测任务上超越现有方法。

2606.18672 2026-06-18 cs.LG cs.AI q-bio.GN 新提交 专题 90

scGTN: Deep Siamese Graph Transformer Network for Single-cell RNA Sequencing Clustering

scGTN:用于单细胞RNA测序聚类的深度孪生图变换网络

Jinke Wu, Yifan Wang, Siyu Yi, Caiyang Yu, Ziyue Qiao, Nan Yin, Jiancheng Lv, Wei Ju

专题命中 蛋白质与生物分子 :单细胞RNA测序聚类,孪生图变换网络

AI总结 提出scGTN框架,通过孪生图变换网络整合基因表达与细胞间结构信息,利用最优传输策略进行自监督聚类,在多个数据集上优于现有方法。

Comments Accepted by Proceedings of the Thirty-Fifth International Joint Conference on Artificial Intelligence (IJCAI 2026)

2601.12805 2026-06-18 q-bio.GN cs.AI cs.CL 版本更新 专题 90

SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding

SciHorizon-GENE:从基因知识到功能理解的生命科学推理基准测试

Xiaohan Huang, Meng Xiao, Chuan Qin, Qingqing Long, Jinmiao Chen, Yuanchun Zhou, Hengshu Zhu

专题命中 蛋白质与生物分子 :基因功能推理基准,属于生命科学AI。

AI总结 针对大语言模型在基因级推理能力上的不足,构建了包含超过19万个人类基因和54万问题的基准SciHorizon-GENE,从研究关注敏感性、幻觉倾向、答案完整性和文献影响力四个生物学关键维度评估模型,揭示了模型在生成忠实、完整且基于文献的功能解释方面的持续挑战。

Comments Accepted by SIGKDD 2026. 12 pages

2606.18302 2026-06-18 q-bio.OT cs.LG 新提交 专题 85

Protein-Based Fish Species Identification: Dataset, Models, and Insights from Native Bangladeshi Fish

基于蛋白质的鱼类物种识别:孟加拉本土鱼类的数据集、模型与见解

Md Nasiat Hasan Fahim, Md. Abid Ullah Muhib, Mohammad Shahidur Rahman

专题命中 蛋白质与生物分子 :鱼类蛋白质序列分类,轻量混合模型

AI总结 本研究构建了首个孟加拉本土鱼类蛋白质序列数据集,并系统评估了七种架构,提出了一种轻量级混合模型MotifCNN-Transformer+TA-PE,在资源受限场景下优于大型蛋白质语言模型ProtBERT。

Comments Published in 2026 IEEE 2nd International Conference on Quantum Photonics, Artificial Intelligence & Networking (QPAIN). \c{opyright} 2026 IEEE. Personal use of this material is permitted

Journal ref 2026 IEEE 2nd International Conference on Quantum Photonics, Artificial Intelligence & Networking (QPAIN)

2606.18961 2026-06-18 cs.LG 新提交 专题 85

Be Your Own Teacher: Steering Protein Language Models via Unsupervised Reward Optimization

做自己的老师:通过无监督奖励优化引导蛋白质语言模型

Lanqing Li, Shentong Mo, Yang Yu, Pheng-Ann Heng

专题命中 蛋白质与生物分子 :无监督奖励优化引导蛋白质语言模型生成。

AI总结 提出无监督奖励优化框架,结合模型不确定性和语义一致性作为代理奖励,通过SRO和BRO算法优化PLMs,在无标签数据下实现可控蛋白质生成,性能接近有监督方法。

Comments 24 pages, 2 figures, 13 tables

2606.18495 2026-06-18 physics.chem-ph physics.bio-ph physics.comp-ph q-bio.BM 新提交 专题 80

Bayesian Sampling of Structural Ensembles: The Role of Ensemble-Counting Measures

结构系综的贝叶斯采样:系综计数测度的作用

Ivan Gilardoni, Giovanni Bussi

专题命中 蛋白质与生物分子 :贝叶斯采样结构系综,RNA模拟

AI总结 本文提出Jeffreys测度作为系综计数测度,解决BELT框架中拉格朗日乘子空间平直测度导致的有限参考轨迹下后验分布不可归一化问题,并在RNA寡聚体模拟中验证了测度选择对贝叶斯估计的影响。

2603.27465 2026-06-18 q-bio.GN 版本更新 专题 80

Poisoning the Genome: Targeted Backdoor Attacks on DNA Foundation Models

基因组投毒:针对DNA基础模型的目标后门攻击

Charalampos Koilakos, Ioannis Mouratidis, Ilias Georgakopoulos-Soares

专题命中 蛋白质与生物分子 :DNA基础模型后门攻击,属基因组学

AI总结 本研究首次系统研究基因组语言模型的训练数据投毒,通过在预训练和微调阶段注入少于1%的对抗序列,可选择性破坏目标基因组上下文的生成性能,并实现条件后门攻击和下游任务分类破坏。

Comments 23 pages, double column format