arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

代码大模型 / AI 编程

代码生成、软件工程智能体、程序修复、测试生成和开发者工具。

今日/当前日期收录 11 信号源:cs.SE, cs.CL, cs.AI, cs.LG, cs.PL
2606.18733 2026-06-18 cs.SE cs.AI 新提交 专题 90

SWE-Future: Forecast-Conditioned Data Synthesis for Future-Oriented Software Engineering Agents

SWE-Future: 面向未来软件工程智能体的预测条件数据合成

Qiao Zhao, JianYing Qu, Jun Zhang, Yehua Yang, Hanwen Du, Zhongkai Sun

专题命中 软件智能体 :面向未来软件工程智能体的数据合成。

AI总结 提出SWE-Future方法,利用仓库历史证据预测未来任务类型(如功能实现、缺陷修复),并基于预测条件合成200个编码智能体任务,减少对历史PR回放的依赖,在80个仓库中达到58.1%的未来工作相关性。

2606.15828 2026-06-18 cs.SE 新提交 专题 90

Configuration Smells in AGENTS.md Files: Common Mistakes in Configuring Coding Agents

AGENTS.md 文件中的配置异味:配置编码代理的常见错误

Helio Victor F. dos Santos, Vitor Costa, Joao Eduardo Montandon, Luciana Lourdes Silva, Marco Tulio Valente

专题命中 软件智能体 :编码代理配置文件异味分析,软件工程

AI总结 本文首次系统化编码代理配置文件(AGENTS.md/CLAUDE.md)的异味,通过灰文献综述和仓库挖掘识别出六种异味,并在100个开源仓库中验证其普遍性,其中Lint Leakage最常见(62%)。

2602.02690 2026-06-18 cs.SE 版本更新 专题 90

Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All

超越LLM截止日期:一个面向所有人的实时内核崩溃修复基准

Chenxi Huang, Alex Mathai, Feiyang Yu, Aleksandr Nogikh, Petros Maniatis, Franjo Ivančić, Eugene Wu, Kostis Kaffes, Junfeng Yang, Baishakhi Ray

专题命中 软件智能体 :LLM代理修复内核崩溃,评估框架

AI总结 提出Live-kBench和kEnv框架,用于持续评估LLM代理修复新发现的Linux内核崩溃,实验显示代理在截止日期前修复率高出25%,但仅20%的补丁与开发者修复匹配。

2606.19216 2026-06-18 cs.SE cs.HC 新提交 专题 85

No Two Developers Think Alike: How Problem-Solving Styles and Experience Shape Needs in Conversational Interaction with Copilot

没有两个开发者想法相同:问题解决风格和经验如何塑造与 Copilot 对话交互中的需求

Jonan Richards, Bruno Alves de Oliveira, Iury Oliveira, Igor Wiese, Mairieli Wessel

专题命中 软件智能体 :研究开发者与Copilot的交互,属于AI编程

AI总结 通过混合方法出声思考研究,识别出5种交互模式和10种需求,并建立概念模型,揭示认知多样性如何影响开发者与GitHub Copilot的交互。

Comments Accepted at the International Conference on Software Maintenance and Evolution (ICSME), 2026

2606.19167 2026-06-18 cs.SE 新提交 专题 85

Teaching Software Engineering with LLM and MCP Integration: From Classroom to Industry Practice

用LLM和MCP集成教学软件工程:从课堂到工业实践

Kehui Chen, Jacky Keung, Weining Li, Xiangbing Shao, Yishu Li, Xiaoxue Ma

专题命中 软件智能体 :将LLM和MCP集成到软件工程教学,提升编程和工具使用能力

AI总结 本研究将LLM和MCP集成到软件工程协作教学模式中,通过嵌入驱动工具到教学、代码辅助和工程模拟,弥合传统教学与工业流程的差距,提升学生编程、问题解决和智能工具使用能力。

Comments Aceept by International Symposium on Educational Technology (ISET) 2026

2411.19099 2026-06-18 cs.SE 版本更新 专题 85

Enhancing Software Maintenance: A Learning to Rank Approach for Co-changed Method Identification

增强软件维护:一种用于共变方法识别的学习排序方法

Yiping Jia, Safwat Hassan, Ying Zou

专题命中 软件智能体 :学习排序方法识别共变方法,辅助软件维护

AI总结 提出一种学习排序方法,结合源代码特征和变更历史,在拉取请求级别预测并排序共变方法,实验表明随机森林模型在NDCG@5上优于其他模型2.5-12.8%,并超过基线方法4.7-537.5%。

2606.19191 2026-06-18 cs.CR 新提交 专题 80

PhantomSkill: Malicious Code Injection in Agent Skill Ecosystems

PhantomSkill: 代理技能生态系统中的恶意代码注入

Yu-Ting Lin, Chia-Mu Yu

专题命中 软件智能体 :针对LLM编码代理的恶意代码注入攻击

AI总结 提出PhantomSkill攻击框架,通过VulMask技术将恶意行为隐藏在技能的辅助资源中,利用漏洞形状的实现绕过检测,在保持良性功能的同时降低警告和恶意软件检测率。

2602.04341 2026-06-18 cs.SE 专题 80

Model-Driven Legacy System Modernization at Scale

规模化遗留系统现代化的模型驱动方法

Tobias Böhm, Jens Guan Su Tien, Mohini Nonnenmann, Tom Schoonbaert, Bart Carpels, Andreas Biesdorf

专题命中 软件智能体 :模型驱动遗留系统现代化

AI总结 本文提出一种模型驱动的遗留系统现代化方法,通过在遗留代码库和现代目标平台之间插入富化中间模型,实现了核心UI组件和页面结构的半自动化迁移,提升了可维护性和开发者体验。

Comments Accepted for publication at the 1st Workshop on Code Translation, Transformation, and Modernization (ReCode'26), co-located with ICSE 2026

Journal ref Proc. ReCode '26, ACM, New York, NY, USA (2026) 13-18

2606.19121 2026-06-18 cs.SE cs.CL cs.HC 新提交 专题 75

Written by AI, Managed by AI: Semantic Space Control and Index Sickness Elimination Across 391 Consecutive Sessions

由AI编写,由AI管理:跨越391个连续会话的语义空间控制与索引病消除

Hui Zhang, Shuren Song

专题命中 软件智能体 :长期LLM协作中的索引病问题,涉及代码工程

AI总结 本文通过真实软件项目中的行动研究,发现长期LLM协作中增加形式约束反而导致“索引病”,提出“基线-日志物理分离”机制,有效消除该问题。

Comments 22 pages, 2 tables, 1 figure. Action research. Bilingual submission (Chinese companion version included as supplementary). Submitted to ICSE 2027 IOR track

2606.18855 2026-06-18 cs.SE 新提交 专题 70

Toward Semantically-Seeded, Graph-Propagated Impact Analysis Across Software Artifacts: A Vision

面向语义种子与图传播的跨软件制品影响分析:一个愿景

Momil Seedat

专题命中 软件智能体 :跨软件制品影响分析,融合语义与结构。

AI总结 提出一种无需训练、可解释的融合方法,结合语义相似性与结构依赖,通过异构制品图与传播机制覆盖两种方法的盲点,实现跨需求-配置-服务-测试链的影响分析。

2606.17510 2026-06-18 cs.SE cs.SY eess.SY 新提交 专题 70

OmniDroneX: An LLM-Assisted Holistic Drone-as-a-Service Ecosystem

OmniDroneX: 一种LLM辅助的全方位无人机即服务生态系统

I-Ling Yen, Akeem Mohammed, Farokh Bastani, San-Yih Hwang

专题命中 软件智能体 :LLM用于服务组合和代码生成

AI总结 提出OmniDroneX统一无人机即服务生态系统,通过libUAV接口和PT-SOA抽象模型连接底层物理与高层任务,利用大语言模型辅助功能识别、服务组合和自然语言任务定义,支持多种组合技术以实现可扩展、自演进的无人机系统。

Comments This manuscript is a full version of a paper accepted in shortened form by IEEE International Conference on Joint Cloud Computing