N-Version Programming with Coding Agents
使用编码代理的N版本编程
专题命中 代码生成 :使用编码代理生成实现,评估多样性对故障模式的影响。
AI总结 本文在当代AI编码代理背景下重新审视N版本编程,通过Knight-Leveson实验评估代理系统、模型和实现语言的多样性对故障模式的影响,发现常见模式故障,但多数投票三版本单元显著降低故障数,证明该策略的工程实用性。
AI 大模型
代码生成、软件工程智能体、程序修复、测试生成和开发者工具。
使用编码代理的N版本编程
专题命中 代码生成 :使用编码代理生成实现,评估多样性对故障模式的影响。
AI总结 本文在当代AI编码代理背景下重新审视N版本编程,通过Knight-Leveson实验评估代理系统、模型和实现语言的多样性对故障模式的影响,发现常见模式故障,但多数投票三版本单元显著降低故障数,证明该策略的工程实用性。
基于大语言模型的仓库级Solidity代码生成:从提示到微调
专题命中 代码生成 :评估LLM在Solidity代码生成中的表现
AI总结 提出SolidityBench基准和SolidityScore指标,评估多种LLM方法在仓库级Solidity代码生成中的表现,发现监督微调最有效。
Comments 33 pages
可解释且可验证的硬件生成:基于LLM驱动的逐步细化
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Fudan University(复旦大学) ; USA(美国)
专题命中 代码生成 :利用LLM生成RTL硬件代码,结合形式化方法。
AI总结 提出结合LLM创造力与形式化方法可解释性的硬件生成框架,通过迭代应用变换规则将设计规范转换为正确性有保证的RTL程序。
LLM在硬件设计的RTL编码中如何失败与泛化?
发表机构 * NVIDIA Research(英伟达研究院)
专题命中 代码生成 :分析LLM在RTL编码中的失败与泛化
AI总结 提出基于问题可解性的错误分类法,揭示LLM在RTL编码中受限于预训练知识,对齐技术仅教会编译,而推理能力才是关键瓶颈。
Comments Preview, under submission for EMNLP 2026
FM-Agent: 通过基于LLM的Hoare风格推理将形式化方法扩展到大型系统
发表机构 * Institute of Parallel and Distributed Systems, Shanghai Jiao Tong University(并行与分布式系统研究所,上海交通大学)
专题命中 代码生成 :LLM自动生成函数规范实现形式化推理
AI总结 提出FM-Agent框架,利用LLM自动生成函数级规范,实现大型系统的组合式推理,在143k行代码的系统中2天内发现522个新bug。
AutoPass:基于证据的LLM智能体用于编译器性能调优
发表机构 * Shaanxi Normal University(陕西师范大学) ; Northwest University(西北大学) ; University of Leeds(利兹大学)
专题命中 代码生成 :LLM生成编译选项优化代码性能
AI总结 提出AutoPass多智能体框架,通过查询编译器内部状态和中间表示,利用运行时反馈迭代优化编译选项,无需训练即可提升性能,在x86-64和ARM64上分别实现1.043倍和1.117倍加速。
CoRaCommit: 一种基于范例检索的提交消息生成的 VS Code 扩展
专题命中 代码生成 :VS Code扩展,利用检索范例生成提交消息。
AI总结 提出 CoRaCommit VS Code 扩展,通过检索相似提交范例作为提示上下文、并行调用多个大语言模型生成候选消息并基于用户反馈动态推荐,在 ApacheCM 数据集上优于现有扩展。
Comments 17 pages, 6 images, 3 tables, Manuscript submitted to a Journal (2026)
MoCA-Agent: 一种用于金融和数值推理的声明市场代码智能体
发表机构 * University of Innsbruck(因斯布鲁克大学) ; University of British Columbia(不列颠哥伦比亚大学) ; Toronto Metropolitan University(多伦多都会大学)
专题命中 代码生成 :系统生成可执行Python程序解决表格问答
AI总结 提出MoCA-Agent,通过声明级验证和代码生成解决金融表格问答中的数值推理错误,在十个基准上取得强性能。
PCBSchemaGen: 奖励引导的LLM代码合成用于印刷电路板(PCB)原理图设计及结构化验证
发表机构 * Semiconductor Power Electronics Center (SPEC)(半导体功率电子中心) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Arizona State University(亚利桑那州立大学)
专题命中 代码生成 :LLM生成PCB原理图代码合成
AI总结 提出PCBSchemaGen框架,通过结构化验证器引导冻结的LLM生成可修复的PCB原理图,在无单元测试的领域实现高准确率。
使用大语言模型进行Qiskit代码迁移
专题命中 代码生成 :LLM+RAG自动迁移Qiskit代码。
AI总结 针对量子软件开发套件版本演进导致的代码维护问题,提出结合大语言模型与检索增强生成(RAG)的混合方法,利用自动生成的迁移场景分类体系引导模型,实现Qiskit代码跨版本自动迁移,有效减少幻觉并提升迁移建议质量。
LLM辅助后量子密码开发中的安全编码漂移:一种游戏化修复方案
发表机构 * University of Moratuwa(摩图瓦大学) ; University of Ruhuna(鲁胡纳大学) ; RMIT University(皇家墨尔本理工大学)
专题命中 代码生成 :研究LLM辅助后量子密码开发中的安全编码漂移。
AI总结 提出LLM辅助PQC开发中的安全编码漂移模型,通过游戏化框架将LLM转变为主动安全协作者,以缓解长期依赖LLM导致的安全退化。
Comments Accepted for 2026 SIGIR Workshop on Vulnerabilities in Generative Systems for Information Retrieval track
在生物制药制造中本地LLM的自然语言到SQL查询基准测试:消费级硬件上的实证基准
发表机构 * Department of Computer Science, University of the Cumberlands(大学的计算机科学系) ; Department of Computer Science, DePaul University(德保罗大学计算机科学系) ; Youngstown State University(亚当斯州立大学)
专题命中 代码生成 :评估本地LLM在生物制药制造中的NL2SQL性能。
AI总结 本研究评估了四种本地部署的开源大语言模型在生物制药制造数据库上的自然语言到SQL生成性能,发现代码调优的通用模型优于领域特定模型,但当前性能仍需人工监督。
提示质量与拉取请求结果:基于阶段的LLM辅助开发实证研究
专题命中 代码生成 :研究提示质量对LLM辅助代码生成和PR结果的影响。
AI总结 通过分析265个开发者与ChatGPT的交互,研究提示结构(上下文、具体性、验证)对LLM辅助开发中代码生成、采纳和集成深度的影响,发现不同维度在不同阶段有不同作用。
Comments 48 pages, 2 figures
基于源数据的文本到JSON学习数据生成
发表机构 * Seoul National University(首尔大学)
专题命中 代码生成 :文本到JSON数据生成
AI总结 提出STAGE方法,利用电子表格作为源数据,通过LLM生成报告和JSON模式,并验证真实值,显著提升文本到JSON任务的训练数据质量。
Comments Preprint
趣味性具身机器人学习
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Impossible Research
专题命中 代码生成 :机器人编码智能体生成可执行代码策略。
AI总结 提出RATs框架,让机器人通过自主探索学习可复用技能,在LIBERO-PRO和MolmoSpaces上分别提升20.6和17.0个百分点。
Comments Project page: https://playful-rats.github.io/
GoldenFloat: 从GF4到GF256的基于Phi的静态拆分浮点系列及其Lucas精确整数恒等式
专题命中 代码生成 :提出GoldenFloat浮点系列RTL生成器。
AI总结 提出一种由单一闭式规则生成的静态拆分浮点系列GoldenFloat,并给出多宽度RTL生成器、Lucas精确累加器路径和FPGA编解码器三个具体实现。
Comments 20 pages, single-file LaTeX, ASCII source. v2: peer-anchor updates. Adds Sarnoff P3109 (arXiv:2606.04028), AMD MXFP4 silicon (arXiv:2605.09825), NVIDIA GB10 NVFP4 measurement, companion catalog (arXiv:2606.09686), MixFP4 (arXiv:2605.31035). FL-002 expanded: (c1) GF256 bias, (c2) count drift, (g) static-split vs micro-mixing. TTSKY26a regeneration timeline added. No mathematical claims revised