AI 大模型
代码大模型 / AI 编程
代码生成、软件工程智能体、程序修复、测试生成和开发者工具。
1. 代码生成 4 篇
Benchmarking Local LLMs for Natural-Language-to-SQL Querying in Biopharmaceutical Manufacturing: An Empirical Benchmark on Consumer-Grade Hardware
在生物制药制造中本地LLM的自然语言到SQL查询基准测试:消费级硬件上的实证基准
专题命中 代码生成 :评估本地LLM在生物制药制造中的NL2SQL性能。
AI总结 本研究评估了四种本地部署的开源大语言模型在生物制药制造数据库上的自然语言到SQL生成性能,发现代码调优的通用模型优于领域特定模型,但当前性能仍需人工监督。
GoldenFloat: A Phi-Derived Static-Split Floating-Point Family from GF4 to GF256 with a Lucas-Exact Integer Identity
GoldenFloat: 从GF4到GF256的基于Phi的静态拆分浮点系列及其Lucas精确整数恒等式
专题命中 代码生成 :提出GoldenFloat浮点系列RTL生成器。
AI总结 提出一种由单一闭式规则生成的静态拆分浮点系列GoldenFloat,并给出多宽度RTL生成器、Lucas精确累加器路径和FPGA编解码器三个具体实现。
Comments 20 pages, single-file LaTeX, ASCII source. v2: peer-anchor updates. Adds Sarnoff P3109 (arXiv:2606.04028), AMD MXFP4 silicon (arXiv:2605.09825), NVIDIA GB10 NVFP4 measurement, companion catalog (arXiv:2606.09686), MixFP4 (arXiv:2605.31035). FL-002 expanded: (c1) GF256 bias, (c2) count drift, (g) static-split vs micro-mixing. TTSKY26a regeneration timeline added. No mathematical claims revised
2. 代码评测 1 篇
Can Large Language Models Reason About Complex Execution Paths? An Empirical Study on Python
大型语言模型能否推理复杂执行路径?基于Python的实证研究
专题命中 代码评测 :实证研究LLM在Python执行路径推理中的能力。
AI总结 本文实证研究大型语言模型在Python执行路径推理中的可行性,构建测试用例生成和缺陷分类任务,发现LLM能提升路径覆盖率,但强推理模型不一定优于弱模型。
Comments Accepted by ACM Transactions on Software Engineering and Methodology (TOSEM)
3. 软件智能体 1 篇
SAGE: Semantic-Aware Gray-Box Game Regression Testing with Large Language Models
SAGE: 基于语义的灰盒游戏回归测试与大型语言模型
专题命中 软件智能体 :利用LLM引导强化学习自动生成游戏测试套件。
AI总结 提出SAGE框架,利用LLM引导强化学习自动生成测试套件,通过语义多目标优化精简测试,并基于更新日志语义分析优先排序,在Overcooked Plus和Minecraft中实现高效回归测试。
Comments This paper has been accepted by Automated Software Engineering journal
4. 程序修复 1 篇
Triosecuris: Formally Verified Protection Against Speculative Control-Flow Hijacking
Triosecuris:针对推测控制流劫持的形式化验证防御
专题命中 程序修复 :形式化验证防御推测控制流劫持
AI总结 提出Triosecuris,结合CET风格硬件辅助控制流完整性与编译器插入的推测加载硬化,通过形式化证明实现相对安全性,确保任意程序在推测执行下不泄露比源程序无推测时更多的信息。
Comments To appear at CSF'26; extended version with appendices. W.r.t. first revision: extended with concrete protection against Spectre RSB and renamed to Triosecuris
Journal ref 39th IEEE Computer Security Foundations Symposium (CSF) (2026) 544-559