arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.07622 2026-05-11 cs.CL

Is She Even Relevant? When BERT Ignores Explicit Gender Cues

Jonas Klein, Chiara Manna, Eva Vanmassenhove

AI总结本研究探讨了在荷兰语中，BERT模型如何以及在什么情况下会捕捉到性别信息，特别是针对具有显性形态性别标记和通用形式的语言。通过分析训练过程中的上下文嵌入，研究构建了动态的性别子空间，发现尽管性别信息在训练约20轮后变得线性可分，但模型在面对明确性别线索的短句模板时，仍难以更新其内部性别表征，表现出对男性默认的持续倾向。这一结果挑战了现有假设，表明模型在性别方向上的表征动态性不足，难以有效反映反刻板印象的性别线索。

详情

英文摘要

Gender bias in large language models has primarily been investigated for English, while languages with grammatical or morphological gender remain comparatively understudied. This paper investigates how and when gender information emerges in a Dutch BERT model trained from scratch, offering one of the first checkpoint-level analyses of bias formation in a Transformer architecture for a language combining overt morphological gender marking and generic forms. By extracting contextual embeddings throughout training, we construct dynamic gender subspaces using linear SVMs to trace when gender becomes linearly encoded and how this encoding evolves over time. Contextual embeddings are often assumed to integrate contextual cues robustly, allowing models to adjust the representation of a word depending on its more local usage. We therefore test whether explicit gender cues in controlled sentence templates (e.g., Zij is een loodgieter ('She is a plumber')) can override learned statistical associations (plumber -> male). Our findings challenge this assumption: although gender becomes clearly linearly separable around epoch 20 and is distributed across multiple embedding dimensions, the model struggles to update its internal gender representation in light of explicit contextual cues in short sentence templates. Stereotypical gender-profession pairings are predicted far more accurately than anti-stereotypical ones, and generic forms in Dutch systematically default to a male interpretation, even when the context explicitly denotes a female referent. Together, our results seem to indicate that contextualization in the representations learned by our Dutch BERT model is not sufficiently dynamic along the probed gender direction: explicit gender cues in anti-stereotypical contexts are not reliably reflected in the resulting representations, resulting in persistent male-default behaviour.

URL PDF HTML ☆

赞 0 踩 0

2605.07613 2026-05-11 cs.CL

Intent-Driven Semantic ID Generation for Grounded Conversational News Recommendation

Hongyang Su, Beibei Kong, Lei Cheng, Chengxiang Zhuo, Zang Li, Chenyun Yu

AI总结该研究针对对话式新闻推荐中如何结合用户隐含意图与实时新闻内容的问题，提出了一种基于意图驱动的语义ID生成方法（SID）。通过生成-匹配的范式，模型将用户意图映射为分层语义ID前缀，并在新闻库中进行模糊匹配，从而实现精准且有依据的推荐。该方法在主流中文新闻平台上的实验表明，其在避免幻觉和推荐匹配度方面表现优异，尤其在冷启动用户场景下显著优于现有方法。

Comments Accepted at ACL 2026 Industry Track (Oral)

2605.07606 2026-05-11 cs.CL cs.AI

Nürnberg NLP at PsyDefDetect: Multi-Axis Voter Ensembles for Psychological Defence Mechanism Classification

Philipp Steigerwald, Eric Rudolph, Jens Albrecht

AI总结该研究针对心理防御机制分类任务，解决其因表面语言相似而带来的分类模糊问题。研究提出了一种多轴投票集成方法，涵盖分类粒度、训练方式和基础模型三个正交维度，以提高分类鲁棒性。该方法在隐藏测试集上取得了0.420的F1分数，位列21支参赛队伍之首。

Comments Accepted at the BioNLP 2026 PsyDefDetect Shared Task @ ACL 2026 (1st place, 21 registered teams)

2605.07605 2026-05-11 cs.RO

BrickCraft: Visuomotor Skill Composition with Situated Manual Guidance for Long-Horizon Interlocking Brick Assembly

Jichuan Yu, Bowei Li, Zhenran Tang, Guanxing Lu, Chuxiong Hu, Ruixuan Liu, Changliu Liu

AI总结本文提出了一种名为BrickCraft的框架，用于实现长期视野下互锁积木的自主组装。该方法通过相对坐标系将复杂任务分解为可复用的基本操作技能，并结合实时视觉引导，将高层装配计划与物理执行有效衔接。实验表明，BrickCraft能够从少量示例中学习高效的装配技能，并具备对新结构的强泛化能力。

2605.07604 2026-05-11 cs.CV cs.AI

SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild

Xuyi Hu, Jin Lyu, Jiuming Liu, Yebin Liu, Silvia Zuffi, Liang An, Stefan Goetz

AI总结本文提出SAM 3D Animal，首个支持多动物三维重建的可提示框架，能够从单张野外图像中重建多个动物的三维模型。该方法基于SMAL+参数化动物模型，结合关键点和掩码提示，有效应对遮挡和密集场景下的重建挑战。此外，研究还引入了包含5000多张图像的Herd3D数据集，用于提升模型的泛化能力。实验表明，该方法在多个数据集上优于现有基于模型和无模型的方法，展示了其在野外动物三维重建中的高效性和可扩展性。

2605.07600 2026-05-11 cs.LG cs.AI cs.CL

Mathematical Reasoning via Intervention-Based Time-Series Causal Discovery Using LLMs as Concept Mastery Simulators

Tsuyoshi Okita

AI总结该研究提出了一种基于因果干预的框架CIKA，通过将大语言模型（LLM）作为概念掌握的模拟器，识别哪些数学概念对解题具有因果贡献。该方法通过设定概念状态为“掌握”并测量正确性变化，定义了干预能力探测（ICP）指标，从而区分模型是否能有效使用某概念而不仅仅是拥有相关知识。实验表明，CIKA在多个数学基准测试中表现出色，验证了其对问题解决能力的预测性及对知识激活的有效性。

Comments 17 pages, 0 figures

2605.07593 2026-05-11 cs.CV

TraceAV-Bench: Benchmarking Multi-Hop Trajectory Reasoning over Long Audio-Visual Videos

Hengyi Feng, Hao Liang, Mingrui Chen, Bohan Zeng, Meiyi Qiang, Zhengyang Zhao, Zimo Meng, Zeang Sheng, Wentao Zhang

AI总结 TraceAV-Bench 是首个用于评估长音频-视频轨迹上多跳推理和多模态幻觉鲁棒性的基准，旨在解决现有数据集在处理跨模态、长时间跨度的稀疏证据链时的不足。该基准包含578个长视频和2200个经过严格验证的多选问题，每个问题基于平均跨越15分钟、包含3.68个推理跳步的明确推理链。实验表明，当前主流的OmniLLMs在该基准上表现有限，揭示了长音频-视频内容理解中的重大挑战。

2605.07588 2026-05-11 cs.LG cs.AI stat.ML

Revisiting Transformer Layer Parameterization Through Causal Energy Minimization

Jin Xu, Camille Couturier, Victor Rühle, Saravan Rajmohan, James Hensman

AI总结本文提出了一种基于因果能量最小化（CEM）的框架，用于重新审视Transformer层的参数化设计。通过将Transformer层视为条件能量函数的优化步骤，CEM揭示了多头注意力和门控MLP等模块在能量视角下的参数化原理，并指出了包括权重共享、低秩交互和递归更新等在内的设计空间。实验表明，基于CEM设计的Transformer层在参数受限的情况下仍能稳定训练并达到与传统Transformer相当的性能，为理解与改进Transformer结构提供了新的视角。

2605.07584 2026-05-11 cs.AI

Parallel Lifted Planning via Semi-Naive Datalog Evaluation

Dominik Drexler, Oliver Joergensen, Jendrik Seipp

AI总结该论文研究了如何通过半天真Datalog评估提升提升式经典规划的效率，提出了一个具有规则级和求地级双重并行性的执行模型。研究设计了一种基于团枚举的求地器，并扩展支持半天真Datalog评估，实验表明该方法在单核上已优于现有基线，且随着核心数增加性能优势更加明显，尤其在难以求地的任务中展现出高达92.4%的并行比例和6倍的加速效果。

2605.07577 2026-05-11 cs.LG

Bilevel Graph Structure Learning, Revisited: Inner-Channel Origins of the Reported Gain

Minkyoung Kim, Beakcheol Jang

AI总结本文重新审视了双层图结构学习的性能提升来源，发现其增益主要源于内层训练过程中的动态效应，而非图结构重 wiring 本身。为此，作者提出 frozen-ϕ 方法，将双层增益分解为隐含梯度正则化的内层训练通道和图结构重 wiring 通道。实验表明，在时空流量预测任务中，内层通道的性能可达到甚至超过完整双层流程的 78-101%，而在节点分类任务中也占 37-44%。研究还提出了标准化诊断方法 frozen-ϕ 和图蒸馏技术，为双层图结构学习提供了新的分析框架和评估手段。

2605.07572 2026-05-11 cs.AI stat.ML

Open-Ended Task Discovery via Bayesian Optimization

Masaki Adachi, Yuta Suzuki, Juliusz Ziomek

AI总结本文提出了一种名为Generate-Select-Refine（GSR）的开放任务发现框架，通过交替生成任务和优化任务，解决科学工作流中任务本身不确定的问题。该方法从用户提供的初始任务出发，逐步生成并优化新任务，最终将评估集中于最优任务，仅产生对单任务贝叶斯优化的对数遗憾开销。实验表明，GSR在新产品开发、化学合成放大、算法分析和专利再利用等任务中优于现有的基于大语言模型的优化器。

Comments 60 pages, 11 figures

2605.07568 2026-05-11 cs.CV cs.CL

Tracing the Arrow of Time: Diagnosing Temporal Information Flow in Video-LLMs

Peitao Han, Fei Cheng, Lis K. Pereira, Qianying Liu, Shigeru Kitazawa

AI总结本文研究了视频大语言模型（Video-LLMs）在时间信息流方面的缺陷，通过追踪视觉编码器、投影器和语言模型之间的信息传递，发现基于帧的编码器难以捕捉时间特征，而基于视频的编码器虽能编码强时间信号，但在经过标准投影器后性能下降明显。研究进一步表明，投影器设计对时间信息传递至关重要，采用时间感知的投影方法可显著提升模型性能，并通过引入时间感知编码器和AoT监督，最终构建出超越人类水平的视频大语言模型。

2605.07565 2026-05-11 cs.LG cs.AI stat.ML

Ensemble Distributionally Robust Bayesian Optimisation

Tigran Ramazyan, Denis Derkach

AI总结本文研究了在上下文分布不确定条件下的零阶优化问题，提出了一个基于集成的分布鲁棒贝叶斯优化算法。该方法通过使用集成模型作为替代模型，增强了对复杂和噪声数据的鲁棒性，并在保持计算可行性的同时处理连续上下文。理论分析表明该算法具有次线性遗憾界，优于现有先进方法，实验结果也验证了其理论保证的有效性。

2605.07562 2026-05-11 cs.CV

Beyond GSD-as-Token: Continuous Scale Conditioning for Remote Sensing VLMs

Song Zhang, Yanlong Chen, Yilin Li, Yining Chen, Zili Yi, Xiaowei Zhang, Yawei Li

AI总结遥感视觉-语言模型（RS-VLMs）在面对不同地面采样距离（GSD）带来的视觉差异时，存在与自然图像模型的根本性不匹配问题。本文提出ScaleEarth，一种基于Qwen3-VL的参数高效微调框架，将GSD作为连续条件变量，通过CS-HLoRA动态调整模型计算路径，从而适应不同尺度的遥感图像。此外，该方法结合SSE-U模块从视觉特征中预测GSD及其不确定性，并构建了GeoScale-VQA数据集，实现了方法与数据的闭环训练，显著提升了模型在多任务遥感基准上的性能。

Comments Under review. 30 pages, 16 figures, 7 tables

2605.07561 2026-05-11 cs.CV

Multimodal Stepwise Clinically-Guided Attention Learning for Pathological Complete Response Prediction in Breast Cancer

Alice Natalina Caragliano, Valerio Guarrasi, Michela Gravina, Carlo Sansone, Paolo Soda

AI总结该研究提出了一种基于多模态逐步临床引导注意力学习的框架，用于乳腺癌新辅助治疗后病理完全缓解（pCR）的预测。该方法通过医学指导的空间注意力机制和多模态信息融合，解决了数据类别不平衡和跨临床环境泛化能力差的问题。模型采用分步训练策略，先学习全局影像特征，再聚焦肿瘤区域，最后结合临床变量优化决策，显著提升了预测灵敏度并保持较高特异性，同时生成具有解剖一致性的注意力图，有助于模型结果的临床解释。

2605.07556 2026-05-11 cs.CV

Dynamic Mode Decomposition along Depth in Vision Transformers

Nishant Suresh Aswani, Saif Eddin Jabari

AI总结本文研究了视觉Transformer（ViT）中深度方向上的动态模式分解（DMD）特性，探讨ViT块是否能近似为自主线性动力系统。通过DMD方法从连续隐藏状态中拟合线性算子$K$，并在四个预训练的DINO ViT模型上验证其稳定性与准确性。研究发现，对于较短的深度跨度，$K^p$能够较好地预测后续状态并恢复中间激活，但这种局部线性特性在下游任务中并未表现出优势。

2605.07554 2026-05-11 cs.LG cs.AI q-bio.BM stat.ML

ProteinJEPA: Latent prediction complements protein language models

Dan Ofer, Dafna Shahaf, Michal Linial

AI总结本文研究了在蛋白质语言模型中引入潜在空间预测（JEPA）是否能提升模型性能，并在相同训练时间预算下与传统的掩码语言建模（MLM）进行对比。研究发现，在预训练和从头训练的蛋白质序列编码器中，仅在掩码位置进行潜在预测并保留MLM交叉熵损失的方法（称为masked-position MLM+JEPA）表现最佳，显著优于仅使用MLM或仅使用JEPA的方法。该方法在多个下游任务中取得了更好的性能，包括蛋白质稳定性预测、酶分类和结构检索等。

2605.07551 2026-05-11 cs.LG

Disagreement-Regularized Importance Sampling for Adversarial Label Corruption

Csongor Horváth, Ida-Maria Sintorn, Prashant Singh

AI总结本文研究了在对抗性标签污染环境下重要性采样（IS）方法的失效问题，提出了一种基于损失排名分歧的正则化重要性采样方法（DR-IS）。该方法通过引入独立代理集成模型，利用样本间损失排名的不一致性来筛选数据，有效抑制了高范数对抗样本的影响。理论分析表明，DR-IS 在有限样本下具有严格的浓度界，能够保证污染样本与干净样本的分离，并在多个基准数据集上表现出对高范数攻击的鲁棒性。

2605.07550 2026-05-11 cs.CV

Mind the Gap: Geometrically Accurate Generative Reconstruction from Disjoint Views

Grzegorz Wilczynski, Mikołaj Zielinski, Bartosz Świrta, Dominik Belter, Przemysław Spurek

AI总结本文提出了一种从非重叠视角进行几何精确生成重建的新范式，旨在解决传统3D视觉系统对视角重叠的依赖问题。针对分布式机器人或众包数据采集等实际场景中难以获取重叠视角的挑战，作者引入了GLADOS框架，通过生成中间视角、鲁棒粗重建和迭代优化三个阶段，实现了在无重叠情况下的高质量几何重建。该方法为未来生成、重建和补全技术的结合提供了通用且模块化的解决方案。

2605.07549 2026-05-11 cs.CV cs.LG

Probabilistic Object Detection with Conformal Prediction

Christopher Ries, Moussa Kassem Sbeyti, Nicolas Bianco, Nadja Klein

AI总结该论文研究了如何在目标检测任务中利用概率方法进行可靠的不确定性量化，提出了一种基于符合预测（Conformal Prediction, CP）的改进方法。针对目标检测的结构化多输出特性，作者将CP应用于边界框的坐标，并结合Bonferroni校正以保证整体置信度。通过引入基于概率目标检测模型的不确定性估计对预测区间进行缩放，并结合分类预测结果进行条件化处理，显著提升了预测区间的精确度和实用性。实验表明，该方法在多个自动驾驶数据集上有效提高了检测的置信区间质量，同时保持了覆盖率。

Comments Code is available at https://github.com/mos-ks/OD-CP

详情

英文摘要

Conformal Prediction (CP) is a distribution-free method for constructing prediction sets with marginal finite-sample coverage guarantees, making it a suitable framework for reliable uncertainty quantification in safety-critical object detection. However, object detection introduces structured multi-output predictions, complicating the application of classical CP theory developed for single outputs. In addition, standard, unscaled CP produces fixed-width prediction intervals across inputs, leading to unnecessary width for low-uncertainty predictions. While scaled CP addresses this by adapting the interval width to an input-dependent uncertainty estimate, prior work has neither systematically compared unscaled and scaled CP for multi-class object detection, nor integrated CP with a complementary uncertainty quantification method in this setting. We fill this gap by: (i) applying CP coordinate-wise to bounding box corners with a Bonferroni correction for box-level guarantees; (ii) scaling the resulting intervals using per-prediction aleatoric uncertainty estimates derived from a probabilistic object detector trained with loss attenuation, evaluated in uncalibrated and two calibrated variants; (iii) extending to a two-step pipeline that constructs prediction sets for the class using RAPS and conditions the conformalized bounding boxes on the predicted class set. Across three autonomous driving datasets (KITTI, BDD, CODA), including a cross-domain setting under distribution shift, scaled CP consistently improves interval sharpness over unscaled CP, achieving up to 19% higher IoU and 39% lower interval scores, without sacrificing coverage. Class-wise calibration further improves coverage for both variants with a negligible effect on sharpness. Together, these improvements yield more actionable uncertainty estimates for real-time, real-world object detection.

URL PDF HTML ☆

赞 0 踩 0

2605.07546 2026-05-11 cs.LG

On the Invariance and Generality of Neural Scaling Laws

Xing Han, Ziyin Liu, Suchi Saria, Paul Pu Liang

AI总结本文研究了神经网络规模定律的不变性与通用性，探讨如何在不同领域之间迁移这些定律以减少计算资源消耗。作者提出通过识别数据变换对规模定律的影响，发现其在信息保持变换下具有不变性，在信息分辨率降低的变换下则有可预测的变化规律。研究验证了该理论在语言、视觉和语音任务中的适用性，并展示了其在跨领域预测和噪声影响分析中的实际应用价值。

Comments 23 pages, 6 figures, 11 tables

2605.07545 2026-05-11 cs.CV cs.AI

Implicit Preference Alignment for Human Image Animation

Yuanzhi Wang, Xuhua Ren, Jiaxiang Cheng, Bing Ma, Kai Yu, Tianxiang Zheng, Qinglin Lu, Zhen Cui

AI总结本文研究如何通过隐式偏好对齐（IPA）提升人类图像动画中手部动作的生成质量。该方法无需构建严格的偏好对数据，通过最大化自生成高质量样本的概率并惩罚与预训练先验的偏离，实现模型对齐。同时引入手部感知的局部优化机制，专注于提升手部区域的生成效果，有效降低了偏好数据构建的难度，并在实验中验证了其优越性。

Comments Accepted by ICML 2026

2605.07537 2026-05-11 cs.AI

Multi-Environment POMDPs with Finite-Horizon Objectives

Léonard Brice, Filip Cano, Krishnendu Chatterjee, Thomas A. Henzinger, Stefanie Muroya

AI总结本文研究了在多环境部分可观察马尔可夫决策过程（MEPOMDP）中，具有有限时间目标的最优值和策略计算问题。该问题在传统POMDP中已被证明是PSPACE完全的，作者进一步证明其在更一般的MEPOMDP设置下同样具有PSPACE完全性。为此，作者提出了一种实用的算法，并在经典基准测试中验证了其有效性，显著优于之前已知的唯一算法。

2605.07533 2026-05-11 cs.CL

Why do Large Language Models Fail in Low-resource Translation? Unraveling the Token Dynamics of Large Language Models for Machine Translation

Shenbin Qian, Yves Scherrer

AI总结本文系统分析了大语言模型（LLMs）在低资源语言翻译任务中的失败模式，发现非英语中心的语言对翻译质量显著低于英语中心对。研究引入了“词元激活率”（TAR）指标，用于衡量模型在生成过程中对语言特有词元的利用效率，并验证了TAR与翻译性能之间的强相关性。此外，研究还发现推理型大语言模型在翻译低TAR语言时倾向于生成更多词元，但其对翻译质量的影响因模型而异。

Comments Accepted to the 26th Annual Conference of the European Association for Machine Translation (EAMT2026)

2605.07531 2026-05-11 cs.LG math.OC

SGD for Variational Inference: Tackling Unbounded Variance via Preconditioning and Dynamic Batching

Hippolyte Labarrière, Cesare Molinari, Silvia Villa, Lorenzo Rosasco

AI总结本文研究了黑盒变分推断（BBVI）中使用随机梯度下降（SGD）时面临的大方差问题，并提出通过预处理和动态批处理来解决这一问题。针对椭圆位置-尺度族参数化分布，作者首次证明了ELBO解的存在性，并建立了在Blum-Gladyshev条件下的 minibatch 投影SGD的收敛性保证。理论分析表明，结合动态批处理与预处理能够有效提升算法在复杂场景下的稳定性与收敛性。

2605.07530 2026-05-11 cs.RO cs.SE

Search-based Robustness Testing of Laptop Refurbishing Robotic Software

Erblin Isaku, Hassan Sartaj, Shaukat Ali, Malaika Din Hashmi, Francois Picard

AI总结本文研究了用于笔记本电脑翻新机器人的软件鲁棒性测试问题，重点在于检测用于物体识别的模型在面对微小输入变化时的失效情况。提出了一种基于搜索的鲁棒性测试方法 PROBE，利用多目标优化算法 NSGA-II 系统探索扰动空间，以发现能够引发模型失效的最小局部扰动。实验表明，PROBE 在生成失效扰动方面比随机搜索更高效，且扰动幅度更小，同时具有跨模型迁移能力，为提升翻新机器人软件的可靠性提供了有效手段。

Comments 15 pages, 4 figures, 5 tables

2605.07522 2026-05-11 cs.CL

WeatherSyn: An Instruction Tuning MLLM For Weather Forecasting Report Generation

Zinan Zheng, Yang Liu, Nuo Chen, Juepeng Zheng, Hong Cheng, Jia Li

AI总结本文提出了一种名为WeatherSyn的指令微调多模态大语言模型，专门用于生成天气预报报告。研究构建了首个用于该任务的指令微调数据集，涵盖美国31个城市和8个天气方面，并基于该数据集开发了首个专门生成天气预报报告的模型。实验表明，该模型在多个指标上优于领先的闭源模型，尤其在结构复杂的天气内容上表现突出，并展现出良好的跨地区泛化能力。

Comments ICML 2026

2605.07520 2026-05-11 cs.AI

Model-Driven Policy Optimization in Differentiable Simulators via Stochastic Exploration

Yuval Aroosh, Ayal Taitler

AI总结本文提出了一种名为Model-Driven Policy Optimization (MDPO)的框架，用于在可微分仿真器中进行策略优化，通过在动作空间中注入噪声引入随机探索，以应对高度非线性及离散-连续混合系统中优化景观不佳的问题。该方法利用系统模型动态调整噪声幅度，根据梯度推导的轨迹目标灵敏度生成时间依赖的探索策略，从而更有效地探索目标空间并逃离局部最优解。实验表明，MDPO在多个基准任务中优于确定性方法及模型无关的强化学习基线，显著提升了复杂非线性环境下的解的质量。

2605.07378 2026-05-11 cs.LG

Zero-Shot Neural Network Evaluation with Sample-Wise Activation Patterns

Yameng Peng, Andy Song, HaythamM. Fayek, Vic Ciesielski, Xiaojun Chang

AI总结该论文提出了一种名为SWAP-Score的零样本神经网络评估指标，用于在无需训练的情况下高效评估神经网络的性能。该方法通过分析样本级别的激活模式，衡量网络的表达能力，并在多种任务和架构（包括CNN和Transformer）上展现出强相关性和广泛适用性。实验表明，SWAP-Score在多个基准任务中优于现有零样本指标，且适用于预训练阶段的语言模型性能估计，显著提升了神经网络架构搜索的效率。

Comments Accepted by IEEE Transactions on Pattern Analysis and Machine Intelligence. This article is a journal extension of arXiv:2403.04161

2605.06610 2026-05-11 cs.LG cs.CV

SoftSAE: Dynamic Top-K Selection for Adaptive Sparse Autoencoders

Jakub Stępień, Marcin Mazur, Jacek Tabor, Przemysław Spurek

AI总结稀疏自编码器（SAEs）在机制可解释性研究中发挥着重要作用，尤其在分析大型语言模型和视觉变换器的内部表示方面。然而，传统的Top-K SAEs采用固定稀疏度，无法适应不同输入的复杂性变化，可能导致简单输入引入噪声或复杂输入遗漏关键信息。为此，本文提出SoftSAE，通过可微分的Soft Top-K操作实现动态稀疏度选择，使模型能够根据输入复杂度自动调整激活特征数量，从而更准确地反映数据结构和信息量。实验表明，SoftSAE不仅能提取有意义的特征，还能为每个概念选择合适的特征数量。