AI解释的相关内容 - 漫话开发者

2024-06-20 talkingdev

Logit Prisms：分解Transformer输出以提高解释性

Logit Lens方法已经得到了增强，该方法通过分解logit输出，帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流，注意力层和MLP层，揭示了这些部分如何影响预测，并为gemma-2b模型执行的诸如...

2024-01-22 talkingdev

本项目通过引入两个新版本：Smooth MPRT和Efficient MPRT，改进了模型参数随机化测试，这是eXplainable AI（XAI）中的关键工具。