漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-20 talkingdev

Logit Prisms:分解Transformer输出以提高解释性

Logit Lens方法已经得到了增强,该方法通过分解logit输出,帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流,注意力层和MLP层,揭示了这些部分如何影响预测,并为gemma-2b模型执行的诸如...

Read More
2024-01-22 talkingdev

如何提高AI解释的可信度

本项目通过引入两个新版本:Smooth MPRT和Efficient MPRT,改进了模型参数随机化测试,这是eXplainable AI(XAI)中的关键工具。

Read More