神经网络的相关内容 - 漫话开发者

2024-01-15 talkingdev

斯坦福Monarch-32k检索模型发布，比闭源嵌入式模型表现更佳

Together Compute一直在探索不同的Transformer替代方案。最近，他们发布了一款检索模型，该模型的表现优于许多闭源嵌入式模型，适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型，可...

2024-01-11 talkingdev

Mixtral论文已经发布。该论文没有讨论预训练数据集。大部分的内容都是众所周知的，但是在专家路由评估的讨论中有一个有趣的新见解。

2024-01-10 talkingdev

扩散模型是一种强大的工具，可以将强化学习性能提升至新的高度。最近，一位研究团队建立了一个GitHub仓库，详细介绍了扩散模型在强化学习中的应用，并展望了未来的跨学科研究机会。扩散模型是一种模拟物质传播的方法...

2024-01-10 talkingdev

本项目介绍了开放项目SAM，这是一个结合了CLIP和SAM模型的框架，用于提高图像分割和识别的能力。CLIP模型是一种基于对比学习的神经网络模型，用于学习图像和文字之间的关系，而SAM模型则是一种序列建模方法，用于对...

2024-01-10 talkingdev

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5（即使它可能是3倍大小）。有关模型训练，令牌计数，模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器，它使用自...

2024-01-02 talkingdev

这门关于大型语言模型的课程涵盖了数学、Python和神经网络的基本知识。它的重点是教授学生如何使用最新技术构建和部署最佳的LLMs。该存储库包含与LLMs相关的笔记本和文章列表以及进一步学习的资源。

2023-12-21 talkingdev

本研究提出了一种深度学习方法，利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸，可实现高精度检测。深度伪造技术已成为一种严重的威胁，对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

2023-12-20 talkingdev

研究人员开发了一种名为DSF的新方法，以改进谱图神经网络。通过引入节点特定的过滤器权重，DSF可以更好地处理像万维网这样的复杂网络。谱图神经网络（SGNN）是一种基于图的深度学习方法，它在节点分类、图分类和节点...