漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-19 talkingdev

NeuralFlow开源-神经流中间层输出的可视化

NeuralFlow神经流是一个Python脚本,用于绘制Mistral 7B的中间层输出。它产生一个512 x 256的图像,表示模型的每一层的输出。

Read More
2024-02-14 talkingdev

SGLang:针对LLM设计的结构生成语言

SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法,使用户能够更好地控制生成的文本。此外,它还提供了一些实用工具,如生成...

Read More
2024-02-01 talkingdev

Lilac Garden快速聚类技术:将语言模型训练效率提高100倍

在训练语言模型时,一个挑战是为任务找到足够多样化的数据集。更难的是,将这些数据可视化。这个很酷的工具使用快速聚类和主题建模,使得可以探索数据,以改善过滤和整体质量。

Read More
2024-01-29 talkingdev

DittoGym:学习控制柔性变形机器人技术

柔性机器人由于其大量的控制空间而具有挑战性。这项工作引入了一个模拟器,其中包含用于操作柔性“Ditto”对象的各种任务。它包含实用程序、可视化和一些强大的基准。

Read More
2024-01-22 talkingdev

AI诚信之路

近期研究表明,控制人工智能诚信的方法包括识别和操作人工智能内部的诚信相关向量,或者通过与问题无关的问题来检测基于人工智能响应一致性的撒谎倾向。

Read More
2024-01-09 talkingdev

OpenInterpreter获得OS模式

OpenInterpreter是一个优秀的项目,它模拟了OpenAI的解释器。现在,它还拥有一个OS模式和一个可视化模式,因此它可以通过点击按钮和查看屏幕来使用语言模型控制您的计算机。

Read More
2024-01-09 talkingdev

Webassembly:将计算系统分割成基本抽象边界

Webassembly 是一种基本的抽象边界,将计算系统分割成片段。它提供了一种可以在 Web 浏览器中运行本机代码的方法,而无需使用插件和额外的安装。Webassembly 可以使开发者更轻松地编写高性能的 Web 应用程序,同时减...

Read More
2023-12-19 talkingdev

苹果开源防止熵崩溃的稳定训练方法

Transformer模型虽然强大,但是由于其不稳定性,训练起来常常会很困难。其中一个主要的问题是注意力矩阵的熵崩溃。本文介绍了一种通过简单的重新参数化来防止熵崩溃的方法。

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page