漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-03 talkingdev

Bun 1.1发布:全面升级JavaScript和TypeScript开发体验

Bun 1.1是一款集成了运行、构建、测试和调试JavaScript与TypeScript功能的全能工具包。此次更新包括了数千个错误修复、大量新特性和API的添加,以及对Windows系统的支持。文章详细介绍了Bun 1.1版本的变更内容。Bun...

Read More
2024-04-02 talkingdev

OpenUI-实现文本编辑到React、Svelte等界面的渲染

Wandb近日发布了一款名为OpenUI的创新工具包,该工具包允许用户通过文本描述来定义用户界面,并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑,简化了UI设计与开发的流程。...

Read More
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
2024-03-22 talkingdev

Meta推出Torchtune库,助力PyTorch语言模型微调

Meta公司近日发布了一个名为Torchtune的原生PyTorch库,专门用于精细调整语言模型。该库旨在为开发者提供更为便捷的工具,以便在PyTorch框架中进行语言模型的微调工作。通过Torchtune,开发者可以更容易地实现模型性...

Read More
2024-03-21 talkingdev

GritQL:用声明式查询语言革新源代码搜索与修改

GritQL是一个用于搜索和修改源代码的声明式查询语言,它利用Rust语言和查询优化技术,能够扩展至超过1000万行代码的庞大代码库。GritQL内置模块系统包含超过200种标准模式,支持对多种目标语言进行重写,包括JavaScr...

Read More
2024-03-20 talkingdev

LlamaGym:在线强化学习优化大模型Agent

近日,GitHub上出现了一个新的项目LlamaGym,该项目专注于通过在线强化学习方法对大型语言模型(LLM)代理进行微调。大型语言模型在近年来取得了显著的进展,但如何进一步提升其性能,尤其是在特定任务上的表现,成...

Read More
2023-11-07 talkingdev

Giskard:LLM和ML模型的开源测试框架

Giskard是一个Python库,可以自动检测从表格模型到LLM的AI模型的漏洞,包括:性能偏见、数据泄露、虚假相关性、幻觉、毒性、安全问题等等。让您的模型快速、安全地投入生产。在GitHub上安装Giskard或在Colab中尝试。

Read More
  1. Prev Page