HuggingFace团队最近展示了如何为语言模型的预训练阶段生成、筛选、合成和扩展大量的合成数据。这一过程不仅涉及数据的生成,还包括对数据进行精心的筛选和过滤,以确保其在模型训练中的有效性和准确性。通过这种方...
Read More一款名为SWE-agent的开源软件代理在软件工程(SWE)基准测试中取得了12%的成功率,覆盖率达到100%。该代理利用GPT-4技术辅助编写软件并解决PRs(Pull Requests)。此代理的出现,不仅展示了人工智能在软件开发领域的潜...
Read More近期,名为'Jia Tan'的攻击者实施了针对广泛使用的开源软件库xz的首次严重的供应链攻击。在攻击发生前,Jia Tan作为xz压缩库的一名贡献者,已经勤奋高效地工作了两年多。此次攻击事件引起了开源社区的广泛关注,对开...
Read MoreBun 1.1是一款集成了运行、构建、测试和调试JavaScript与TypeScript功能的全能工具包。此次更新包括了数千个错误修复、大量新特性和API的添加,以及对Windows系统的支持。文章详细介绍了Bun 1.1版本的变更内容。Bun...
Read More普林斯顿大学的软件工程小组近日开源了一款名为“SWE-agent”的工具,该工具可以帮助开发者在GitHub上提高问题修复率。该小组在GitHub上发布了800个问题以供参考,工具通过学习这些问题并分析代码库中的代码,能够快速...
Read More微软在其广受欢迎的大型语言模型(LLMs)、向量数据库、提示技术以及低代码应用课程的基础上,发布了第二版的课程内容,现已上线GitHub。该课程共包含18课,虽然部分内容具有前瞻性,但依然是踏入该领域的良好起点。...
Read MoreWandb近日发布了一款名为OpenUI的创新工具包,该工具包允许用户通过文本描述来定义用户界面,并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑,简化了UI设计与开发的流程。...
Read More视觉语言模型(VLMs)在处理输入图像时,有时会遇到无法回答的问题。即便是最先进的VLMs,如GPT-4V,也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试,并探讨了一些可能的改进方向。研究者们通过...
Read More