漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-13 talkingdev

E2URec开源,让推荐系统“遗忘”用户数据保护隐私

E2URec是一种全新的方法,可以让基于大型语言模型的推荐系统高效、有效地“遗忘”用户数据,保证用户隐私的同时,又不牺牲系统性能。这种新方法以用户隐私保护为核心,通过改变推荐系统的学习机制,实现对用户数据的有...

Read More
2024-05-13 talkingdev

AnythingLLM-全新一体化LLM与RAG服务框架

近日,知名开源平台GitHub Repo发布了全新的服务框架——AnythingLLM。该框架具有LLM(Low Level Management)和RAG(Risk Analysis and Governance)两大主要功能,提供了一站式的服务体验。AnythingLLM的目标是通过...

Read More
2024-05-13 talkingdev

Mirage张量优化器:引领线性代数模块性能的新高度

Mirage项目是一个多层次的张量优化引擎,能够产生极高性能的线性代数模块内核。它利用了张量的多层结构,进行深度优化,从而实现了高度优化的内核计算。在GitHub上,Mirage项目已经开源,并得到了广大开发者的热烈追...

Read More
2024-05-13 talkingdev

Salesforce发布BLIP-V3模型,主要用于图像理解和标注

近日,Salesforce已经训练并发布了广受欢迎的BLIP模型的第三个非商业版本。这款模型主要用于图像理解和标注,是视觉和语言模型的最新成果。Salesforce一直致力于开发和研究这种模型,以提高其在图像理解和标注方面的...

Read More
2024-05-13 talkingdev

Hazy研究推出全新CUDA内核DSL——ThunderKittens

Hazy研究团队最新推出一款名为ThunderKittens的CUDA DSL,旨在帮助开发者更简单、更高效地编写CUDA内核。据了解,该团队已经用这款新工具编写了flash attention模块,结果表明其运行速度比原版本快了30%,而且仅需10...

Read More
2024-05-13 talkingdev

论文:自动检测大型语言模型中的未充分训练的标记

语言模型依赖于单独训练的标记生成器。这些标记生成器可能会产生在语言模型训练过程中从未见过的标记。即使在最强大的现代语言模型中,也存在许多此类标记。本文探讨了这种现象,并提出了识别和处理这些标记的方法。...

Read More
2024-05-13 talkingdev

Cohere发布Command R微调功能,性能领先业界

Cohere公司近日推出了其Command R的微调功能,该功能以极低的成本提供了业界领先的性能。在对企业最重要的关键性能指标上,具有微调功能的Command R始终优于更大的模型。该微调功能现已在Cohere的平台和亚马逊Sagema...

Read More
2024-05-13 talkingdev

Altera筹集900万美元,开发用于数字人的AI

Altera正致力于创建数字化人类,首先从可以与你一起玩任何游戏的代理人开始。这家公司在一轮超额认购的种子轮中筹集了900万美元,由First Spark Ventures(Eric Schmidt的深度科技基金)和Patron(由Riot Games的成...

Read More
  1. Prev Page
  2. 137
  3. 138
  4. 139
  5. Next Page