漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

EleutherAI发布训练的SAE和Llama 3 8B的权重和库代码

EleutherAI已为Llama 3 8B训练出新的SAEs,并发布了它们的权重和库代码。这一突破性的技术进步显示出EleutherAI对于研发和推动技术进步的强大能力。SAE的训练和优化是一项复杂的任务,需要大量的知识和专业技能。Ele...

Read More
2024-04-16 talkingdev

Eleuther发布Pile-T5:现代AI编码任务的升级版基础模型

Eleuther团队近期对T5模型进行了重新训练,采用了现代的分词器并延长了训练时间。T5作为现代AI领域的一匹黑马,此次升级后的Pile-T5模型在编码任务上表现出了显著的性能提升。经过持续的优化和调整,Pile-T5在多项基...

Read More
2023-06-01 talkingdev

本地GPT:使用Vicuna-7B模型和InstructorEmbeddings实现离线问答

近日,开发者们在GitHub上发布了一个名为localGPT的Repo,该项目利用Vicuna-7B模型和InstructorEmbeddings实现了离线文档问答功能。以下是该项目的主要亮点: - 使用Vicuna-7B模型:该模型是由EleutherAI开发的巨型...

Read More
2023-04-13 talkingdev

Databricks发布Dolly 2.0:开源指令调整模型

Databricks发布了他们模型Dolly 2.0的新版本,该模型基于EleutherAI Pythia模型,经过指令调整后使用全新的商业可行数据集。虽然不清楚它与基于llama的模型或GPT 3.5 turbo的模型相比如何,但这是一项更加开放的工作...

Read More