漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

GitHub2File:将GitHub仓库转换为文件,助力离线深度学习

GitHub2File是一个高效的实用工具,它可以将GitHub上的代码仓库转换成文件格式,供那些无法浏览网络的长文本模型使用。通过这个工具,研究人员和开发者可以在没有互联网连接的情况下,依然能够访问和研究GitHub上的...

Read More
2024-04-03 talkingdev

Anthropic开发新技术破解长文本模型

近期,人工智能研究公司Anthropic成功开发出一种破解长文本模型的技术。该技术通过对长文本模型进行破解,可以获取模型的内部信息。为了防范此类攻击,Anthropic已经与其他组织分享了这项发现,并对自身的安全措施进...

Read More
2023-08-28 talkingdev

微软开源DeepSpeed训练长文本模型

DeepSpeed是微软推出的一个库,可以用来扩大语言模型的预训练。虽然使用起来有些复杂,但它提供了强大的抽象功能。微软最近添加了序列并行性,可以训练具有更长上下文长度的模型。这并不是一个新的突破,而是对开源...

Read More