漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-05 talkingdev

AI2发布全面开放的开放语言模型OLMo

AI2发布了一个完全开放的语言模型训练框架,名为OLMo。该模型提供全面的资源,包括完整的训练数据、模型权重、训练和评估代码、每个模型超过500个检查点,以及未来的微调代码,所有这些都遵循Apache 2.0许可证。这些...

Read More
2024-02-01 talkingdev

论文:SliceGPT高效简化大型语言模型的新方法

SliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...

Read More
2024-01-25 talkingdev

自动驾驶作为AGI的案例研究

人工通用智能(AGI)通常被定义为在大部分经济有价值的工作中超越人类能力的自主系统。自动驾驶的最新发展是增加自动化的社会动态的一个好的早期案例研究。驾驶是一个难以自动化的问题,其自动化将影响大量人力资源...

Read More
2024-01-24 talkingdev

TypeSpec:云服务API的描述语言

TypeSpec是一种描述云服务API并生成其他API描述语言、客户端和服务端代码、文档和其他资源的语言。它提供了高度可扩展的核心语言原语,可以描述REST、OpenAPI、GraphQL、gRPC和其他协议中常见的API形状。TypeSpec可...

Read More
2024-01-23 talkingdev

谷歌X实验室裁员,希望项目寻求外部资助

谷歌母公司Alphabet旗下的“Other Bets”集团中的X实验室是一家“月球计划”试验性机构,每个季度的亏损达到10亿美元。近日,谷歌宣布从X实验室裁员“数十人”,并鼓励该实验室的项目寻求外部资助,以持续运作。尽管X实验...

Read More
2024-01-23 talkingdev

如何应对行为面试?GitHub推出新仓库提供资源和技巧

GitHub最近发布了一个名为《Awesome Behavioral Interviews》的新仓库,旨在为用户提供准备行为面试的技巧和资源。该仓库涵盖了一般性质的技巧、可能被问到的问题,以及您可以问面试官的问题。每个面试问题都附带了...

Read More
2024-01-22 talkingdev

Diffusion模型可用于内容超分辨率

随着最近将扩散模型用于各种其他视觉任务的趋势,本研究改进了超分辨率的训练稳定性和缩放。

Read More
2024-01-22 talkingdev

Stablecode3B:比7B的CodeLlama更出色,可在MacBook上本地运行

据悉,最近发布的Stablecode 3B模型表现出色,其强大的性能超过了7B的CodeLlama模型。同时,该模型的尺寸足够小,能够在MacBook上本地运行,无需像7B模型一样需要大量的计算资源。这一模型的发布,标志着技术领域的...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page