漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

LLM推理速度如何实现100倍提升

随着开放模型在许多企业任务中变得有用,人们开始探索部署优化。然而,这个领域很复杂且分散。本文深入探讨了许多用于加速语言模型服务的标准技术。

Read More
2023-12-12 talkingdev

StripedHyena模型:新AI模型让上下文长度变更长

近来,Transformer模型在AI领域占据统治地位。它们是强大的序列学习器,但也存在一些缺点。这项新工作基于状态空间模型,展示了新的架构可以带来巨大的好处,如增加上下文长度。

Read More
2023-12-12 talkingdev

KTO改进:更好更便宜快速的数据对齐

通常,大多数数据对齐框架需要排名偏好数据(A优先于B)。而这种数据通常很昂贵且罕见。而这种新的框架只需要每个数据点的独立是或否评级即可实现数据对齐,更加便宜、更加高效。

Read More
2023-12-12 talkingdev

使用预训练文本到图像扩散模型进行视频编辑

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

Read More
2023-12-12 talkingdev

Mistral发布新模型并宣布获得新一轮融资

人工智能公司Mistral将在新一轮融资中获得超过4亿美元的资金。该公司还发布了一款8x7B混合专家模型,目前正在社区进行评估。Mistral致力于为客户提供最优质的人工智能产品和服务。他们的新一轮融资将用于推动产品开...

Read More
2023-12-12 talkingdev

Stability AI发布StableLM Zephyr 3B聊天模型

稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型,该模型是StableLM 3B-4e1t模型的一个扩展,灵感来源于Zephyr 7B模型,旨在实现高效的文本生成,特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...

Read More
2023-12-12 talkingdev

HTML input 元素的深度解析

本文除了介绍HTML input元素可以表现的各种类型,还深入探讨了一些较少被人知晓的属性,这些属性使得该元素更易用、更易访问,也更适用于更多的情境。

Read More
2023-12-12 talkingdev

为什么我们会惊讶于创业如此艰难?

Nvidia的CEO黄仁勋最近表示,如果他能再次变成30岁,他不会再创办一家公司,因为他为Nvidia所付出的工作并不值得。本文从创始人的角度探讨黄仁勋的声明,重点是弄清楚为什么人们会惊讶于创业如此艰难。无论一个公司...

Read More
  1. Prev Page
  2. 369
  3. 370
  4. 371
  5. Next Page