LLMs的相关内容 - 漫话开发者

2023-12-22 talkingdev

Apple 研究员开发突破性技术，让 iPhone 运行 LLMs 如虎添翼

苹果研究员使用一种创新的闪存利用技术，为在具有有限内存的苹果设备上部署大型语言模型打开了关键突破。该方法使用窗口化和行列捆绑技术来最小化数据传输，最大化闪存吞吐量。它使得 AI 模型在标准处理器上运行速度...

2023-12-19 talkingdev

领先的创始人和风投投资者谈论人工智能的发展现状，从LLMs的应用到企业创新。如果“你应该了解的关于人工智能的事情”节奏有点令人不知所措，那么这是一个不错的快速回顾。人工智能正在成为越来越多行业的关键技术之一...

2023-12-18 talkingdev

一种新的研究方法通过在大型语言模型中引入物体标识符来改善对3D场景的理解并回答相关问题。该方法专注于识别和关联场景中的物体，在解释复杂的空间关系方面取得了有希望的结果，使得人工智能更加擅长这方面的任务。

2023-12-12 talkingdev

Giskard是一个开源的测试框架，用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力，还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

2023-12-12 talkingdev

Ollama就像是llama cpp模型周围的软件包管理器。它具有易用性和质量生活功能，甚至可以在CPU上轻松运行模型。本示例展示了如何运行两个优秀的模型，Dolphin和Samantha，它们是用于对话任务的优秀未过滤模型。

2023-12-08 talkingdev

本研究介绍了使用大喜利幽默生成游戏来探索LLMs中的跳跃思维能力。这种方法挑战LLMs展现出非连续思维的能力，这是一项对于生成对各种类型的多模式信息具有创造性和幽默感的回应至关重要的技能。

2023-12-08 talkingdev

Lightspeed分享了来自Google和TitanML关于通过提示或微调优化LLMs的内幕。这些技术可以优化自然语言处理模型，从而帮助它们更好地适应真实世界的应用。在这篇文章中，您将了解到这些优化技术的工作原理以及它们如...

2023-12-06 talkingdev

在将语言模型嵌入到您的代码库中时，一个有用的心理模型是将它们视为具有标准输入和输出的函数。这篇博客是由React Native的创始人撰写的，展示了几种您可以这样建模模型以及这种方式的好处。