语言模型的相关内容 - 漫话开发者

2024-06-03 talkingdev

一年构建大型语言模型（LLMs）的洞见与心得

随着人工智能技术的飞速发展，利用AI构建产品和系统变得前所未有的便捷。然而，要超越简单的演示，打造真正有效的产品与系统，仍存在诸多挑战。本文通过作者一年来使用大型语言模型（LLMs）构建应用程序的经验，为读...

2024-06-03 talkingdev

Pliny the Prompter在OpenAI最新的基础模型GPT-4o发布后仅数小时就公布了破解方案。该破解允许用户使模型输出明确的受版权保护的歌词、制造禁令物品的说明、攻击策略计划以及基于X光的医疗建议。Pliny已在大约9个月...

2024-06-01 talkingdev

自去年推出以来，语言模型（LLMs）已成为人工智能领域的热点。一年来，我们使用LLMs构建了许多项目，并从中获得了许多宝贵的经验教训。首先，LLMs需要大量的数据来进行训练，只有这样才能产生准确的结果。其次，LLMs...

2024-05-31 talkingdev

Yuan 2.0-M32是一款具备40亿参数的专家混合模型，其中任意时刻仅有3.7亿参数处于激活状态。尽管其计算需求仅为Llama 3 70B的1/19，但其性能却接近后者。该模型在2万亿个token上进行了训练，展现出了令人惊讶的强大性...

2024-05-31 talkingdev

随着大型语言模型性能的提升，其对能源和计算能力的渴求也随之增加。为降低成本，提高处理速度，同时减少对环境的影响，模型需要实现更小型化。研究人员目前采用一种名为量化的技术，通过减少模型参数的精度来压缩网...

2024-05-30 talkingdev

随着人工智能产品的门槛降低，从演示到实现有效产品的转变依然充满挑战。这一系列文章将深入探讨过去一年中基于机器学习系统之上开发实际应用的人们，从大型语言模型（LLMs）产品开发中学到的关键教训和方法论。内容...

2024-05-28 talkingdev

尽管一些专家认为通用人工智能（AGI）可能在不久的将来实现，但由于缺乏对一般智能的连贯理论模型以及对大型语言模型（LLM）为何或如何如此高效的理解，整体共识仍然不确定。讨论强调了围绕AGI的巨大未知数，类似于...

2024-05-28 talkingdev

近日，一个名为Meteor的新型高效大规模语言和视觉模型项目在GitHub上发布。Meteor模型通过引入多维度推理机制，大幅提升了理解和回答复杂问题的能力。该模型的设计旨在解决现有视觉语言模型在处理复杂场景时的局限性...