最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...
Read More近日,BabyLM挑战赛成为了一项旨在开发更小但仍然有效的人工智能模型的举措。由于大型LLM模型的缺点,如更大的模型需要处理能力,而只有少数公司拥有这种能力,因此推动开发更小的AI模型已经成为了当前的趋势。 ###...
Read More近日,一项新的研究显示,AI语言模型可以模拟人类个体的行为特征,实现人格化。这意味着,只需通过一些精心构建的方法,就能够为AI语言模型赋予人类的个性。研究者采用GPT-4语言模型来构建Samantha,将其作为另一个...
Read MoreMeta AI提出了一种新的AI模型架构,名为Megabyte,可以在多个格式上生成超过100万个标记。Megabyte解决了当前模型中的可扩展性问题,并并行执行计算,提高了效率并优于Transformers。 ## 核心要点: 以下是这篇新...
Read More科技新闻:研究人员引入了一种独特的AI模型——可组合扩散(CoDi),它可以基于任何组合的输入生成任何混合输出类型,如语言、图像、视频或音频,这使它与传统的AI系统有所不同。尽管许多输入输出组合缺乏训练数据,但...
Read More英特尔宣布推出Aurora GenAI,这是其与ChatGPT等AI模型竞争的产品,拥有高达1万亿个参数。该模型旨在应对复杂任务,承诺提升对话、翻译、摘要和编码能力。这是英特尔宏伟的AI战略的一部分,得到了学术和研究机构的合...
Read More据微软GitHub笔记本显示,ChatGPT在更复杂的任务上与开源AI模型的表现进行了比较。这份包含代码和详细分析的文档,为每个模型的优劣势提供了深入的了解,提供了对它们能力的细致理解。 ## 主要内容 以下是本文的三...
Read More近日,Boundless DAS是一种新方法,我们开发了它,以更好地理解像Alpaca这样的大型AI模型的内部机制,寻找其行为中可理解的模式。我们发现,Alpaca通过以一种一致的方式使用两个可理解的变量来解决一个简单的数字问...
Read More