该项目引入了回声嵌入,这是一种新的策略,通过将未来令牌信息纳入其中,克服了自回归模型的一个关键限制。这是通过将输入重复两次来实现的,这显著提高了基准任务的性能,同时与其他嵌入增强方法兼容。
Read MoreFlowMDM是一种新的模型,用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建,无需额外的去噪步骤,在关键数据集上表现出卓越的准确性和逼真度。
Read MoreDreamRec引入了一种新颖的“学习生成”方法,用于顺序推荐。与传统方法从正负项目的混合中分类用户偏好不同,它创建了一个代表用户理想下一个选择的“神谕”项目。
Read More近日,Meta提出了一种三亿五千万参数的语言模型,其强大的推理能力甚至接近Llama 7B在API函数调用任务中的正确性。该模型尚未发布,但固定参数模型的创新值得探索。
Read MoreConceptMath是一种新的双语基准,用于测试LLMs在英语和中文的数学技能。它的独特之处在于它将数学问题分解为特定的概念,从而允许更详细地评估AI在数学上的优势和劣势。 这项技术将有助于开发更准确的AI模型,以应对...
Read More法国AI初创公司Mistral宣布推出新的API模型,并与Azure达成合作。Mistral Large在多语言任务方面表现出色,在MMLU上仅比GPT-4差了几个百分点,性能强大。该初创公司还在其API中添加了一个新的mistral-small模型。
Read More由数据质量研究专家创立的 DatalogyAI 公司最近获得了1100万美元的融资。该公司旨在让数据集的可扩展筛选变得更加简单。
Read More