Meta公司近日宣布发布一种名为Chameleon的全新模型,该模型可以像GPT-4o那样同时操作图像和文本。相比于许多其他的替代模型,Chameleon展现出了更好的性能。据悉,Meta团队在内部模型上已经远远超越了这项工作。该模...
Read MorexAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型,拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点,这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...
Read MoreXmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用,这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法,它优化了视觉和语言之间的协同工...
Read More人工智能公司Hugging Face宣布,将免费提供价值1000万美元的共享图形处理器(GPUs)资源,以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...
Read MoreOpenAI的GPT商店现已对所有用户开放,用户可以自由浏览和使用。OpenAI的GPT商店提供了一系列的GPT模型以供选择,包括GPT-3、GPT-2等。这些模型已被广泛应用于各种人工智能应用中,如聊天机器人、文本生成、自然语言...
Read MoreBraintrust是一家致力于人工智能(AI)技术的公司,其最新产品AI招聘器,具有诸多出色的功能。这款产品能够生成工作描述,匹配候选人,进行异步面试以及评分。该产品充分利用AI技术,能为企业提供更加高效、精准的招聘...
Read MoreNous Hermes发布了全新的Theta模型,该模型是Hermes 2 Pro和Llama 3 8B instruct的结合。它具有出色的函数调用能力,并在各种基准测试中表现强劲。Hermes 2 Pro是一款高性能的模型,而Llama 3 8B instruct则以其强大...
Read More近日,EfficientTrain++推出了一种新颖的课程学习策略,显著减少了主要视觉模型如ResNet和Swin在ImageNet数据库上的训练时间。据悉,这种新的学习策略最多可以将模型训练时间缩短三倍。EfficientTrain++的这一突破不...
Read More