人工智能的相关内容 - 漫话开发者

2024-05-20 talkingdev

论文：Meta发布全新融合多模型Chameleon，性能超越多种替代模型

Meta公司近日宣布发布一种名为Chameleon的全新模型，该模型可以像GPT-4o那样同时操作图像和文本。相比于许多其他的替代模型，Chameleon展现出了更好的性能。据悉，Meta团队在内部模型上已经远远超越了这项工作。该模...

2024-05-20 talkingdev

xAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型，拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点，这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...

2024-05-17 talkingdev

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用，这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法，它优化了视觉和语言之间的协同工...

2024-05-17 talkingdev

人工智能公司Hugging Face宣布，将免费提供价值1000万美元的共享图形处理器（GPUs）资源，以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...

2024-05-16 talkingdev

OpenAI的GPT商店现已对所有用户开放，用户可以自由浏览和使用。OpenAI的GPT商店提供了一系列的GPT模型以供选择，包括GPT-3、GPT-2等。这些模型已被广泛应用于各种人工智能应用中，如聊天机器人、文本生成、自然语言...

2024-05-16 talkingdev

Braintrust是一家致力于人工智能(AI)技术的公司，其最新产品AI招聘器，具有诸多出色的功能。这款产品能够生成工作描述，匹配候选人，进行异步面试以及评分。该产品充分利用AI技术，能为企业提供更加高效、精准的招聘...

2024-05-16 talkingdev

Nous Hermes发布了全新的Theta模型，该模型是Hermes 2 Pro和Llama 3 8B instruct的结合。它具有出色的函数调用能力，并在各种基准测试中表现强劲。Hermes 2 Pro是一款高性能的模型，而Llama 3 8B instruct则以其强大...

2024-05-16 talkingdev

近日，EfficientTrain++推出了一种新颖的课程学习策略，显著减少了主要视觉模型如ResNet和Swin在ImageNet数据库上的训练时间。据悉，这种新的学习策略最多可以将模型训练时间缩短三倍。EfficientTrain++的这一突破不...