智能的相关内容 - 漫话开发者

2024-05-16 talkingdev

Nous Hermes发布首款Theta模型，具有出色的函数调用能力

Nous Hermes发布了全新的Theta模型，该模型是Hermes 2 Pro和Llama 3 8B instruct的结合。它具有出色的函数调用能力，并在各种基准测试中表现强劲。Hermes 2 Pro是一款高性能的模型，而Llama 3 8B instruct则以其强大...

2024-05-16 talkingdev

近日，EfficientTrain++推出了一种新颖的课程学习策略，显著减少了主要视觉模型如ResNet和Swin在ImageNet数据库上的训练时间。据悉，这种新的学习策略最多可以将模型训练时间缩短三倍。EfficientTrain++的这一突破不...

2024-05-16 talkingdev

扰动注意力指引（PAG）是一种提升扩散模型生成图像质量的新方法，无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制，PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...

2024-05-16 talkingdev

Instagram联合创始人Mike Krieger成为Anthropic的新任首席产品官。Krieger在过去几年中致力于开发一款AI新闻阅读应用，该应用最近被雅虎收购。他在开发直观产品和用户体验方面的背景将为Anthropic创造新的人与其AI聊...

2024-05-16 talkingdev

Quary是一款开源商业智能工具，可以帮助工程师连接数据库，编写SQL查询以转换、组织和记录数据库中的表，创建图表、仪表板和报告，通过版本控制进行测试、协作和迭代重构，以及将组织良好、记录完整的模型部署回数据...

2024-05-15 talkingdev

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力，能够生成具有1080p分辨率的视频，且长度可以超越一分钟。在现有的视频生成技术中，这种能力是相当显著的。Veo利...

2024-05-15 talkingdev

近日，Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术，使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...