漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

Google发布PaliGemma优化模型

Google在今天的发布中公布并展示了一些开源模型。其中一个已经发布的模型是基于SigLIP的视觉语言模型。这个模型非常容易调整和扩展到多种任务。这个Colab笔记本展示了如何用简洁、易读的代码来实现这一点。SigLIP是...

Read More
2024-05-15 talkingdev

Ollama在Google Firebase上的新动态

Genkit是一款针对Firebase的新型工具集,专门用于构建和部署生成性产品。Genkit可以用来启动开源语言模型的服务器。Firebase是Google的移动平台,它可以帮助开发者快速开发高质量的应用,增加用户基础,并获取更多的...

Read More
2024-05-15 talkingdev

图像去雨技术的新突破——ESDNet神经网络模型

ESDNet是一个专为图像去雨任务设计的脉冲神经网络(SNN)。这个神经网络模型首次将雨像素的独特属性用于增强脉冲信号强度。其设计理念是利用雨滴的像素值的特性,通过特定的神经网络结构和算法,实现对图像中的雨滴...

Read More
2024-05-15 talkingdev

Google I/O 2024新品发布:Gemini Flash、Veo视频生成、Imagen 3及最新助手Project Astra亮相

在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...

Read More
2024-05-15 talkingdev

谷歌AI技术重构搜索引擎,让搜索更聚焦于用户需求

谷歌宣布在I/O开发者大会上推出了多项AI技术,其中包括AI概述功能,旨在为用户提供搜索结果的概述,让用户专注于重点。该功能将出现在搜索结果的顶部,为用户提供由AI生成的摘要。此外,Lens中的一个功能可以通过拍...

Read More
2024-05-14 talkingdev

Pipecat:构建语音及多模态对话Agent框架

Pipecat是一个构建语音和多模式对话代理的框架。这个框架使开发者能够更便捷地创建和管理语音交互系统。多模式对话代理则是指可以处理多种类型输入(如文字、语音、图像等)的人工智能系统。Pipecat不仅适用于创建语...

Read More
2024-05-14 talkingdev

IBM开源其Granite代码模型源代码,推动编程任务更轻松高效

IBM近日宣布,将其Granite代码模型开源,以便更好地服务于开源社区,推动各平台的编程工作更为轻松和高效。这些模型的参数量在3亿到340亿之间,并覆盖了多种编程任务。这一举动,对于开发者们来说无疑是一大福音,他...

Read More
2024-05-13 talkingdev

亚马逊推出Bedrock Studio:一站式人工智能模型开发平台

亚马逊近日发布了名为Bedrock Studio的网络平台,这是亚马逊Bedrock生成式人工智能环境中的一个重要组成部分。Bedrock Studio的设计目标是帮助开发者在一站式的环境中进行人工智能模型的实验、调优及部署。亚马逊这...

Read More
  1. Prev Page
  2. 39
  3. 40
  4. 41
  5. Next Page