漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-07 talkingdev

使用扩散模型从单一视角生成3D图像

Zero123++是一个使用扩散原理从单个输入图像生成一致的多视图图像的模型。通过利用预训练的2D模型,Zero123++解决了纹理质量和对齐问题等挑战。

Read More
2023-12-07 talkingdev

DiffiT:基于扩散的视觉转换器生成高分辨率图像

该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...

Read More
2023-12-05 talkingdev

GitHub首席产品官Inbal Shani:AI在软件开发中的未来

GitHub的首席产品官Inbal Shani讨论了AI在软件开发中的作用,认为AI驱动的代码生成不会取代开发人员,而是提高他们的效率。她探讨了GitHub的Copilot背后的成功指标和理念,以及该公司如何促进创新。这次对话揭示了AI...

Read More
2023-12-05 talkingdev

SAFE:一种用于模式识别的融合框架开源

SAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...

Read More
2023-12-05 talkingdev

MaXTron,新的视频全景分割技术开源

MaXTron是一种简单而有效的统一元架构,用于视频分割。

Read More
2023-11-30 talkingdev

Roboflow开源适用于多模态模型的提示库

标记提示集是一种聪明的方法,可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制,并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。

Read More
2023-11-30 talkingdev

Tanuki:轻松构建LLM技术驱动的应用,让应用变得更便宜、更快速

LLM是一种全新的机器学习技术,可以让应用程序在运行时不断学习和优化,从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具,可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...

Read More
2023-11-30 talkingdev

llamafile:运行在多个CPU微架构上的单文件分发工具

近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

Read More
  1. Prev Page
  2. 51
  3. 52
  4. 53
  5. Next Page