Git的相关内容 - 漫话开发者

2023-12-07 talkingdev

使用扩散模型从单一视角生成3D图像

Zero123++是一个使用扩散原理从单个输入图像生成一致的多视图图像的模型。通过利用预训练的2D模型，Zero123++解决了纹理质量和对齐问题等挑战。

2023-12-07 talkingdev

该项目探索了视觉转换器在基于扩散的生成学习中的有效性，揭示了Diffusion Vision Transformers（DiffiT）。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像，具有非常好的...

2023-12-05 talkingdev

GitHub的首席产品官Inbal Shani讨论了AI在软件开发中的作用，认为AI驱动的代码生成不会取代开发人员，而是提高他们的效率。她探讨了GitHub的Copilot背后的成功指标和理念，以及该公司如何促进创新。这次对话揭示了AI...

2023-12-05 talkingdev

SAFE是一种新的模式识别融合框架，它结合了预训练的视觉和语言模型，使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景，具有广泛的应用前景。在实现过程中...

2023-12-05 talkingdev

MaXTron是一种简单而有效的统一元架构，用于视频分割。

2023-11-30 talkingdev

标记提示集是一种聪明的方法，可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制，并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。

2023-11-30 talkingdev

LLM是一种全新的机器学习技术，可以让应用程序在运行时不断学习和优化，从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具，可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...

2023-11-30 talkingdev

近日，llamafile发布了新的GitHub Repo，它是一种新的单文件分发工具，允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行，而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...