CES的相关内容 - 漫话开发者

2023-08-18 talkingdev

3D图像的优化：新型关键点识别技术

关键点检测就像在图片中找到特定的点，以创建3D图像。一项名为DeDoDe的研究以全新、更优的方式找到这些点，确保他们在不同的视角中匹配，并提升3D图像的创建质量。关键点的定位和识别在3D图像的构建过程中起着至关重...

2023-08-17 talkingdev

强化学习可能是当前对齐大型语言模型（甚至视觉模型）最好的工具。然而，当你需要大量的人类数据来训练一个奖励模型时，这就成为了一项挑战。如果你可以只使用“提示”呢？这是RLCF（强化学习计算框架）趋势的又一绝佳...

2023-08-17 talkingdev

在一张图片中，计算机有时会将同一对象识别为多个。现在，一个新的项目开发出一种方法，帮助计算机识别并聚焦于对象的单一完整版本。这种方法的出现，将对计算机视觉和图像理解能力的提升起到关键作用，不仅可以优化...

2023-08-16 talkingdev

虚拟试穿任务，即将一图像上的衣物转移到另一图像，尤其在更高分辨率下，这项任务具有挑战性。许多方法使用生成对抗网络（GAN）。然而，本文介绍的解决方案DCI-VTON，采用了一种结合了样例基础修复和变形模块的扩散...

2023-08-14 talkingdev

图像生成是人工智能技术的一个重要应用场景，而如何更好地控制其生成过程，是业界一直在探索的问题。最佳开源模型SDXL，推出了其ControlNet版本，通过利用边缘来调整最终输出，为图像生成提供了新的解决方案。SDXL C...

2023-08-14 talkingdev

信息革命将会像工业革命一样，为能源带来了变革。大部分工作过去是由肌肉完成的，现在已经不是了-很快，大部分思考也将不再由大脑完成。这种变革不会一夜之间发生，但已经开始了。更多的智能将带来新的技巧，但这些...

2023-08-11 talkingdev

在一篇新的研究报告中，研究人员在聊天式提示中通过检索9个演示示例，使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重，但它使得与文本达芬奇-003模型相比，赢率增加了7倍，使其...

2023-08-10 talkingdev

本文将详细介绍如何使用Llama论文来训练TinyShakespeare。Llama是一个新型的人工智能训练模型，具有高效和精准的特性。TinyShakespeare是一个文本生成模型，其设计目标是模仿莎士比亚的写作风格生成文本。本指南将带...