AR的相关内容 - 漫话开发者

2024-03-19 talkingdev

谷歌发布能让静态图片“活”起来的AI技术

谷歌的研究团队近日推出了一款名为VLOGGER的人工智能技术，该技术能够通过单张照片生成人物说话和活动的逼真视频。这一技术突破不仅在视觉效果上取得了显著进展，也为人机交互和虚拟现实领域带来了新的可能性。VLOGG...

2024-03-19 talkingdev

近期上线的伴随网站More Useful Things为公众提供了大量免费的人工智能与机器学习资源。该网站通过一系列实验展示了AI生成的提示，例如富有想象力的场景构造，在解决数学问题等任务中如何超越人工编写的提示。这些实...

2024-03-19 talkingdev

最新的研究显示，随着人工智能和机器学习模型不断优化自身的提示，人类的提示工程师可能面临淘汰。由算法生成的提示虽然奇特，却异常有效，它们不仅胜过人工编写的提示，还大幅缩短了优化时间。尽管自动调整的提示显...

2024-03-19 talkingdev

最近，一个新的GitHub项目GroupContrast引起了技术界的广泛关注。该项目通过将片段分组与语义感知对比学习相结合，重新定义了自监督3D表示学习的概念。这种创新的方法不仅能够提高3D场景理解的准确性，还能够在不依...

2024-03-19 talkingdev

最近，GitHub上出现了一个名为LLM4Decompile的项目，该项目利用大型语言模型来尝试还原二进制代码。这种方法的出现，可能对程序员在调试和理解已有软件方面带来革命性的变化。传统的反编译方法通常只能将机器码转换...

2024-03-19 talkingdev

近期，一个创新性的目标识别方法在GitHub上发布，该项目通过聚焦于对象中心信息，以识别在RGB、近红外和热成像等多种光谱下拍摄的图像中的对象。这一方法的核心在于克服背景噪声，从而提高识别的准确度。研究团队通...

2024-03-19 talkingdev

现代语言模型的一个奇特事实是，在训练模型之前，我们首先训练分词器。另一个奇怪的事实是，在大规模场景下，词汇量大小似乎并不是那么重要。本文将深入探讨这两种现象，分析分词器在模型预训练中的角色和影响，以及...

2024-03-19 talkingdev

最新研究项目YOLOX-ViT在水下机器人领域中引入了一种创新的目标检测方法，该方法通过整合视觉变换器（Visual Transformers）和知识蒸馏（Knowledge Distillation）技术，显著提高了目标检测的准确性和效率。该技术的...