AR的相关内容 - 漫话开发者

2024-05-16 talkingdev

SqueezeTime-移动视频理解的新进展

SqueezeTime是一款为移动视频理解设计的轻量级网络，其独特之处在于，它能够将视频的时间轴压缩到频道维度中，从而增强了时间分析的能力。SqueezeTime网络的设计理念是，通过压缩时间轴，可以在不牺牲视频内容质量的...

2024-05-16 talkingdev

近日，EfficientTrain++推出了一种新颖的课程学习策略，显著减少了主要视觉模型如ResNet和Swin在ImageNet数据库上的训练时间。据悉，这种新的学习策略最多可以将模型训练时间缩短三倍。EfficientTrain++的这一突破不...

2024-05-16 talkingdev

GitHub上最新的AI项目IC-Relight，是一款使用前景分离和文本调节的AI重照明工具，能带来极其强大的结果。该工具利用AI技术，将图像分为前景和背景，然后通过文本调节，实现对图像的精细控制和调整。这种方法的应用，...

2024-05-16 talkingdev

扰动注意力指引（PAG）是一种提升扩散模型生成图像质量的新方法，无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制，PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

2024-05-16 talkingdev

3D模型的生成一直是一个挑战。Coin3D提供了一个解决方案，允许用户首先输入一个粗糙的网格，然后运行生成，这使得用户可以更精细地控制模型，并提高模型的输出质量。这种方法不仅提高了模型的精度，也为用户节省了大...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...

2024-05-16 talkingdev

项目IDX是一个以AI为中心的，基于浏览器的开发环境，该项目于8月份以邀请制的形式启动。已有超过10万开发者尝试了该项服务，并现已进入公开测试阶段。Google已经将Google地图平台的集成添加到了这个IDE中，并与Chrom...

2024-05-16 talkingdev

OpenAI的联合创始人和首席科学家Ilya Sutskever已正式离开该公司。Sutskever曾帮助领导了对Sam Altman的政变，但后来改变了主意。自从政变后，他的雇佣状态一直不明确。该公司的研究部主管Jakub Pachocki将成为OpenA...