漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-20 talkingdev

CuPy:为GPU量身定制的NumPy和SciPy替代品

CuPy是一个基于GPU的数组库,旨在为高性能计算提供与NumPy和SciPy兼容的API。它的设计使得用户能够在GPU上高效地执行数值计算,从而显著提升计算速度。CuPy采用了CUDA编程模型,支持多种GPU加速功能,包括矩阵运算、...

Read More
2024-07-04 talkingdev

手把手教你解决Torch Compile问题,提升代码运行速度

对于使用Torch Compile的开发者来说,解决其过程中遇到的错误问题可能是一项挑战。本教程将详细介绍如何解决Torch Compile中的错误,帮助您的代码更快运行。首先,我们需要了解深度学习框架中的编译过程,这对于找到...

Read More
2024-05-28 talkingdev

深度学习框架Tinygrad 0.9.0正式发布

深度学习框架Tinygrad 0.9.0正式发布。Tinygrad是一个轻量级的深度学习框架,支持Python和JavaScript。Tinygrad 0.9.0增加了对自定义函数的支持,以及其他一些性能和稳定性的改进。它的设计使其非常适合在边缘设备上...

Read More
2024-05-27 talkingdev

Mistral发布其官方模型微调开源仓库

Mistral近日宣布推出其官方模型微调仓库,这一举措将为开发者提供更方便的工具来优化和定制Mistral的模型。该官方仓库已经在GitHub上开放,用户可以通过访问该仓库获取相关资源和文档。Mistral的微调仓库支持多种机...

Read More
2024-05-15 talkingdev

新指数函数使SiLU和SoftMax两倍更快,完全保持准确性

深度学习中的SiLU和SoftMax函数在许多任务中都是必不可少的,但它们的计算成本很高。为了改进这一点,来自华盛顿大学的研究人员提出了两个新的指数函数,可以将它们的速度提高2倍,同时完全保持准确性。这些函数分别...

Read More
2024-04-29 talkingdev

Luminal:以速度和简单性为核心的深度学习框架

Luminal 是一款基于深度学习的开源框架,它在GitHub上发布并得到了广泛的关注。这个框架以速度和简单性为出发点,把快速和简易性放在首位,让用户可以在最短的时间内实现深度学习模型的快速构建和部署。Luminal能够...

Read More
2024-04-09 talkingdev

用C/CUDA语言训练大型语言模型,无需依赖PyTorch

近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...

Read More
2024-01-26 talkingdev

TensorDict:让你在PyTorch中更好地使用字典和张量

TensorDict是一个非常实用的小工具,它可以让你在PyTorch中使用字典和张量。使用TensorDict可以提高代码的可读性和可用性,同时保持良好的性能。 TensorDict提供了一种简单的方法来将张量转换为字典,并且可以像字...

Read More
2024-01-04 talkingdev

论文:改进稳定性的单幅图像超分辨率技术

研究人员开发了一种新的方法,通过关注两个关键方面来提高单幅图像超分辨率:潜在高分辨率图像的最佳质心和影响图像质量的固有噪声。其方法还使用了一个新的深度学习框架,该框架可以显著提高超分辨率的稳定性,避免...

Read More
2023-10-27 talkingdev

基于稀疏深度细节的水下车辆实时深度估计模型开源

近日,一项名为‘Real-Time Depth Estimation for Underwater Vehicles’的研究成果在GitHub上发布。该研究提出了一种针对水下车辆的模型,可以通过结合稀疏深度细节从单个图像中实时估计深度。该模型是通过深度学习框...

Read More
  1. Next Page