Py学习  »  机器学习算法

当深度学习遇上CUDA,摩擦出“爱”的火花……

专知 • 2 年前 • 224 次点击  

2021年秋招进行中,我也曾在秋招中斩获不少offer,这几天在群里和毕业的同学们吹牛,但是感觉大家为都在为一个问题苦恼……


兄弟们啊,救救我啊!leader让我想办法提高交易速度,说我研究深度学习的,一定有办法提高股票时间序列数据的量化处理速度。还说,优化的好,年终奖50万少不了,兄弟们帮帮忙啊!!!

......

首先分析,上面的案例,是模型优化或者模型加速领域的问题,如果在软件算法层面已经是目前最优或者较优方法了,那么进一步提高算法的性能和效率,如何实现呢?----那就是这项神技,异构硬件高性能计算,这里应用最广的就是CUDA编程了。

如上图,简单来说,就是操作左边GPU的多核进行同时计算。主要特性包括:

CUDA C编程基本知识(kernel、grid、block、thread),包括:这几个名称的概念,之间的包含关系,如何用CUDA语言来调用它们;

CUDA中共享内存的使用(Shared Memory),包括:GPU中寄存器的使用,shared memory、contant memory、global memory、texture memory之间的区别和联系,以及如何使用它们;

如何在不同场景下使用不同CUDA指令,包括:原子指令、单精度和双进度优化指令等等。

但是对于初学者来说,CUDA真就不够友好,涉及的知识很多,比如GPU各个层级的运行模式,cuDNN和Tensor RT等等,除了这些基本知识外,还需要会一点性能分析和优化……导致学习CUDA的效率低。CUDA作为一门实用性的技术,只有解决实际问题,才能体现它的价值。那如何学习这门技术呢?
CUDA怎么学呢?

1.掌握CUDA并行计算系统的分析、开发、调试与优化方法;

2.熟悉CUDA的基本概念以及主流的并行算法;

3.了解cuDNN与TendorRT两个深度学习模型加速的主流工具;

4.具备动手实践深度学习模型的加速的能力。

深蓝学院开设了CUDA入门与深度神经网络加速的课程,以上学习路径一套打包带走~并且使大家能够具备CUDA编程操作能力,使用cuDNN、TensorRT这两个当下热门的深度神经网络加速的工具。

课程内容

所需基础

1.计算机体系结构基础

2.深度学习基础

3.线性代数

4.C语言编程基础

硬件要求

NVIDIA的GPU

抢占优惠名额啦!

添加深蓝学院-奕木

备注【性能】,快速通过哦!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/121933
 
224 次点击