2024年9月22日

如何选购腾讯云GPU实例?如何优雅地安装驱动等底层开发工具库?这些问题给深度学习等领域研究/开发人员带来了不少困惑。本篇教程将从实践出发,给出基于腾讯云GPU实例的Best Practice,彻底解决以上问题。

我们选择腾讯云目前的主流机型GPU计算机型GN7,其中搭载一颗Tesla T4 GPU。本教程采用的具体规格为GN7.5XLARGE80。这款机型有着不错的综合性能,20核心+80G内存,比较适合常规的深度神经网络训练等各种应用场景。而且,它还是全球市面上同级别GPU机型中(T4)性价比最高的产品。

我们去Nvidia官网下载最新的CUDA Toolkit 10.2根据我们的环境选择安装下载方式,这里我们选择网络安装deb包的方式,如图:

可以看到其实就是在系统中安装了nvidia的官方apt仓库源,并执行了apt install cuda,很方便。只有最后一步的安装过程稍微耗时一些,需要5分钟左右,而且这一步有可能中间因为网络等原因中断,重试1~2次即可。

Nvidia GPU驱动是支持CUDA编程的内核模块。通过上述方法安装的驱动是以动态内核模块(DKMS)的形式安装的,这种内核模块不在内核source tree中,但是可以在每次内核更新升级时自动地进行重新编译,生成新的initramfs,并后续随着系统启动动态加载。总之就是,驱动只需安装一次,非常方便。

CUDA Toolkit,即开发工具包,其中包括构建命令、头文件、动态库、文档、代码示例等等,安装在/usr/local/cuda目录。

官网下载安装目前最新稳定版本是 7.6.5,地址。 这里不同于下载CUDA Toolkit,多了个登录步骤以及协议的勾选项。

看着如此高的Gflops,不禁感慨计算设备发展之飞速。相信教程到此,你也有点小心动,赶快来体验GPU云服务器GN7系列的速度与吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注