2024年9月20日

如果选择的主机为32 核、256 GB 内存、8 张显卡。购买此主机的 2 张显卡。分配给您的资源为 (2/8)*32=8 核、(2/8)*256=64 GB。购买4张显卡分配到的资源为(4/8)*32=16 核、(4/8)*256=128 GB。注意因为实例是以 Docker 容器运行,在实例内看到的主机信息可能为整机资源,但实际并不能使用该主机的所有资源。

请注意控制您实例内进程的内存使用情况,如果超出分配的内存,实例内的进程会发生被kill或重启的情况。如遇到此情况,请使用 top 命令(按 e 来切换内存单位)来查看进程的内存占用,降低训练的内存使用量。

使用 nvidia-smi 命令可以查看显卡信息,包括显卡驱动、型号、温度、功耗、显存和进程等。

实例使用容器虚拟化,因 PID Namespace 隔离问题使用 nvidia-smi 命令无法看到使用显卡的进程。如果 Processes 下显示 Norunningprocessesfound 代表没有进程使用显卡,如果为空代表有进程使用显卡。也可以根据显卡的使用率、功耗来判断。

发表评论

邮箱地址不会被公开。 必填项已用*标注