2024年9月20日

客观因素无非就是围绕价格来谈,现在的云服务器平台都差不多。除了几个巨头,其他的平台甚至连web界面都差不多…所以这里不谈稳定性之类的,再我看来稍有名气的平台出现bug都是非常小的概率事件,所以不足以构成考虑的因素。

有个很容易被忽略的平台:kaggle ,每周30h的免费V100用,我们学生一周工作7天,平均一天有4.2h免费使用。太爽了,如果你是入门免费的时间真够你用了。值得注意的是,kaggle主要是用notebook kernel,可能刚开始用起来会不那么爽,不过用熟悉了之后还是可以用的,而且熟悉了之后可以开打kaggle也是不错的选择。

题主说了是学生党,那我们就要利用起学生这个身份,我对比过不少平台,不多比比直接推荐价格最便宜的:autodl,在学生价方面他们平台是最便宜的,幼儿园级:xp 0.52/h,小学生级:3060 0.99/h,中学级3090 2.28/h。自己也可以再去浏览其他平台对比下。对了这个平台还有优惠券,节日全场免费等活动。

为什么要谈主观因素呢,因为在我自己总结的经验来说,刚开始用云服务器会在处理数据,改代码,选择显卡上浪费很多money。所以考虑主观因素真的能减少不必要开支。

关于节省时间,在处理数据和改代码的时候可以开无卡模式,改好之后运行一下不报错再去打开显卡训练,而且长期用下来我还发现一定不能频繁更换分区,最好是固定一个分区,然后公用代码存网盘里,每个项目新建一个实例把网盘的源码copy出来就行,非常方便,建议:一个项目实例开一张卡。

关于显卡选择,个人入门阶段随便用一块3060或者1080TI都可以。开始做一些项目实验的时候尝试3090或者A5000,等用顺溜了,保证能有效利用时间的时候就开着单卡/多卡3090,不过多卡不是简单的加倍,双卡应该是180%的效率到不了200%,所以不赶时间就单卡3090就行。

在当前很多学生,尤其是研究生都做深度学习的情况下,显卡资源变得尤为重要,当所在的大学或者实验室资源有限,怎么才能租到便宜的服务器呢?(毕竟学生大多数还是花家里钱,便宜好用是大家的首选)

由于我们实验室人多服务器少,我已经租用了一年半的gpu,现在就结合我自己的使用经历以及网上的数据,给大家分享一波便宜好用的gpu云平台。

如果你刚刚接触深度学习,想从一些小的模型入手,那么Google Colab是首选,它会为你提供免费的gpu,并且平台环境都是配置好的,还有15个g的网盘空间供你使用。使用该平台需要先注册登录谷歌账号,然后打开谷歌云端硬盘。

进入Colab后,操作类似于Jupyter Notebook,有相关操作经验的可以很轻松的使用,免费用户一般都会被分配到Telsa T4显卡,也听说有被分到K80的。

一般免费用户运行几个小时的gpu模式就会被停止,且需要保证网速稳定,电脑浏览器保持打开状态(白嫖果然限制很多。。。)。Colab还有会员模式,基础会员模式10美元一个月,会被分配到Telsa P100,高级会员模式50美元一个月,可以分配到Telsa V100显卡(显卡之间的区别建议百度天梯图),但是即便是高级会员模式,最多也就可以连续运行24个小时的gpu,且换算民币已经达到300块钱了,对于需要稳定的gpu环境的同学,这种配置的性价比肯定不足够了,那么有没有什么价格对学生党很友好且稳定的gpu云平台呢?经过我一段时间的摸索,发现了一个云平台的价格很实惠,能够满足绝大多数学生党的需求。

AutoDL提供的网盘有20个g的免费空间,各种显卡数量都比较充足,并且可以以一个小时一毛钱的价格开无卡模式,帮助文档中的内容也很充足,租用显卡后,可以用平台提供的Jupyter Notebook或者是自己的远程连接软件使用显卡,比较方便,平台还能够提供且拥有公共数据集方便用户下载,各种功能比较齐全,下面是一些AutoDL平台的截图。

总体来说对学生用户很友好,客服服务态度也很好,反应的需求都会尽量去解决,但是个人感觉还是有一点点不足,譬如部分功能还没有完全上线,部分显卡型号比较抢手等等,但是我相信这么实惠的gpu平台一定会越做越好。(注:以上内容均是根据我个人的使用体验得出来的结论,不同人的感受可能各不相同,希望该回答可以帮助到各位缺少显卡,又不知道去哪里租用的同学)

最近终于闲下来,可以好好回答一下这个问题了。首先说一下结论,关于深度学习平台,我只推荐AutoDL,原因有三:价格便宜+使用方便+服务好。

自从从微软和字节实习回来之后,就越来越用不惯实验室的1080TI了,实习的时候都是2个8块V100的GPU,回来只有2块1080TI,速度瞬间差了10倍。这里贴一下同一模型不同显卡的速度比较,供大家参考哈。

正好赶上去年CVPR Deadline,我就寻思着能不能租GPU来用用。作为学生,价格和卡的数量是我需要考虑的主要因素,因此我一开始选择的是中科类脑,类脑的卡真的很便宜,卡的数量多,而且使用越多越划算。不过,折腾了一个星期后,我放弃了。类脑是属于那种提交任务的方式,需要自己制作docker,超过500M的数据集还需要发邮箱让管理员操作。我自认为动手水平还可以,但愣是没搞定,最后实在没办法,我就准备跑一下官方的Demo,可笑的是官方给的demo都跑不起来。为了防止被定位,我这里就不贴图了。

后来,我就上知乎搜索,发现大家推荐的比较多的几个平台,一个是Featurize,还有一个就是AutoDL。经过对比之后我发现Featurize的卡是比较少的(当时都被租完了),而且价格稍贵一点。于是我就选择了AutoDL,和它们家客服聊了几句之后,就直接租了一个月3090。虽然一开始有点肉疼,但是用起来是线G,不用担心out of memory。下图是我的纪录。

至于使用体验就不用多说了,因为提供ssh的权限,所以理论上可以干任何事(vscode,pycharm,jupyter)。而且它们家的客服态度真的好,期间有一次突然连不上服务器,我立马去问客服,客服的回复是这样子的,完全不用担心吃亏有没有。

——————————————————————————————————————————————————

AutoDL的实例 30天不开机就会被释放,可以定期的用无卡模式开一下机,这样理论上可以永久保留数据。

个人喜欢用 Server酱 进行数据推送,这样可以实时的把实验结果推送到微信上,Server酱很方便而且是免费的。

每个月中可以参与抽3060显卡活动;而且各个节日都有活动,如果不是我目前不缺卡了(实验室新增了N多A100和3090),我真想次次都参与。

AutoDL目前有大量的GPU资源(3090就有400多张),这么多显卡足够跑任何模型了。

我还特地查了一下AutoDL的公司的法人是中科院计算所的山世光老师,做CV深度学习的应该没有人不知道山老师吧,个人感觉可以相信他们的实力。

有配好Tensorflow和PyTorch的环境,中途也可以关机暂停再开机继续用,之前用过几家一停止计费就会丢失数据,果断放弃了

网页里提供的功能比较多,除了基本的terminal和notebook,还有个在线版的VSCode,不用自己折腾远程连接了,当然要是想ssh或者自己用本地vscode连上去也是可以的

Colab毕竟是Google的,那么你首先要能连得上google,并且得网络稳定,要是掉线很可能要重新训练,综合来看国内使用体验不太好

如果要完成任务什么的,我安利一下我们实验室都在用的矩池云了。他们提供了GPU和CPU,在加个方面在相同硬件的情况下是非常优惠的,而且是不是会做一些大的活动。

如果老师原因申请高校版的话,还可以拿到远低于市场价的教育折扣。而且由老师给学生发专属时长。我们用的就是这个。

在安装软件的时候,有一个非常好用的apt、pip、conda国内镜像的切换脚本,一键就可以切换对应的国内软件源。

这个脚本现在已经开源了,github地址:matpool/matools。在其他云平台也可以直接使用了。

还可以保存环境,他的保存环境也比较高科技是一个snap的文件,如果训练完可以点一下这个保存并释放,要确保网盘空间足够。

发表评论

邮箱地址不会被公开。 必填项已用*标注