2024年9月20日

从阿里云、谷歌云和甲骨文云等云平台的官网可以看出,用户可以通过其租用英伟达A100、英伟达V100、谷歌TPU等显卡与人工智能加速处理器。此类服务一般根据硬件性能或使用时长等方式定价。近日英伟达DGX云的推出,将AIGC云算力推入新阶段。

3月,英伟达在其2023年开发者大会上宣布推出DGX云:通过英伟达与微软云(Azure)、谷歌云(GCP)和甲骨文云(OCI)合作,企业通过一个浏览器就可以按月租用英伟达DGX AI超级计算机。DGX云是世界上第一台云中的AI超级计算机。DGX AI超级计算机配有8个H100 GPU模组,H100配有Transformer引擎,旨在处理ChatGPT类大模型。8个H100协同工作,效果如同一个巨型GPU。

我们认为,通过与云平台合作,将GPU等硬件计算服务以租用的方式,开放给广大企业,英伟达DGX云并非AIGC产业首例,但由于DGX AI超级计算机的杰出性能,DGX云将AIGC云算力产业推向了更高的起点。

在报告《Web3视角下的AIGC算力进化论》中,我们比较了加密资产挖矿和AIGC产业的异同点,提出,

1)AIGC(Artificial Intelligence Generated Content,人工智能生成内容)产业耗电量可观,并将快速提升,大约会在1.6~7.5年间超过当前比特币挖矿产业耗电量,主要驱动因素是GPT类大语言模型在模型参数、日活和模型数量上的高速增长;

2)和比特币挖矿类似,AIGC产业由算力驱动的内容处于高强度竞争中,参与者只有持续、快速生产出高质量内容,才能保证自己获取到的用户注意力不下降。

另外,并非巧合,我们发现,加密资产挖矿历史上也出现了云算力这一业态,它代表了算力生产商在销售算力硬件整机外,将算力推向市场的终极形态。

与有限、特定对象联合挖矿。2021年6月,比特币矿机厂商嘉楠科技宣布,开启在哈萨克斯坦的联合挖矿业务。公司董事长兼CEO张楠赓表示相信联合挖矿业务有利于增加公司财务收益,拓展业务范围和客户群,整合行业资源;在比特币下行周期中,可以盘活公司的矿机库存,减少公司经营的波动风险;在比特币上行周期中,有利于公司拥有库存储备,能够及时满足新增的时长需求。

向无限、不特定对象售卖云算力。2018年12月,加密资产矿机厂商比特推出了云算力服务平台“比特小鹿”,用户无需购买矿机硬件,也可以购入挖矿算力,获得挖矿收入。对用户而言,比特小鹿的云算力套餐的性质接近于定期理财产品。

不论是AIGC云算力,还是加密资产云算力,我们认为,它们都是采用了“化整为零”的方式,赋能产业链各方:

1) 对上游算力生产商而言,在算力硬件进入淡季、库存趋增时,能通过售卖云算力的方式,平滑收入的波动,并为旺季储备“有生”力量,及时满足回弹的市场需求;

ChatGPT所需算力可观。不考虑与日活高度相关的推理过程所需的算力,仅考虑训练过程,根据论文《Language Models are Few-Shot Learners》的测算,ChatGPT的上一代GPT-3 (1750亿参数版)所需的算力高达3640PF-days(即假如每秒做一千万亿次浮点运算,需要计算3640天),已知单张英伟达A100显卡的算力约为0.6PFLOPS,则训练一次GPT-3(1750亿参数版),大约需要6000张英伟达A100显卡,如果考虑互联损失,大约需要上万张A100,按单张A100芯片价格约为10万元,则大规模训练就需要投入约10亿元,非头部厂商难以承担。而GPT4的模型参数更大,训练的标识符更多,所需算力更为可观。

4月5日,ChatGPT官网停止Plus付费项目的购买。在升级界面,OpenAI表示“因需求量太大暂停了升级服务”。这在一定程度上反映出,即便是OpenAI这样的头部模型厂商,也难以承载用户对ChatGPT的狂热需求。

摩尔定律中,集成电路上可容纳的元器件的数目,约每隔 18-24 个月便会增加一倍,性能也将提升一倍。

继摩尔定律后,英伟达 CEO 黄仁勋提出黄氏定律:每 12 个月 GPU 性能翻一倍,且不受物理制程约束。

根据OpenAI测算,自2012年至2018年,用于训练AI所需要的算力大约每隔3-4个月翻倍,总共增长了30万倍(而摩尔定律在相同时间只有7倍的增长),每年头部训练模型所需算力增长幅度高达 10 倍,整体呈现指数级上涨。

云算力能让AIGC大模型厂商无需购买英伟达A100显卡等硬件,而直接按需租用云算力平台提供的算力,这使得初创企业或非头部模型厂商也能尝试进入AIGC的领域。如果AIGC大模型厂商愿意让渡更多资源,还可以更深入地与云平台合作。这方面的典型案例是微软云与ChatGPT开发商OpenAI的合作,两者的合作没有停留在算力租用上,而深入到了股权与产品的融合上:

股权上,根据《财富》杂志报道,在OpenAI的第一批投资者收回初始资本后,微软将有权获得OpenAI 75%利润,直到微软收回投资成本(130亿美元);当OpenAI实现920亿美元的利润后,微软的份额将降至49%。与此同时,其他风险投资者和OpenAI的员工,也将有权获得OpenAI 49%的利润,直到他们赚取约1500亿美元。如果达到这些上限,微软和投资者的股份将归还给OpenAI非营利基金会。

产品上,除了让搜索引擎必应(Bing)整合ChatGPT,2023年1月,微软宣布推出Azure OpenAI服务,Azure 全球版企业客户可以在云平台上直接调用OpenAI模型,包括 GPT3.5、Codex 和 DALL.E模型,其后不久,微软宣布将GPT4整合到了新必应和Office升级版Copilot上。

对于IDC企业而言,构建云算力池的成本主要是购置显卡,而算力定价也与显卡成本紧密相关。伴随近期AIGC的放量,计算型GPU价格上涨明显,尤其在实际商用中,仍以英伟达系列产品为主。据产业调研了解,目前云算力尚处于试水阶段,主要模式为:

面向体量稍大且训练需求频繁的客户,往往采用买断独占模式,即GPU只提供给特定客户使用,往往需签订长约。此时对于IDC企业而言,主要提供相关配套机柜、散热、供电等服务。

面对中小客户,签约时间较短,中间会有空档期,但价格随行就市。若未来GPU价格持续走高,该部分租金价格也会走高。对于IDC企业而言,初期的算力投入相对固定,若租金涨价则回本周期将大幅缩短。

因此,在当前建立AIGC的算力资源,可视同对未来建立的“看多期权”,无论GPU、算力租金的价格都将具备弹性。

由于AIGC云算力可以在一定程度上“复用”云计算产业链资源,伴随着AIGC云算力需求的爆发,云计算产业链迎来第二增长曲线。以IDC(Internet Data Center,互联网数据中心)为例,它利用机房设施,以外包出租的方式,为用户提供以下服务:1)放置、代理维护、系统配置及管理服务器等互联网或其他网络相关设备;2)出租数据库系统或服务器等设备及其存储空间;3)代理租用通信线路和出口带宽等资源。从光环新网、奥飞数据等上市公司近年来发布的定增预案中,可以看出,投建IDC花费可观,为单个标准机柜募集的投资额约为18万元,项目建设期长达1~5年,投资回收期长达6~8年。在AIGC算力需求平地而起后,我们预计,其有望为IDC运营商缩短投资回收期,提升上架率,深化第二增长曲线。

何种AIGC云算力服务商能赢得新的“军备竞赛”?相较于可能新入局的厂商,我们认为,从上游资源看,能获得低价电力、GPU硬件设备、客户等资源的IDC服务商具备优势;从下游看,由于互联网企业、金融企业等都可能参与到AIGC的竞争中来,而这些客群与IDC服务商的高度相似,我们认为IDC服务商同样具备优势。因此,短期看GPU和客户是核心资源,中长期看,电力价格将直接影响计算成本,在中西部地区有布局或引入绿电本地消纳的企业将有优势。

此前,受产能扩张、出租率下降因素的影响,IDC板块已沉寂多时,市场预期较低。AIGC的爆发在初期对机柜出租的影响也并不大,但随着应用的爆发和AI云算力商业模式的出现,IDC板块有望迎来新的增长点。通过布局AI云算力,IDC企业获得增值服务的抓手,依托既有客户资源,转型云算力。

综上所述,AIGC云算力的核心资源在于:GPU、客户和电价。按此逻辑建议配置第三方IDC服务商:光环新网、奥飞数据、数据港、世纪华通、润泽科技、科华数据、宝信软件等。

AIGC技术发展不及预期。例如,对算力需求较大的“图生文/图生图/图生视频”“文生视频”等多模态技术发展尚处于早期,进度可能不及预期。

地缘冲突加剧。例如,美国禁运A100等高端AI可用显卡,对我国发展AIGC产业造成了一定的掣肘。

本文节选自国盛证券研究所于2023年4月7日发布的报告《AI云算力——AIGC的看多期权》,具体内容请详见相关报告。

发表评论

邮箱地址不会被公开。 必填项已用*标注