2024年9月8日

11月7日,OpenAI正式发布大模型最新版本GPT-4 Turbo,并推出定制化GPT“GPTs”,以及用于收录定制化GPT的“GPT Store”。海外大模型迭代进度屡超预期,国内大模型也加快发展步伐,百度于10月17日发布文心大模型4.0,相比3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。AI大模型发展持续加速背景下,对高端智算资源的需求呈指数级增长,算力租赁行业进入蓬勃发展期。

算力需求贯穿大模型训练、微调、推理整个周期,训练侧方面,根据国泰君安证券推测,假设GPU利用率为35%,共训练90天,训练GPT-3需要371片A100,GPT-4需要165344片A100,增长了大约445倍。推理侧方面,西部证券表示,当模型参数增长至万亿级且具有多模态能力,能承担更多生成、分析等任务时,将吸引更多用户,长期来看,预计未来ChatGPT推理侧A100需求将超过70万张。

面对大幅增长的需求,高端GPU算力成为稀缺资源。11月14日,并济科技公众号发布通知,由于高性能运算设备持续涨价,A100算力资源持续紧张,即日起A100算力服务收费拟上调100%。有券商研究机构表示,美国对高端GPU出口中国的禁令加剧令高端GPU资源愈发稀缺,硬件成本上涨已传导至算力租赁报价,算力租赁有望迎来一波“涨价潮”。

国盛证券认为,短期内,算力供需两侧将出现阶段性失衡,部分先发优势的公司已有一定规模的算力储备,在手算力的价值有望因稀缺性提升。目前A股上市公司中已有多家高调宣布进军算力租赁业务,其中恒润股份(603985.SH)凭借多年经营的高端GPU供货渠道,以及对行业需求的提前预判,超前布局高端GPU智算资源。根据恒润股份对外披露的信息,截至10月中旬公司在手算力约3000P,英伟达H系列高端GPU货源稳定,持续到货中,预计到年底达到6000P,进一步提升公司高性能算力交付能力。

2023年10月,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门联合发布《算力基础设施高质量发展行动规划》。行动计划重点围绕计算力、存储力、运输力以及行业应用等四个方面制定了六项重点任务,配套提出四项保障措施,并明确了算力基础设施高质量发展指标。

行动计划提出,到2025年我国算力规模超过300 EFLOPS,智能算力占比达到35%。自2022年2月“东数西算”工程正式全面启动以来,国内多地政府已经出台算力规划,且三大运营商也在加速筹备智算中心建设。9月26日,恒润股份控股的子公司上海润六尺承建的“东数西算”芜湖集群(润六尺)智算中心完成首期1000P算力建设,成为国内首个正式交付并投入运营的千P级智算中心。

据悉,该项目基于英伟达H800和A800显卡,由润六尺、服务器厂商、运营商等多方合作建成。根据润六尺与芜湖高新技术产业开发区管理委员签订的《战略合作框架协议》内容,芜湖智算中心整体规划建设40000P以上算力,将为通用人工智能模型的训练和推理、生命科学、影视渲染、区块链、云游戏、自动驾驶等各行业提供算力服务,液冷智算中心产业园等项目也在陆续规划当中。

据悉,目前OpenAI已在开发下一代人工智能模型GPT-5,对数据、资金、算力的需求将进一步增长。英伟达也于11月14日发布了最新的H200芯片,性能较H100提升约60%-90%,以应对日益增长的智算需求。目前高端算力紧缺的局面下,自建大规模算力集群的难度与门槛越来越高,租赁算力的模式成为大模型企业获取高性价比算力的不二选择,算力租赁行业有望持续高速增长。

发表评论

邮箱地址不会被公开。 必填项已用*标注