2024年9月20日

上市仅两周的北交所算力第一股,并行科技,踩准算力的风口,有望接力北交所,成为下一个5倍大牛股!

最正宗的算力调度调优公司,背靠中科院,手持北龙,只要入网的算力它都能调用租赁出去,走的是轻资产路线

目前来看,算力调度主要负责算力需求侧和供给侧的匹配。需求侧来看,AI大模型带来了大量算力需求,同时应用端自动驾驶、人脸识别、智能制造等各类新兴业务对算力提出了灵活便捷、按需匹配的新要求。供给侧,多政策支持多元化算力供给,“东数西算”工程也提出了实现算力资源跨区域调度的需求。随着未来算力资源加速增长,算力调度需求也将随之激增。同时,AI大模型的复杂性以及高算力成本,取需提高GPU利用率释放算力,进而产生算力调优需求。

算力调度是算力建设新时代的必然趋势,我们测算2025年算力调度潜在市场规模有400亿元以上,算力调度产业链各环节有望充分受益。

华为光系统首席专家:当前全球智算需求每三个半月就会翻一番400G/800G与全光网发展研讨会近日在北京召开。华为公司光系统首席专家张德江表示,当前全球智算需求每三个半月就会翻一番,与此同时,算力基础设施建设高速增长,相关数据显示我国30多个城市正在或即将建设智能计算中心。

按2021年度收入规模排名,并行科技系中国第一大独立超算服务商及中国第一大通用超算云服务商。同时并行科技目前拥有约65万个超算云计算核心,与阿里云、华为云等头部企业处在同一梯队。

在其形成收入的CPU资源中,大约80%为自有算力设备资产,20%为外部接入,外部资源以各大国家超算中心资源为主。GPU资源中,外部接入的占多数,主要资源提供方为电信运营商和超算中心

根据北京超算中心官网介绍,2020年2021年、2022年,北京超算连续三年入围中国HPCTOP前100,连续三次获得“通用CPU算力性能第一名”。同时在2021年AIPerf500榜单中,北京超算10套AI算力系统上榜,获得总量份额第一名。2022年总投资29亿元的北京超算(二期) 启动筹备那么具体有多少GPU卡呢? 根据官方公众号所披露的信息,其现阶段拥有2万余张基于超算架构的大模型GPU算力卡,从今年7月起,还计划上线万余张。

北京北龙超级云计算有限责任公司(以下简称:北龙超云)成立于 2011 年,由中国科学院计算机网络信息中心和怀柔区国资委共同控股,是一家面向科学计算、工业仿真、气象海洋、新能源生物医药、人工智能等重点行业应用领域,提供随需供应的超级云计算服务提供商。

由北龙超云负责运营的北京超级云计算中心于2020年、2021年、2022年连续三年获得中国HPC TOP100排行榜“通用CPU算力性能第一名”。同时在2021年AI Perf500榜单中,北京超级云计算中心共计10套AI算力系统上榜,获得总量份额第一名。

并行科技终将成为上市算力服务/算力调度第一股,通用超算云业务占有率20%断层第一,第二阿里云10%,营收也是全国第一,遥遥领先!

继Meta开源了Llama 2后,智谱AI及清华KEG实验室也将ChatGLM2-6B模型开源并免费商用。据统计,国内已公开发布了80余个AI大模型,其中半数都将开源。大模型的“百花争艳”也让更多的企业加入到算力扩张、模型训练与创业的热潮中。

“大模型的出现让我们看到了一个新生产力的崛起。通过对大模型的研究,人类首次发现,可以让一部分的脑力劳动由机器替代,实现人类生产力的大幅提高。因此也带来了大模型算力需求的爆发式增长。”北京并行科技股份有限公司董事长陈健博士接受至顶网记者专访时这样表示。但他同时指出:“大模型的训练需要大量的计算资源,企业的资金投入几十亿到上百亿,因此在算力投入上要特别谨慎。大模型的训练是个典型的超算应用场景,采用超算的方式对企业来说更具性价比。租用算力方式比自建方式能让企业风险更低、现金流更充裕。

企业要做自己的大模型,首先要解决的就是大模型训练的基础设施问题——算力。企业自建算力好,还是租用算力好?陈健建议:“大模型对算力的需求极大,动辄十几亿,光电费就要几百万,企业采用租用算力是风险最小、资金利用最优的方式。”“据我们观察,在超算领域有90%是自建的,但大模型出来后自建的比例在明显降低。一半以上都在租用。”做大模型训练不仅关系到企业计算算力成本的问题,还关系到企业业务方向和企业资金周转效率的问题。从企业经营风险上看,陈健认为:“如果企业训练的模型是面向ToC领域,产品风险相对就比较大。如果是做面向ToB的大模型,一般能拿到用户端在算力方面的费用,这样风险会相对较小。如给银行做客服大模型,这种应用场景比较确定,风险也就比较小。”算力的利用效率也就是资金的利用效率。陈健表示:“超算领域大家拼的就是算力的利用率。如果企业大概确定自建算力的利用率能够连续5年达到或超过60%,那自建就没太大风险。在超算云领域,租用的利用率总体上能达到60%,是国内自建超算算力平均利用率的2倍。”从企业经营策略上看,“服务器的生命周期大概就是5年。如果采用购买服务器的方式自建,等于将5年的钱投入一次性支付。这种情况对企业尤其是初创企业的现金流是极大的考验。如果过早地将现金都套在高折旧的资产上,这对公司的经营会带来较大的影响,不划算。从另一个角度来看,初创企业的融资是一轮一轮进行的,越在早期,同样数量的融资额所占的股份比例就越大,股权融资成本高。这笔钱如果用来一次性支付5年的计算资源,这种做法并不明智。企业应把未来的钱花在今天的经营、业务增长上。”陈健这样分析道。“以并行科技为例,我们是一家提供超算的服务商,要满足大模型训练,在GPU或计算卡上的投入就是几个亿。我们测算了一下,购买1000张H800,按市场价,就要投入3亿资金。如此大额的投资我们也不能贸然投入。而是采用算力网络模式,和三大运营商合作,由运营商出钱购买算力,我们做总包运营,大家合作分成,来解决重资产这个难题。”

“因此,买不如租,大部分企业会选择租用的模式。企业在算力规划上还是要根据自身的发展情况。通用大模型发展非常快,算力烧钱的速度也非常快,都是以亿元为计。企业如果在没有融到足够的资金,还是不要采用自建算力的模式。”

市面上可选的算力租用方式无非就三种:云计算模式,采用公有云的方式;裸金属模式,也就是传统的,以物理机的形式交付;还有就是超算模式,用海量的GPU卡,通过业务调度的方式变成一个大的计算池,用户用的时候从中选择自己所需要的GPU卡,用完再释放掉这张卡资源,以便别人调用。“我们认为,采用GPU集群的超算模式更适合大模型的训练。”陈健解释道:“大模型的训练本质上就是一个超大的训练任务,比如在1000张(或更多)GPU卡上跑两三个月,就是一个典型的超算应用场景。”“云计算或者说云主机模式,就是一个GPU服务器分给很多用户共享,是海量的单台、单节点的共享,并且还是单节点内部的GPU卡资源的共享。可想而知,这个共享级别不足以支撑大模型训练需要成百上千张卡成功跑一两个月这样的应用场景。”

“采用GPU集群的超算模式是大模型训练较具成本优势的方式。用户只需对自己真实使用的GPU算力进行付费。而不是租了一年,调试要三个月,这三个月的调试期也要付费。”所以无论从算力对大模型训练场景的支撑能力,还是实际租用带来的使用体验,尤其是成本消耗上,超算都可谓是大模型训练的上乘之选。

提供超算的企业自己并不做模型,也就是不跟自己的客户进行竞争。”陈健认为这是对那些依靠训练大模型创业和提升企业竞争力的企业一种极大的保护。他表示:“像一些算力服务商,他们既提供算力又提供模型,也就会发生和自己的客户相竞争的局面。”“并行科技在商业逻辑上严格限制自己的行为范围,我们只做算力或者通过算力网络整合算力,做好平台,做好与应用的适配,做好应用执行时的值守,确保应用的稳定、正常运行,让整个训练过程顺利完成。”“此外,我们更重要的是要做好优化,让程序跑得快。例如,我们有个客户用500张GPU卡训练,通过计算优化,我们帮他提升了40% 的性能。”“我们主要通过技术服务、应用服务以及性能优化,帮助客户提升训练效率。我们最主要的优势体现在:一、确保用户有GPU卡可以用;二、通过技术服务让客户感到好用;三、通过算力优化降低用户用GPU卡的成本并提升效率。”

大模型爆发式增长,在需求强劲和相关产业政策催化的双轮驱动下,将迎来智能算力基础设施建设的大扩容时代。企业在看到市场前景的同时,也要考虑到产业风险和经营效率,做好顶层规划与技术积累,才能在机遇到来时既不错过,也不踏空。

并行科技代表了AI 算力出租最正宗的概念股,可以考虑合理和更高的估值,各种理性的推算最后都落后于现实的跳跃性发展

北交所今年诞生了三只巨龙曙光数创,液冷概念股,上半年涨幅8倍!鼎智科技,机器人概念,2个月涨幅5倍!锦波生物,胶原蛋白概念,上市后2个月3倍!目前还在走主升浪!上市仅两周的北交所算力第一股,并行科技,踩准算力的风口,有望接力北交所,成为下一个5倍大牛股!并…

发表评论

邮箱地址不会被公开。 必填项已用*标注