2024年9月20日

如果要从半导体行业的角度总结2022年下半年和2023年上半年,那就是为个人电脑、智能手机和服务器生产了太多的CPU,而为数据中心生产的GPU却不够多。或者说,是全球最大、最重要的芯片代工厂——台积电没有做到这一点。对于台积电近来的产能安排和资本投入,机构Thenextplatform做了分析。

该机构认为,今年,全球可能会购买100万到200万个数据中心GPU,但英伟达今年显然只能生产50万个最先进的“Hopper”H100设备,这受到了CoWoS 2.5D封装技术的限制。在过去的十年中,这种技术一直与用于GPU和其他计算类型的HBM堆叠内存一起使用。因此,即使收入和盈利持续低迷,每个制造工艺节点的成本越来越高,台积电也不得不尽力而为。

在截至9月的第三季度,台积电的收入下降了14.6%,为172.8亿美元,净利润下降了28.1%,为66.6亿美元。各种IT渠道仍在烧掉客户端设备的CPU和GPU产能,超大规模企业和云计算建设者也在消化2022年收购的数百亿美元的服务器和存储设备,现在只购买他们需要的东西,因为他们在等待下一代设备和可能从明年开始的另一个重磅投资周期。

随着生成式人工智能热潮的兴起,每个人都在将数据中心的部分服务器、存储和交换预算转移到成本更高、战略意义更重要的人工智能训练和推理系统上,而且在经历了今年的恶性通货膨胀之后,这种热潮还没有很快停止的迹象。因此,GPU和任何能像GPU一样进行矩阵数算的东西几乎都价值连城,因为在这个需求旺盛而供应有限的时期,各家公司都在想方设法将生成式人工智能功能融入其应用中。

在这种情况下,台积电可以对其先进的芯片蚀刻和封装能力收取更高的费用,但不足以抵消其他部分业务的下滑。台积电与英伟达不同,英伟达几乎可以对工厂生产的任何GPU收取任何费用。

但最终,随着产能限制的缓解,供应将赶上需求,价格也将趋于正常。但今年不会,即使是英伟达将其CoWoS产能翻倍并力争在2024年前进一步提高,这种情况也不会发生。

台积电必须应对其工作中的诸多矛盾,其中之一就是必须进行大量的研究、开发和资本投资,以确保能不断推动半导体技术的发展。而当业务放缓时,就像最近几个季度那样,有时是由于其无法控制的原因,有时是由于很难规划像2022年底GenAI那样的繁荣,公司就必须做出大量决策,决定何时削减资本支出,同时又不能让自己陷入困境。这是因为台积电的客户能从供应短缺和高需求中获得的好处要比它多得多。英伟达就是一个很好的例子。

在九月份,台积电真正收回了资本投资的缰绳,只花费了71亿美元,与去年同期相比减少了18.9%,与2023年第二季度该公司在工厂、蚀刻设备等方面花费的81.7亿美元相比,连续增长了13.1%。台积电首席财务官在与华尔街分析师的电话会议上表示,台积电预计2023年全年的资本支出仅为320亿美元,其中70%用于最小节点(目前为5纳米及以下)的先进芯片制造设备,20%用于较大节点(12纳米至28纳米)的专业技术,约10%用于封装、测试和掩膜制造设备。这意味着2023年第四季度的资本支出将约为68亿美元,下降32.7%。

第三季度是台积电首次销售基于3纳米工艺的产品,该节点已占收入的6%,即刚刚超过10亿美元。采用5纳米工艺蚀刻的芯片带来了63.9亿美元的收入,占总收入的37%,而7纳米工艺仍占收入的16%,即27.6亿美元。所有其他工艺,从12纳米一直到250纳米,带动了其余70.8亿美元的销售额。所有这些较老的节点都有很大的用武之地——英特尔忘记了这一教训,因为它是一家几乎只有一个客户的代工厂,而且它总是需要在CPU的竞争中处于领先地位。

“N3已经开始量产,良率很高,在HPC和智能手机应用的支持下,今年下半年我们将看到强劲的增长势头。”台积电首席执行官魏哲家在电话会议上解释说,“我们重申,在2023年,N3将占我们晶圆总收入的中等个位数百分比,我们预计在2024年,在多个客户强劲需求的支持下,N3将占更高的百分比。”

请记住,台积电所说的“HPC”是指任何类型的高性能芯片,可以是PC或服务器CPU、GPU,也可以是网络ASIC。台积电并不是指专用于HPC仿真和建模或人工智能训练或推理的ASIC,尽管这些当然也在台积电HPC定义的范围之内。3纳米节点将是一个持久的节点,N3E刚刚通过资格认证,N3P和N3X工艺的进一步改进正在进行中。N5节点已于2020年第三季度投入生产,这只是为了让你了解这些节点在该领域能存在多久,而且它才刚刚成为主要的创收来源。当然,N7节点正处于衰退期,但也会在产品组合中存在很长很长时间。

与英特尔18A一样,台积电N2将采用纳米片晶体管结构,并将提高晶体管密度和能效。对于推动业务发展的智能手机和高性能计算应用,魏表示,在开发和生产周期的相同点上,N2的关注度达到或超过了N3的关注度。N2的背面电源轨辅助技术将于2025年下半年推出,并于2026年投入生产。

该机构表示,至于2025年谁将在工艺上领先,魏哲家对英特尔18A与台积电N2之间的对决不屑一顾。

“我们不会低估或轻视任何竞争对手,”魏说,“尽管如此,我们的内部评估显示,我们的N3P技术的PPA与竞争对手的18A技术相当,但上市时间更早,技术成熟度更高,成本也更低。事实上,让我再重复一遍,我们的无背面功率2纳米技术比N3P和18A都更先进,在2025年推出时将成为半导体行业最先进的技术。

台积电在2023年第二季度电话会议上没有透露人工智能训练和推理工作负载在其收入中的占比。但如果人工智能收入和台积电HPC收入之间的比例是一致的,那么它的收入应该只接近10亿美元。在我们看来,这个数字似乎不高,但这或许恰恰说明了像英伟达和AMD这样的公司如今能从GPU销售中获取多少利润。

如果你能以几百美元的价格为英伟达或AMD制造一个计算引擎,并以几千美元的价格添加HBM内存,然后英伟达或AMD能以3万美元的价格出售整套设备,再将这些计算引擎转化为包含大量CPU计算、CPU内存、闪存和网络的系统,或许还能获得2倍的销售额,这将成为一门非常大的生意。因此,台积电10亿美元的人工智能训练和推理芯片销售额,在最终用户层面可以膨胀到数百亿美元的硬件支出——即使这些最终用户是超级8强或10强或其他公司中的超大规模企业和云构建商,他们可以从英伟达和AMD等公司获得大幅的批量折扣。

该机构最后分析,也许台积电及其下游芯片合作伙伴和更下游的合作伙伴可以采取新的短期战略:买得越多,付出的代价就越大。在这一点上,说那些需要20000个GPU的人应该比那些只需要200个甚至2000个GPU的人支付更多的单价,就像说他们应该支付更少的单价一样“合乎逻辑”,而IT市场几十年来似乎一直相信这一点。

发表评论

邮箱地址不会被公开。 必填项已用*标注