2024年9月20日

外电报导,英伟达(NVIDIA)现在正在向那些渴望使用其硬件和软件的对象,出租其自主研发的人工智能解决方案。 这个被称之为DGX Cloud的云计算服务将内含其高性能人工智能硬件,包括目前供不应求的H100和A100GPU算力。 用户将能够通过英伟达自己的云基础设施或甲骨文(Oracle)的云计算服务来租用该系统。

报道引用英伟达DGX平台总监Tony Paikeday的说法指出,DGX Cloud在全球都可租用,但受美国出口管制的地区除外。 而该云计算服务将在英伟达的云计算基础设施中提供,其中包括位于美国和英国的DGX系统,而DGX Cloud也将通过甲骨文云计算服务来提供。

英伟达在3月份的 GTC 会议上首次宣布了DGX云计算服务,随后宣布退出该服务。 日前正式宣布提供该项服务,这是继该公司发布一系列云端人工智能服务之后所宣布的最新计划。 而对此,竞争对手Cerebras Systems正在中东云提供商G42中运行的云计算服务中安装人工智能系统,该系统将提供36 exaflops的算力性能。 另外,特斯拉(TESLA)也宣布,开始生产 Dojo 超级电脑。 该超级计算机将搭载其自主研发的D1芯片,到2024年年底可提供100 exaflops的算力性能。

报道指出,DGX Cloud 的租赁计划包括使用英伟达的云端人工智能系统,该系统的每个服务器都有H100 或 A100 GPU 和 640GB GPU 内存,公司可以在其上运行 AI 应用程序。 英伟达推出该服务的目标是像工厂一样运行其人工智能基础设施,在输入数据作为原材料之后,输出的数据是用户可以投入使用的可用信息,当中客户不用担心中间的软件和硬件效能。

Paikeday 强调,DGX Cloud 满足了一项关键需求,也就是用于大型复杂生工智能训练模型的多节点训练专用计算。 如此,企业还将获得深厚的技术专业知识,来进一步部署和运营支持此类工作的环境。 而DGX Cloud的的租赁价格为每月每个应用36,999美元,这个价格大约是 Microsoft Azure ND96asr 价格的两倍。 Microsoft Azure ND96asr配备8个Nvidia A100GPU、96个CPU内核和900GB RAM,每月费用为19,854美元。 而DGX Cloud 的基本价格包括 AI Enterprise 软件,该软件提供对大型语言模型和工具的使用来开发 AI 应用程序。

另外,DGX Cloud 的租赁包括一个名为 Base Command Platform 的软件界面,以便公司管理和监控 DGX Cloud 使用工作。 Oracle Cloud 拥有多达512个英伟达 GPU 的群集,具有每秒 200 GB 的 RDMA 网络,并支持多个系统(例如 Lustre)。 而相较于DGX Cloud,虽然当前大型云计算服务供应商都有建置英伟达H100和A100 GPU,但与DGX Cloud不同,他们仅用于自行训练人工智能模型,并不提供客户来使用。

事实上,人们对英伟达的人工智能硬件产生渴望的原因,在于人们急于生成式人工智能来进行各项发展。 OpenAI 的 ChatGPT 以聊天机器人的形式展示了人工智能的强大能力,到现在包括医疗保健、保险和金融在内的市场正在出现新的应用。 因此,Paikeday指出,英伟达希望DGX Cloud能够吸引新的生成式人工智能应用客户和工作到我们及合作伙伴的云中。

发表评论

邮箱地址不会被公开。 必填项已用*标注