2024年9月8日

外电报道,GPU大厂英伟达 (NVIDIA) 现在正在向那些渴望使用其硬件和软件的对象,出租其自主研发的人工智能解决方案。这个被称之为“DGX Cloud”的云计算服务将内置其高性能人工智能硬件,包括目前供不应求的H100和A100 GPU算力。用户将能够借由英伟达自己的云计算基础设施或甲骨文 (Oracle) 的云计算服务来租用该系统。

报引导用英伟达DGX平台总监Tony Paikeday的说法指出,DGX Cloud在全球都可租用,但受美国出口管制的地区除外。而该云计算服务将在英伟达的云计算基础设施中提供,其中包括位于美国和英国的DGX系统,而DGX Cloud也将借由甲骨文云计算服务来提供。

英伟达3月GTC会议首次宣布了DGX云计算服务,随后宣布推出该服务。日前正式宣布提供该项服务,这是继该公司发布一系列云计算人工智能服务之后所宣布的最新计划。竞争对手Cerebras Systems于中东云计算提供商G42云计算服务安装人工智能系统,提供36exaflops算力。特斯拉 (TESLA) 也宣布生产Dojo超级计算机,搭载自研D1芯片,到2024年底可提供100exaflops算力。

DGX Cloud租赁计划包括使用英伟达云计算人工智能系统,每个服务器都有H100或A100 GPU和640GB GPU内存,可运行AI应用程序。英伟达目标是像工厂运行人工智能基础设施,输入数据材料后,输出数据用户可使用的可用资讯,更不用担心软件和硬件性能不足。

Paikeday强调,DGX Cloud满足关键需求,就是大型复杂生成式人工智能训练模型的多节点训练专用计算,企业还将获得深厚的技术专业知识,部署支持此类工作环境。DGX Cloud租赁价格为每月每个应用36,999美元,约是微软Azure ND96asr两倍。微软Azure ND96asr配备8个Nvidia A100 GPU、96个CPU内核和900GB RAM,每月费用为19,854美元,DGX Cloud基本价格包括AI Enterprise软件,提供大型语言模型和工具开发AI应用程序。

各界对英伟达人工智能硬件需求大增,因急于用生成式人工智能发展各种领域。OpenAI ChatGPT以聊天机器人展示人工智能多强大,医疗保健、保险和金融等市场都出现新应用。Paikeday指出,英伟达希望DGX Cloud吸引更多生成式人工智能客户和业务上云。

发表评论

邮箱地址不会被公开。 必填项已用*标注