英伟达「核弹级」GPU A100不敌AMD？比起算力CUDA才是核心武器

AMD自从进军GPU领域后，一直想要挑战一下英伟达在GPU市场的领先地位。周一，AMD发布了最新一代数据中心GPU Instinct MI200加速器，声称其最高性能是英伟达A100 GPU的4.9倍。但Reddit网友并不买账，他们认为AMD在人工智能方面所做的工作比英伟达少得多，尤其是难以和CUDA抗衡这一点。

从去年下半年到今年8月，英伟达市值一路攀升，创下5080亿美元的记录，位居半导体行业第二位，而英伟达联合创始人、CEO兼总裁黄仁勋的身价也涨至190亿美元。

该芯片是基于英伟达的Ampere图形架构，旨在通过实现更好的实时数据分析，帮助企业和政府实验室更快地做出关键决策。

今年4月的NVIDIA GTC 2021大会上，专攻GPU的英伟达推出了基于Arm架构的中央处理器（CPU）——Grace，用于大规模人工智能和高性能计算应用。

同是去年11月，AMD曾经发布过专为机器学习和高性能计算优化的GPU架构：CDNA，采用7nm制程和第二代Infinity架构。

而在今年11月8号的发布会上，AMD推出全新的CDNA 2 GPU架构和MI200 Instinct图形处理器，要与英伟达的A100芯片一较高下。

除了采用了最新的第三代Infinity架构以外，MI200芯片也将包含多达580亿个晶体管，比Nvidia的A100中542亿个晶体管略多。

由于AMD的MI200是通过自家的ROCm来支持TensorFlow、PyTorch和ONNX等机器学习框架，并没有CUDA，所以在可用性上，还需要留一个问号。

但AMD的GPU一直受人诟病的，并不是其性能，而是配套生态太过难用，连数据科学家和机器学习工程师都需要花不少时间去配置环境，新手小白更是难以上手。

爱的是终于有开源的项目来挑战CUDA了，恨的是ROCm问题实在太多，不支持Windows，不支持MacOS，Linux目前官方也只是选择性地支持。

不过有网友表示，最新版本其实已经可以支持GFX1030架构了，也就是RX6800、6800XT、6900XT。

要问ROCm官方为什么不多适配一些显卡，原因可能有很多，测试经验不足，没有人力去测试太多显卡等等。

如果买英伟达的GPU，马上就可以编写和运行深度学习的代码，而如果用了AMD的GPU，代码能不能跑起来都是不确定的。

比如你有一张RX580，那么首先就需要了解哪些主板和CPU支持PCIe Atomics，如果不支持的话设备都无法正常加载。

然后是安装3.5.1版本的ROCm，没错，对GFX803架构的显卡来说，新版本的ROCm反而有bug没被解决。这会导致使用TenserFlow和PyTorch时卡死，或者loss变成NaN。

AMD仍然有很长的路要走，尤其是在软件生态的适配和优化上，这注定是一个繁琐费时的工作，可能还需要几代才能稳定下来。

对此，有网友评价道：「英伟达是一家为其软件制造硬件的软件公司，而AMD是一家为其硬件制造一些软件的硬件公司。」

毕竟，AMD如果能给出CUDA以外的另一个选择，对机器学习和深度学习的工作者和爱好者来说，绝对是一种福音。

发表评论取消回复

Related News

You may have missed

发表评论 取消回复

Related News

公司快评｜算力租赁概念股汇纳科技涨价公告发微信公号后“秒删”股价仍涨停封板微信公

都是可以先用后买

You may have missed

让用户可以发现、分享和协作各种有价值的GPT集合

用户可以发现、分享和推广最好的GPT模型

公司快评｜算力租赁概念股汇纳科技涨价公告发微信公号后“秒删”股价仍涨停封板微信公

发表评论取消回复