2024年9月21日

业界给壁仞创办人张文很多称号: “ 中国第一大猎头 ” (找了英伟达、海思、高通、 AMD 等高手加入)、 “ 融资机器 ” (累积募资 47 亿人民币)。这些称号的背后,更代表数以千计双眼睛在盯着看:花了三年时间的壁仞究竟会端出什么样的菜色?在 8 月 9 日的发布会上,壁仞给出答案。

壁仞在发布会上表示,正式发布首款通用 GPU 芯片 BR100 ,采用 7nm 工艺技术,号称世界上最大算力芯片, 16 位浮点算力达到 1000T 以上、 8 位定点算力达到 2000T 以上,单芯片峰值算力达到 PFLOPS 级别。

同时,壁仞也为这次的BR100发布会下了一个注解:标志中国企业第一次打破了此前一直由国际巨头保持的通用GPU全球算力纪录,中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。

在发布会上,壁仞公布在四个峰值算力对比上, BR100 都胜过国际厂商的最新旗舰产品,要用 7nm 工艺就能打造出超过国际巨头的 4nm 工艺产品。

壁仞的BR100对标的是英伟达采用4nm工艺技术打造的H100。英伟达的GPU之所以能制霸全球,强大的的CUDA生态系统绝对是重要关键。壁仞认为,初期要能做到兼容主流生态。

张文进一步表示,首款通用GPU芯片产品——BR100创出全球算力纪录,峰值算力达到国际厂商在售旗舰产品3倍以上,创下国内互连带宽纪录,还是国内率先采用Chiplet技术、率先采用新一代主机接口PCIe 5.0、率先支持CXL互连协议的通用GPU芯片。他也强调指出,BR100能实现领先算力的关键,是最底层自主原创的芯片架构。

对于BR100的诞生,张文以“几十个人常常好几个月都睡在办公室,生活就是为了创造芯片。”来形容这一段岁月。

除了BR100通用GPU芯片之外,壁仞同时也发布了自主原创架构——壁立仞创造的OAM服务器——海玄,以及OAM模组——壁砺100、PCIe板卡产品——壁砺104,以及自主研发的BIRENSUPA软件平台。

在发布会上,壁仞科技联合创始人、 CTO 洪洲,详细介绍了原创架构 —— 壁立仞。洪洲说,壁立仞架构以数据流为中心,对数据流进行深度的优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得 BR100 芯片在给定的工艺下实现了性能和能效的跨越式进步。

另外,洪洲也介绍BR100采用了Chiplet设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑。此外,通过缩小单个计算芯粒的面积,可同时提升产能与良率,进而极大地降低硅片的成本,支持更灵活的产品策略。

在发布会上,也介绍了BR100系列的另一款产品BR104。壁仞号称,该款芯片同样基于壁立仞架构,拥有1个计算芯粒,性能约为BR100的一半,超越了国际厂商的在售旗舰产品。

洪洲指出,“Chiplet设计让我们可以通过一次流片,同时得到两种芯片,加快了迭代速度,同时覆盖不同层级的市场。”

壁仞联合创始人、总裁徐凌杰也和浪潮信息副总裁、 AI&HPC 产品线总经理刘军共同揭幕 OAM 服务器 —— 海玄。

据介绍,海玄服务器可以提供高达8PFLOPS(8000万亿次每秒)的浮点峰值算力,超过了此前的任何一台8卡加速计算设备的能力。

与此同时,壁仞科技还发布了基于BR104的主流产品壁砺104,基于标准PCIe形态,功耗控制在300W以内,其形态较为紧凑,部署广泛、适应性强,可以适配多种2-4U的服务器,与客户现有的基础设施做到高度的兼容。

徐凌杰介绍,从芯片到板卡模组到服务器,以壁砺100和壁砺104为底座,壁仞科技形成了一条完整的数据中心加速计算产品线已经对部分用户开放了邀测,即将量产出货;海玄OAM服务器目前正在进行紧锣密鼓的内部测试,预计今年第四季度开放邀测。

除了研发大算力芯片之外,也提供软硬一体的解决方案。壁仞科技联席CEO李新荣介绍自主研发的BIRENSUPA软件平台,该平台构建在BR100系列产品的底层硬件之上,由驱动层、编程平台、框架层、应用解决方案构成,支持各类应用场景。 BIRENSUPA编程平台位于软件栈的中心位置,包括BIRENSUPA编程模型、加速库、工具链、编译器等组件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

这个国庆长假房子卖得最好的城市,成交量大涨73%,但有楼盘房价从3万/平卖到2.1万/平……

可可爱爱!萌娃花式表演学青会会歌。“炫舞律动 青春遇见” 首届学青会会歌手机短视频创作大赛正在进行!…

炫舞青春 ,飞扬!广西大学啦啦操队的同学们“舞”力全开!用热情昂扬的姿态为首届学青会助力!“炫舞…

发表评论

邮箱地址不会被公开。 必填项已用*标注