一球百科 - Good Luck To You!

英伟达最新AI芯片成本能耗降低25倍

tiger

英伟达发布新一代AI芯片,推理能力较上一代提升30倍 华略智库

英伟达发布新一代AI芯片,推理能力较上一代提升30倍。

华略智库。

我想向您介绍一个非常大的GPU,最高性能网络800Gb/s连接带宽,容量提高五倍。GB200 NVL72计算支架,液体冷却,最优能效,支架冷却能耗降低两倍。32000GPU的完整数据中心,新工业革命的AI工厂。

1.6T

昨晚的英伟达GTC大会展示了公司在AI算力硬件、软件生态、边缘智能等多个领域的成果,其中最核心的是英伟达发布了全新Blackwell架构,包括Blackwell GPU芯片,对比上一代H100,AI性能提升约5倍;以及GB200超级芯片,由一个Grace CPU和两个B200 GPU组成。总体有三大变化,并且其中两个将是大趋势:第一,【1.6T】:GB200将采用1.6T光模块,主板间通过第5代NVLink Switch连接,双向1.8T带宽,相对GH200翻一倍;假设网络架构相对GH200不变,则GPU:1.6T光模块平均比例和GH200一样为1:9。此前GH200的出货低于预期,所以英伟达对GB200寄予厚望,并刻意扩大GB200与B100/200单卡的规格差距,以提高客户采购GB200的意愿,从测试结果来看,GB200的性能是H100的7倍,而成本和能耗更低,因此GB200若持续上量,有望带动1.6T光模块需求放量。后续随着速率的提升,1.6T甚至更高的光模块将成为大趋势,而随着速率达到1.6T,传统的光模块结构已经跟不上性能要求,就必然要加入一些新技术,比如硅光、薄膜铌酸锂、LPO/CPO等,所以对于光模块产业而言,GB200是在加速新技术的渗透率提升,加速头部集中,跟不上技术迭代的将被淘汰。第二,【高速铜缆互联】GB200超级芯片在互联中GPU与NVSwitch采取高速铜缆互联(需要高速背板连接器),可实现大幅节约成本,超出了此前的预期,而外部则仍旧使用光缆互联。但这只是英伟达目前的方案,不代表行业未来的趋势就是这样,光模块和高速铜缆各有优势,选择哪一种取决于具体的应用需求、成本预算、传输距离和环境条件。在高性能计算和大规模数据中心环境中,光模块因其高速、远距离和抗干扰的特性而成为首选;而在短距离、成本敏感的应用场景中,高速铜缆则更为合适。所以一旦后续速率要求再更重要一点,那英伟达很可能又切回光链接。第三,【液冷】GB200使用液冷方案,其中GB200 NVL72 服务器提供 36 个 CPU 和 72 个 Blackwell GPU,并使用一体水冷散热方案,全部采用液冷MGX封装技术,成本和能耗降低25倍,液冷会是未来的一个趋势。

全部评论( 0
评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
猜你喜欢
随机推荐
最新发布