聚焦COMPUTEX 2024:生成式AI时代下,GPU、CPU、NVLink、以太网的全面突破
any
发布于 2024-6-6 17:46:53
阅读 452
查看全部
2024年6月2日,Computex 2024大会盛大举行,英伟达CEO黄仁勋在此次大会上展示了英伟达在GPU、CPU、NVLink、以太网网络等方面的技术路线图。这次发布会吸引了无数科技爱好者和业界专家的关注,让我们一起来详细了解一下英伟达在这次科技盛会上的惊艳表现吧!
首先是英伟达产业链中备受瞩目的GPU,大会上英伟达CEO黄仁勋向大家展示了量产版Blackwell 芯片。并大方公布了未来三年的产品路线:「2025年将推出Blackwell Ultra;下一代 AI 芯片架构平台名为Rubin, 采用的HBM4芯片,预计将在2026年推出;2027年将推出Rubin Ultra」。
英伟达强调Blackwell系列芯片的推出将大幅降低训练大型语言模型(如1.8万亿参数的GPT-4)的能耗。回顾Pascal时代(大约2016年),生成每个Token能耗高达17,000焦耳,约相当于两个灯泡运行两天的能量,而生成一个单词大约需要3个Token,对应巨大的能量消耗。然而,Blackwell的出现改变了这一切,生成每个Token只需消耗0.4焦耳的能量,相比Pascal时代的Token生成能耗降低了约350倍。这意味着Blackwell将大幅提升推理优势,有望加速AI推理应用进一步落地。
在生成式AI时代,大模型训推带动AI算力需求增长,算力产业链中的显卡需求也随之增长。高级的算力显卡往往量少价高,好在算力租赁平台——算力云(SuanLiX)提供多种型号的算力显卡为有人工智能模型训练和推理需求的用户解决了燃眉之急,据悉算力云平台已在甘肃、福州、广东、香港区域,上架多款显卡包括RTX2080Ti、RTX3080、RTX3090、RTX4090、Tesla V100S、Tesla T4等。
6月1日起,算力云平台为预热618嗨皮节,对RTX3090、RTX4090、V100S与T4显卡进行了一波降价!最高下调幅度达到了20%,无论是按量计费(分钟)还是包月套餐都在降价范围,对于AI训练、AI绘图、深度学习等方面有需求的用户可前往算力云(SuanLiX)官网直接租赁。
除了GPU领域,英伟达还在CPU、NVLink和以太网网络的技术研究方面取得了重要突破。
大会上,黄仁勋宣布下一代CPU平台Vera CPU将于2026年推出。此外,第五代NVIDIA NVLink互连可扩展至576个GPU,为每块GPU提供1800GB/sec双向吞吐量。到2026年,计划推出第六代NVLink switch,达到3600GB/sec。
在以太网网络方面,黄仁勋宣布全球首款专为AI打造的以太网网络平台—— Spectrum-X已被业界广泛使用,可将生成式AI网络性能较传统以太网网络平台提升1.6倍。
为了满足业界对Spectrum性能的巨大需求,黄仁勋在演讲中宣布,英伟达计划每年都推出新的Spectrum-X产品,为客户提供更高的带宽、更多的端口、更加强大的软件功能集与可编程能力,不断提高领先的AI以太网网络性能。随着以太网技术进一步升级,未来十万卡、百万卡等大规模算力集群的持续发展将为以太网配套产业链带来投资机遇。
在Computex 2024科技大会上,黄仁勋再次向业界展示了英伟达的技术实力和发展蓝图,英伟达产品的快速迭代,将进一步扩大其领先优势,并促进人工智能大模型和AI应用的快速发展。
以上是算力云今日资讯分享,感兴趣的朋友可以在评论区参与互动!
|
|
|
|
|