集微网报道 在chatgpt与sora的带动下,人工智能热潮持续不退,全球都在拥抱人工智能。作为全球应用最为普及的架构,arm亦成为ai得以运行的基石之一。近日,arm更新neoverse产品路线图,宣布推出两款基于全新第三代neoverse ip构建的新的arm neoverse计算子系统 (css)。其中,neoverse css v3是高性能v系列中的首款neoverse css产品,与css n2相比,其单芯片性能提高了50%;neoverse css n3更聚焦能效优势,与css n2相比,每瓦性能可提升20%。
neoverse css汇集了构成系统级芯片核心的关键技术,去年一经推出即受到云服务提供商、初创公司等的青睐,被大量应用于云计算、网络、数据中心基础设施当中。neoverse css v3与css n3作为新一代技术,具有更高性能和效率,可以满足更高的工作负载和总体拥有成本 (tco)的需求。
对此,arm 高级副总裁兼基础设施事业部总经理mohamed awad在日前举办的“arm 技术媒体沟通会”上指出,计算正变得越来越专用化,通用cpu已经不能满足需求。在基础设施领域,人们可以看到越来越多的厂商正在转型,朝向更加复杂的仓库级计算发展。这种趋势变得越来越明显,厂商关注的重点已不再只是芯片、服务器或者机架,而是整个数据中心。
在此前景下,众多大型科技企业开始基于arm平台构建新一代的系统和基础设施。英伟达、亚马逊云科技和微软等行业巨头都在从头开始设计系统,并且定制系统级芯片。“这是因为这些科技巨头更加了解自身的工作负载,他们有能力对系统的各个方面进行调优,包括网络、加速甚至是通用计算等。而arm独特的定位能够赋予yb体育官方的合作伙伴快速创建定制yb体育官方的解决方案的能力。同时arm强大的生态系统也受到头部云服务提供商和初创公司的信赖,愿意采用到云计算、网络、数据中心基础设施,以及ai等多种应用当中。”mohamed awad表示。据悉,microsoft azure cobalt cpu便是基于 arm neoverse css 所打造。
arm neoverse css让定制芯片变得更加简捷
在ai热潮推动下,越来越多科技巨头亲自下场定制ai芯片。首要原因是各大厂商希望优化芯片性能、寻求差异化方案。摩尔定律放缓背景下,以往依靠定律推动芯片性能与效益提升已经越来越难以为继,要想得到最佳计算性能,必须仰赖针对特定应用和数据集合的体系架构。特别是在ai大模型领域,不同厂商均有着不同的差异化需求,一体适用的yb体育官方的解决方案已不再适合。此外,降低成本也是各大厂商的现实考量。根据伯恩斯坦分析师stacyrasgon的分析,如果chatgpt的查询规模增长到谷歌搜索的十分之一,其最初需要大约价值480亿美元的gpu,每年还需要约160亿美元的芯片维持运营。
arm基础设施事业部产品yb体育官方的解决方案副总裁dermot o’driscoll强调,借助arm的合作式 ip 业务模式和计算子系统,能够支持头部企业对云计算关键工作负载的计算进行优化,同时以行之有效的方式来打造定制芯片。
2023年,arm推出neoverse css,让定制芯片变得更加简捷。neoverse css 配置、优化和验证了一套完整的计算子系统,从而使得yb体育官方的合作伙伴能够专注于,针对特定系统级工作负载塑造差异化竞争优势,如软件调优、定制加速等。新推出的css n3和css v3产品则是进一步的升级。css n3 的首个实例可以提供32 核,热设计功耗 (tdp) 降至 40w,可覆盖电信、网络和 dpu 等一系列应用;css v3 在单芯片上最多可扩展至 128 核,并支持最新的高速内存和i/o标准。
快速打造chiplet
ai蓬勃发展对芯片算力提出更高要求的同时,也推升了业界对chiplet(芯粒)等技术的研发与投入。研究显示,当5nm芯片的面积达到200mm2以上,chiplet方案成本将低于单颗soc,同时也减少了因芯片面积增加而带来的良率损失。除了成本和良率的优势,chiplet技术还带来了高速的die to die互连,使得芯片设计厂商可以将多颗芯粒集成在一颗芯片之中,实现算力上的大幅提升。越来越多厂商意识到,chiplet将是ai芯片实现算力跨越的破局之道。
dermot o’driscoll表示,芯粒已成为管理良率的常用机制,能让企业在单个芯片上利用到多种工艺节点。例如,使用较旧的工艺节点处理 i/o,同时搭配先进的工艺节点处理逻辑功能。企业也在努力寻找巧妙的方法来复用芯粒,但尤其是当他们将不同团队的设计组合在一起时,还是面临一些挑战。通用芯粒互连技术 (ucie) 是一项行业标准,旨在解决芯粒物理层兼容性的问题。arm和生态系统yb体育官方的合作伙伴正积极参与这个项目。协议层存在多种标准,包括 pcie、cxl 和 amba。arm 深入参与到 amba chi,引入芯片到芯片 (c2c) 的扩展功能。
而neoverse css 可以帮助用户快速打造chiplet,它能提供用户所需的所有接口,以便选择耦合自身的加速器。arm近期发布芯粒系统架构 (chiplet system architecture, csa),与20多家yb体育官方的合作伙伴共同努力,推动整个生态系统释放chiplet技术的潜力。
庞大生态系统支持
生态系统也是ai芯片设计中人们重点考虑的关键因素之一。arm 基础设施事业部营销副总裁 eddie ramirez称,arm的独特之处还在于拥有庞大的生态系统支持。arm 全面设计 (arm total design) 生态项目提供了一个生态系统,参与其中的yb体育官方的合作伙伴均致力于无缝交付基于 css 的定制芯片。arm 全面设计推出后短短四个月内,已经有20多家成员加入,包括新的eda和配套ip提供商,以及来自韩国、印度、中国大陆,以及中国台湾地区的芯片设计yb体育官方的合作伙伴。
eddie ramirez表示,arm正在与三家主要代工厂合作,以确保css 产品能在其先进工艺节点上进行优化。“定制芯片离不开可靠供应链的支持,arm可提供多样的技术和选择。arm 全面设计yb体育官方的合作伙伴正在打造多款基于css的soc。”eddie ramirez强调。