自 2011 年以来,多家芯片开发商先后加入 Arm 服务器芯片的研发大营,但几乎都是高起低落,不见踪影者居多。Applied Micro 被 Macom 收购拆分;英伟达、三星、博通终止了相关业务;高通因等多重压力而被迫放弃服务器芯片研发。但是 Arm 阵营在服务器市场可谓屡战屡败,屡败屡战。
就在今年 3 月,Ampere 发布了“首款云原生处理器”Ampere Altra,拥有 80 个 64 位 Arm 处理器内核,性能超越 AMD 和英特尔的同级别产品。不到三个月,Ampere 又快速进行了迭代,披露了 Ampere Altra Max 的信息,该产品将拥有 128 个内核,能够为客户提供优化的云计算处理器,实现单芯片整体性能以及机架内核部署密度的最大化。
“一年前,Arm 架构在服务器市场的技术、性能、软件可能处于劣势,但现在这些已经不是主要问题,未来一两年,基于 Arm 架构的服务器芯片发展会非常快。”Ampere 产品高级副总裁 Jeff Wittich 在接受与非网采访时表示,“我们看到,亚马逊也基于 Arm 架构推出了相关产品,限制条件没有了,未来一两年会有很大的发展。”
Ampere 产品高级副总裁 Jeff Wittich
快速迭代升级,不仅高性能而且满足安全、低功耗
面对未来云原生高性能、高扩展性、高能效的三大需求,Ampere Altra Max 处理器的性能进一步提升,内核由 80 个提升到 128 个。Jeff 介绍,采用 Ampere Altra Max 的应用将充分发挥横向扩展和弹性云架构优势。它兼容 Ampere 80 核的 Altra 处理器,并支持双路服务器平台。此外,它还将为行业带来最高的插槽级性能和 I/O 可扩展性。插槽兼容支持 8 路 DDR4-3200 内存通道,最多达到 128 条 PCIE Gen 4 通道。
在高端应用中,随着芯片核数的增加,功耗也会随之提高,Ampere 也在想办法平衡用户对高性能、低功耗的需求。Jeff 解释,“我们的策略是给客户提供多种 SKU 产品,他们具有不同的优势,有的产品主频更高,性能更好,有的产品功耗表现更好。在实际应用中,有些应用更看重低功耗的优势,我们有一款 32 核 CPU,主频做到 1.7GHz,在不需要风扇和冷却的情况下,功耗最低 45 瓦,主要用于服务器的边缘计算。
随着全球的数字化转型,云上业务的安全性也越来越受到关注,尤其是底层服务器芯片也容易受到攻击。在安全方面,Jeff 强调,“我们的产品符合所有 Arm 在安全方面的标准,而且我们会做安全研发分析,确保服务器产品的安全。我们有专门的安全团队来监控产品面临哪些威胁,并且与整个生态系统以及相关专家合作,确保我们开发的处理器避免出现安全漏洞。”
同样采用64位内核,如何让性能超越“前贤”?
其实基于 Arm 做服务器芯片的公司不在少数,国内外不乏华为、飞腾、亚马逊等一众公司,但是能将性能超越英特尔的寥寥无几。Ampere 的产品如何做到了性能的飞升?Jeff 解释,“Arm 是最基础的技术,不同的 CPU 开发公司产品的灵活性非常大,不同公司在基于 Arm 开发产品,灵活性体现有所不同,着力点也不一样。我们主要侧重云端,增加内核数量,提高效率,保证这些内核在应用时保持很高的一致性。”
一般,随着内核的增加,效率随之提高,但是 AMD、英特尔的产品折损也在随之增大,Ampere 产品的神奇之处在于,随着内核增多,效率提高,性能呈线性上升。Jeff 介绍,“第一,关于内核技术包括其所占面积,我们研发了相关技术,选择合理的性能和合理的功能来保证在同样预算条件下实现内核和性能的线性增加。除了核数增加,性能提高之外,我们还做了很多其他关于带宽、网格、延迟、IO 扩展、内存的优化,从而保证内核能够保持高性能运行。综合这些因素,跟竞品相比,我们的性能更卓越,可以更好地平衡功耗和性能的关系。”
前期“功课”准备充分,从研发到应用一路很“遛”
市场上的云供应商众多,尤其是在中国市场,厂商更多看重的是产品的性价比,Ampere 半年之内推出两款产品,也能说明产品受欢迎程度很高,Altra 处理器和 Altra Max 是否也是通过性价比来赢得用户的青睐?在 Jeff 看来,客户在选择 CPU 时经常参考三个标准:性能、功耗、总体拥有成本。我们在这三个指标上都非常领先,而且综合考虑性能和功耗,我们的价格也非常优惠。举例来看,有一类 SKU 和 AMD 的同类产品相比,总体成本低 14%左右,比英特尔的优势就更明显。Altra Max 处理器的内核数量增加了 60%,而且功耗更低,综合起来性价比更高。
关于中国的市场应用以及遇到的问题,Jeff 也坦然介绍,“中国市场发展迅速,是 Ampere 的重要的市场,我们已经和中国很多大型的云服务商有密切的合作。由于我们相关的软件工作准备充分,因此,产品研发和推广都是按照计划执行,没有遇到意想不到的问题。”
“当然,由于肺炎疫情的问题,越来越多学在家学习,很多公司要求员工在家办公,这导致云提供商也在不断增加其硬件配置,Ampere Altra 产品的需求随之加大,新款 Ampere Altra Max 可以完美地满足这些需求。”Jeff 补充。
顺应边缘计算所需,开放心态关注RISC-V
随着云端负载压力过重,业界提出用边缘计算分散云计算的压力,因此数据中心的模式也在发生改变,从集中的大型数据中心向边缘数据中心发展,这给服务器芯片供应商也带来新的发展机会。Jeff 认为,边缘数据中心与中央数据中心要求差不多,包括高性能、高核数、计算能力等。与中央数据中心的区别在于,边缘数据中心也要实现中央数据中心同等的效果,但是还得面临额外的挑战,比如占地面积、制冷、功耗,也就是要再更高效的平台上实现同样的计算能力。
关于边缘数据中心为什么需要内核性能越来越高?Jeff 解释,因为它不仅是网络处理简单的工作,还需要完成 AI 这种低延迟计算,而且是要求较高的工作负载。Ampere 产品能够在边缘数据中心发挥重要作用,因为我们能够部署更多的内核,GPI 内核更高,同时实现更高的性能,达到与中央数据中心差不多的计算性能和计算能力。
近几年,RISC-V 架构在国内半导体市场受到了很高的关注,有些 IP 公司、芯片公司已经开始基于 RISC-V 架构开发产品,RISC-V 是否会对 Arm 架构造成一定的市场压力?面对这个问题,Jeff 表示,现在 RISC-V 架构有很大的发展,我们对于所有相关的这些技术都持开放的态度。从服务器这个角度来说,RISC-V 在性能,包括软件的相关生态系统方面还不具备可行性,但是我们会持续的关注 RISC-V 未来几年的发展。