当地时间3月16日星期一,AMD发布了一款名为米兰的服务器芯片,旨在从竞争对手英特尔那里获得更多的市场份额
AMD表示,其最新的“米兰”服务器芯片比目前最好的数据中心芯片速度更快。据悉,AMD完成了芯片的设计,并委托台积电采用7 nm芯片制造工艺实现量产。
pIYBAGBQGRKAI _ 8 haaccwz 97 b2i 103 . jpg
在AMD服务器处理器的演进路线图中,“米兰”具有重要的战略地位。继前两代“那不勒斯”和“罗马”之后,“米兰”对在数据中心市场上进一步进攻这座城市寄予厚望。
发布会上,AMD高级副总裁兼服务器业务总经理丹麦克纳马拉(Dan McNamara)、AMD全球院士兼Zen core首席设计师迈克克拉克(Mike Clark)、AMD院士兼SoC架构师诺亚贝克(Noah Beck)、AMD EPYC全球产品管理副总裁拉姆佩迪霍拉(Ram Peddibhotla)接受了包括微网在内的媒体采访,从架构、设计、产品等方面详细介绍了“米兰”背后的更多细节。
丹麦克纳马拉(Dan McNamara)表示,“米兰”的发布将进一步巩固AMD在数据中心市场的地位,无论是在核心还是在系统层面都表现出卓越的性能。对于市场用户来说,“米兰”在总拥有成本方面会带来更高的价值,AMD也在加速生态布局,围绕“米兰”推出更多应用。
7nmZen3架构的IPC性能提升19%
o4YBAGBQGRmAd7pIAAFrZ3ZHMho228.png
自2017年重返数据中心市场以来,AMD一直在追求架构的创新以及由此带来的性能飞跃。从Zen1到Zen3,IPC性能有了显著提升。比如,搭载Zen2架构的“罗马”发布时,其IPC性能比上一代提升了15%,而这款Zen3架构的IPC性能提升了19%左右,远高于行业平均水平。
按照Mike Clark的说法,要取得这样的进步,整个架构的每个环节都必须单独优化。首先,在Zen3上,AMD改进了分支预测的功能,不仅提高了精度,而且可以更快地到达目标,同时可以在系统中发出更快的指令,增加指数,的吞吐量,增加更多的管道来提高吞吐量,同时也赋予了推理的工作量。从四核到八核,整体通讯速度加快,效果更加完美。即使在线程数量较少的系统中,由于共享内存调用,也可以减少有效内存访问的延迟。
具体来说,从Zen2到Zen3,AMD在前端改进方面将BTB翻了一番,达到1024。同时增加了分支预测器的带宽,在分支预测中消除了冒泡现象,因为冒泡现象是很多架构中普遍存在的问题,可以更快地从误测中恢复并寻址。
Mike Clark说,对于更大的服务器工作负载,Zen3可以更无缝地在op缓存和I缓存之间切换,实现更高粒度的流水线切换。
在执行部分,Zen3首先为整数设置了特殊的分支和ST数据挑选器,窗口更大,减少了一些运行延迟,增加了二位宽的调度和浮点分布,FMAC循环更快,有两个INT8的IMAC流水线。
在负载存储部分,Zen3有三个负载,两个存储,增加了操作的灵活性,优化了内存依赖的检测。同时,我们还为这些非常随机的内存操作提供了六页表查询器,以实现更好的TLB查询。
在指令集方面,Zen3在加速、加密和解密算法上将AVX2指令扩展到256位。迈克克拉克指出,安全性是改进的最大部分。首先改进了SEV,限制了中断的注入,限制了恶意管理程序注入SEV-ES客户中断/异常类型,可以将调试寄存器添加到交换状态。
此外,迈克克拉克(Mike Clark)介绍说,当第一代EPYC产品投放市场时,该行业正受到幽灵的攻击。现在,当时的应对方式不是最优解。但是到了现在的三代,应该说AMD在架构上做了很强的防御,同时性能损失也可以降到最低,在提高IPC性能的同时大大增强了系统的安全性和稳定性。
目前AMD采用与第三方芯片厂商合作的模式进行量产。然而,英特尔采取了不同的战略来制造自己的芯片,但最新一代芯片制造技术的延迟给它带来了麻烦。相比之下,“米兰”芯片及其前身的表现优于英特尔芯片,这有助于AMD攫取更多的市场份额,并赢得客户的青睐,如字母表的谷歌
但是英特尔即将反击。分析师预计,英特尔将在未来几周推出最新的“冰湖”服务器芯片,这将是英特尔10纳米制造工艺批量生产的第一个服务器芯片。英特尔10纳米制程生产的芯片性能与7纳米制程生产的米兰芯片相当。
不考虑这两个芯片的速度,AMD预计会有一些优势,比如每个芯片上有更多的计算内核,使得芯片能够同时处理更多的软件应用。