AMD 抢先发布 7nm 服务器芯片 “米兰”

2021-05-18 18:03:01

当地时间3月16日星期一，AMD发布了一款名为米兰的服务器芯片，旨在从竞争对手英特尔那里获得更多的市场份额

AMD表示，其最新的“米兰”服务器芯片比目前最好的数据中心芯片速度更快。据悉，AMD完成了芯片的设计，并委托台积电采用7 nm芯片制造工艺实现量产。

pIYBAGBQGRKAI _ 8 haaccwz 97 b2i 103 . jpg

在AMD服务器处理器的演进路线图中，“米兰”具有重要的战略地位。继前两代“那不勒斯”和“罗马”之后，“米兰”对在数据中心市场上进一步进攻这座城市寄予厚望。

发布会上，AMD高级副总裁兼服务器业务总经理丹麦克纳马拉(Dan McNamara)、AMD全球院士兼Zen core首席设计师迈克克拉克(Mike Clark)、AMD院士兼SoC架构师诺亚贝克(Noah Beck)、AMD EPYC全球产品管理副总裁拉姆佩迪霍拉(Ram Peddibhotla)接受了包括微网在内的媒体采访，从架构、设计、产品等方面详细介绍了“米兰”背后的更多细节。

丹麦克纳马拉(Dan McNamara)表示，“米兰”的发布将进一步巩固AMD在数据中心市场的地位，无论是在核心还是在系统层面都表现出卓越的性能。对于市场用户来说，“米兰”在总拥有成本方面会带来更高的价值，AMD也在加速生态布局，围绕“米兰”推出更多应用。

7nmZen3架构的IPC性能提升19%

o4YBAGBQGRmAd7pIAAFrZ3ZHMho228.png

自2017年重返数据中心市场以来，AMD一直在追求架构的创新以及由此带来的性能飞跃。从Zen1到Zen3，IPC性能有了显著提升。比如，搭载Zen2架构的“罗马”发布时，其IPC性能比上一代提升了15%，而这款Zen3架构的IPC性能提升了19%左右，远高于行业平均水平。

按照Mike Clark的说法，要取得这样的进步，整个架构的每个环节都必须单独优化。首先，在Zen3上，AMD改进了分支预测的功能，不仅提高了精度，而且可以更快地到达目标，同时可以在系统中发出更快的指令，增加指数，的吞吐量，增加更多的管道来提高吞吐量，同时也赋予了推理的工作量。从四核到八核，整体通讯速度加快，效果更加完美。即使在线程数量较少的系统中，由于共享内存调用，也可以减少有效内存访问的延迟。

具体来说，从Zen2到Zen3，AMD在前端改进方面将BTB翻了一番，达到1024。同时增加了分支预测器的带宽，在分支预测中消除了冒泡现象，因为冒泡现象是很多架构中普遍存在的问题，可以更快地从误测中恢复并寻址。

Mike Clark说，对于更大的服务器工作负载，Zen3可以更无缝地在op缓存和I缓存之间切换，实现更高粒度的流水线切换。

在执行部分，Zen3首先为整数设置了特殊的分支和ST数据挑选器，窗口更大，减少了一些运行延迟，增加了二位宽的调度和浮点分布，FMAC循环更快，有两个INT8的IMAC流水线。

在负载存储部分，Zen3有三个负载，两个存储，增加了操作的灵活性，优化了内存依赖的检测。同时，我们还为这些非常随机的内存操作提供了六页表查询器，以实现更好的TLB查询。

在指令集方面，Zen3在加速、加密和解密算法上将AVX2指令扩展到256位。迈克克拉克指出，安全性是改进的最大部分。首先改进了SEV，限制了中断的注入，限制了恶意管理程序注入SEV-ES客户中断/异常类型，可以将调试寄存器添加到交换状态。

此外，迈克克拉克(Mike Clark)介绍说，当第一代EPYC产品投放市场时，该行业正受到幽灵的攻击。现在，当时的应对方式不是最优解。但是到了现在的三代，应该说AMD在架构上做了很强的防御，同时性能损失也可以降到最低，在提高IPC性能的同时大大增强了系统的安全性和稳定性。

目前AMD采用与第三方芯片厂商合作的模式进行量产。然而，英特尔采取了不同的战略来制造自己的芯片，但最新一代芯片制造技术的延迟给它带来了麻烦。相比之下，“米兰”芯片及其前身的表现优于英特尔芯片，这有助于AMD攫取更多的市场份额，并赢得客户的青睐，如字母表的谷歌

但是英特尔即将反击。分析师预计，英特尔将在未来几周推出最新的“冰湖”服务器芯片，这将是英特尔10纳米制造工艺批量生产的第一个服务器芯片。英特尔10纳米制程生产的芯片性能与7纳米制程生产的米兰芯片相当。

不考虑这两个芯片的速度，AMD预计会有一些优势，比如每个芯片上有更多的计算内核，使得芯片能够同时处理更多的软件应用。

AMD 抢先发布 7nm 服务器芯片 “米兰”