对于AMD来说,2019年注定是一个不平凡的年份:这可不仅仅是因为这家老牌芯片企业刚刚迎来自己的50周岁生日。更源自于其近年来在产品力上的巨大升级,令无数消费者重新迎来了高性价比、高性能的计算与游戏体验,更促进了市场良性竞争环境的重新形成、加速了新技术的更新换代。也正因为如此,大量的电脑爱好者近年来都对AMD“路转粉”,甚至忍不住要赞上一声:
AMD,Yes!
平心而论,在我们为Zen架构、为锐龙处理器、为Radeon VII的性能飞跃和良心定价而欢呼的时候,大部分人其实都已经忘记了AMD研发团队曾经遭受的误解和批评,更鲜有人知道他们是如何在过去的几年时间里默默地积攒着力量,只为了那有朝一日的扬眉吐气。
好在,作为受人尊敬的资深从业者,David和他的同事们即便是面临着极大的压力,也依然做到了对于用户户需求的深刻洞悉和对当今业界前沿技术的再度突破。在紧迫的时间和巨大的市场压力下,最终呈现在我们面前的,就是全新的、令人感到融合了AMD 过往技术精髓、同时又充分面向未来需求的RDNA显卡架构,以及我们当前所看到的,首批运用这一新架构的Radeon RX5700系列显卡。
又一个经典的“小核心大能量”
回顾AMD显卡的历史不难发现,高能效、定位精准的小核心设计曾经数次帮助Radeon GPU名利双收:从最初的HD3870、HD4860到后来的HD6970乃至近年来的RX400、RX500系列,莫不是小核心高性能的优秀代表。
RX5700系列的核心有多小?根据AMD公布的官方数据显示,采用7nm制程的它核心面积仅为251平方毫米,相比之下此前的14nm旗舰RX Vega64核心面积高达495平方毫米,几乎是前者的两倍。然而,与老旗舰相比,RX5700XT的绝对性能提高了15%,同时功耗下降了23%。这就意味着它的能效达到了Vega64的150%,而单位面积上的性能更是Vega64的2.3倍之多。
在进一步对比中,RX5700XT能在1440P分辨率下达到相当于此前Vega56显卡在1080P设置下的帧率,甚至还略有领先。正因为如此,AMD骄傲地将全新的Navi10(也就是RX5700系列)称之为当前最好的1440P分辨率游戏显卡。
全新RDNA架构:诀窍在于给“工头”减负
RX5700系列的“能量”从何而来?可能很多人首先想到的是7nm的制程红利。但实际上根据官方资料显示,在此次新显卡的性能提升中,来自制程的直接好处只占了不到30%,来自频率提升的因素只有10%多一点,而高达60%的性能增长幅度都源自全新的架构设计。而这,自然也就让人对AMD图形部门此次隆重推出的全新架构——RDNA,有了更多的好奇心。
CU内部结构:GCN对比RDNA
七年前,AMD在初代GCN(HD7970)中设计了由一组标量(Scalar)单元和四组矢量(Vector)单元组成的计算单元(Compute Unit)作为架构的“模块化”构成单位。其中,每一个CU内含一个标量单元和四组矢量单元,每组矢量单元由16个算术逻辑单元(ALU)构成。当然,ALU在我们的俗称中,就是所谓的“流处理器(SP)”,GCN架构的每个CU含64个SP,就是这么来的。
相比GCN,RDNA在部分场景下有着四倍的效率
颇为有趣的是,尽管AMD用了很大篇幅在数天的发布会里强调RDNA新架构的计算性能,但毕竟这是在E3展前,AMD自然懂得游戏玩家们希望看到的是什么。因此,与Radeon RX5700共同宣布的,还有AMD全新的三大游戏黑科技:AMD Fidelity FX开源图像质量工具包、Radeon Image Sharpening游戏后处理锐化算法以及Radeon Anti-Lag游戏抗延迟技术。
Image Sharpening的对比效果
其中,Fidelity FX和Image Sharpening都旨在改善游戏画面对比度和清晰度,只不过一个是供开发者使用的特效,而另一个则属于后期着色技术,将会直接集成在未来的Radeon ADRENALIN 19.7.1驱动中,让广大玩家们体验不会降低帧率,只需一键开启,游戏立刻“高清化”的神奇效果。
两个,自然就是最大十六核心了
比如说,相比于此前的Zen与Zen+架构,Zen2最大的特征在于其将CPU的计算模块与包含内存控制器、PCIE通道控制器、CPU模块间互联控制器等在内的IO模块进行了物理上的分割。其中计算模块以最新的7nm工艺制造,换来双倍的密度和相同性能下大降50%的功耗水准(当然这也就意味着更高的主频成为了可能)。而IO模块则采用12nm打造,从而使这些原本就不需要高频率的功能组件成本得到有效控制,自然也就使得新款CPU的性价比更上一层楼了。
当然,对PC技术敏锐的朋友们可能看出来了——把包含内存控制器的IO模块从CPU里“拿”出来,这不就是许多年前的北桥芯片吗?事实上,早在台北电脑展之后,就曾有媒体好奇Zen2架构的外置内存控制器设计是否会对CPU的延迟性能造成影响。针对这一点,AMD此次也终于做出了明确的解答:事实上,得益于大大增加的总线带宽和翻倍的三级缓存,如今的三代锐龙处理器不仅内存延迟大为减少,甚至就连此前一直表现欠佳的内存超频潜力也实现了大翻身。据官方数据显示,三代锐龙的内存控制器可以轻松支持到DDR4 5100MHz以上的超高频率,而如果是对延迟敏感的用户,AMD则建议搭配DDR4 3200 C14或者DDR4 3600 C16的内存来使用。这在过去都是只有少数旗舰主板才能勉强达到的高频率,如今随着三代锐龙台式机处理器的推出,也有望成为一般消费者都能享受到的性能表现了。
除了外置IO模块之外,本次的三代锐龙处理器在计算核心本身的架构上也同样进行了大刀阔斧的改动。其中,最显著的便是引入了近年来学术界热门的TAGE(TAgged GEometric history length)分支预测器,作为CPU设计领域的前沿技术,TAGE预测器仅需要少量增加芯片面积,便能换来大幅度的性能和功耗改善。而三代锐龙处理器本身有着7nm的新制程“撑腰”,用起这一技术自然是毫无顾忌。再加上新增对AVX256浮点指令的支持,使得这一次的锐龙处理器在专业多媒体处理性能上也有极大幅度的提升,配合改进的超线程能力(算术逻辑单元与地址生成单元的比例从4:2增加到了4:3),最终令Zen2架构的三代锐龙处理器收获了高达15%的每时钟周期性能提升。
事实上,AMD对于这一次的CPU架构革新也十分满意,以至于他们认为在本次Zen 2架构的性能提升中,新制程所作出的贡献,还远远比不上新架构带来的改变。换句话说,无论是理论分析还是实际性能,都再一次批驳了那些认为AMD的新产品仅仅只是得益于“制程红利”的观点。
50周年的AMD,正在全方位地“放大招”
在本次AMD NEXT HORIZON GAMING活动的伊始,被中国网民们昵称“苏妈”的AMD CEO苏姿丰博士便骄傲地宣称,AMD是当前唯一一家能同时在PC、主机、云端和移动市场领导游戏技术发展方向的企业。
事实上,关注AMD的朋友们可能都知道,就在前不久,AMD接连收获了包括索尼次世代主机PS5、谷歌云游戏服务、三星未来移动GPU项目在内的多个大单,充分证明了其技术的先进性与产品的高性价比。
43年前(1976年),AMD与Intel达成专利相互授权,从此打下了“双强鼎立”的基础;38年前(1981年),AMD制造的芯片进入航天飞机,创业不过12年的企业得到了最高级别的质量认可;20年前,初代速龙处理器发布,性能逆袭的神话由此展开;13年前,AMD收购ATi,艰难的融合之道自此开启;2年前,初代Ryzen(锐龙)处理器发布,AMD吹响了技术与市场双重反攻的号角……而现在,当曾经的硅谷叛逆者们已然成长为一家有着50年辉煌历史,产品线覆盖几乎所有电子娱乐领域的技术巨头时,AMD却依然没有放松进取的步伐。
截止至本文截稿,AMD股价再次回到历史最高位区域的33.23美元,而我们三易生活也见证了苏妈担任CEO以来AMD股价狂飙20倍的奇迹。因此此次在洛杉矶的活动现场,当两个系列新品亮相时,也不由得在心里默默喊出了“AMD, YES!”