全面进化,这四个字用来形容2013年处理器的技术发展可能是再合适不过的。无论是处理器内核,还是集成显示核心、乃至处理器技术架构都在2013年里获得了突飞猛进的发展,为DIY玩家上演了一部技术含量颇高的精彩大片。
2013年对英特尔来说压力其实并不大,因为自从Nehalem架构发布,英特尔成功获取了性能和工艺双双领先的显著优势后,英特尔出于市场竞争的原因对CPU架构更新的需求就不太迫切了。“Tick-Tock”节奏维持下的英特尔,CPU的微架构和工艺精确地就像钟摆那样一代又一代地维持隔代升级的方式。2013年恰好轮到了全新的Haswell架构。
Haswell是英特尔Tick-Tock战略中,工艺不变、架构更新的一代。首先,Haswell的Decode Queue(解码队列)数量支持提升到了56个,加强了对单一指令的解码效率。而在数据调度部分,Haswell将Entry Recorder Buffer的数量增加到了192个,整数寄存器和AVX寄存器都增加到了168个。同时它的分支指令寄存器、读取寄存器、写入寄存器、统一调度器等小部件都有或多或少的加强。而在解码和操作部分,Haswell增加了额外的两个发射口,并顺应AVX2.0的需求,将所有有关FMA的操作全部升级到256bit。此外,Haswell的L1、L2缓存带宽也得到了翻倍提升。总体来看,Haswell的微架构部分更像是在之前SandyBridge、Ivy Bridge的“大楼基础”上,向上又盖了几层,不仅解决了之前内部的一些数据瓶颈和不当设计,又适当地增加了内部资源,加强了运算性能。不过这些改进都只是小改动,因此,Haswell处理器的同频性能相对于Ivy Bridge增长不大,其单线程性能仅提升1~2%,多线程性能则要大一些,高有8%左右。
相对处理器方面的小幅进步,英特尔在集成显卡方面却获得了非常大的飞跃。Haswell中的集成显示核心分为GT1、GT2和GT3三个版本。主要使用的GT2拥有20个EU单元,80个ALU和2个曲面细分单元,GT3则直接翻倍到40个EU单元、160个ALU单元和4个曲面细分单元。其中GT2显示核心广泛应用于台式机Core i5、Core i3处理器里,相对于Ivy Bridge处理器主要集成的HD Graphics 2500(只有6个EU单元),其集成规模大幅提升,因此Haswell核芯显卡的3D性能相对之前的大部分IvyBridge处理器有大近100%的增长。而性能更加强大的GT3显示核心则被主要应用于Haswell移动版处理器里,并被命名为“锐炬”Iris集成显卡。其中顶级的Iris Pro 5200拥有40个EU,并集成昂贵的128MB eDRAM缓存,实际测试性能已和GeForce GT 640独立显卡相当。
2013年Ivy Bridge-E的到来,更是让英特尔再次推高了顶级消费级CPU的性能上限。Ivy Bridge-E的CPU微架构和桌面的Ivy Bridge相比变化不大,但是高达15MB的三级缓存和多达六核心、12线程的设计还是让这款处理器较Sandy Bridge-E顶级产品有约10%的提升。同时在22nm Fin-FET制程的辅助下,Ivy Bridge-E在功耗、频率上相对Sandy Bridge- E也有一定的改善,因而更受发烧友的欢迎。
从2013年的发展来看,英特尔在自己已有的完善规划上一步一步正常向前,不断超越自己,推出了大量优秀的产品和全新创新的技术。在2014年,多家预测机构都预示PC即将走出谷底迎来缓慢增长,英特尔势必还会为大家带来更多惊喜。
Haswell处理器的另一个重大改进是内置了FIVR电压调节模块,从而可以更精准地为CPU各部分电路供电,降低功耗。
AMD A10-6800K不仅拥有更为强大的处理器与3D性能,更是一位超频高手,创造出8.5GHz的惊人频率。
FX-9590在默认状态下就可以动态加速到5GHz,具备与Core i7 4770K匹敌的实力。
APU是AMD在融合计划下推出的成功产品。从第一代APU产品开始,它就以强悍的融合效应和充满差异化的产品特征赢得了消费者和市场的青睐。2013年Richland APU的上市,帮助AMD再次加强了自己在这个独特市场的领导地位。
Richland APU在CPU部分采用的还是打桩机架构,但是大幅度改善了功耗、温度和频率控制部分。Richland上所采用的32nm制程工艺相比上一代Trinity做了较大的优化设计,这也让Richland系列APU相比同等级的Trinity APU在频率上有了较大的提升。以A10-6800K为例,该APU默认频率为4.1GHz,通过AMD的Turbo Boost自动超频技术,在满负荷时高频率可达到4核心4.4GHz。相比Trinity APU旗舰A10- 5800K的3.8GHz/4.2GHz有了不小的提升。
其次,在整合显示核心部分。Richland至尊APU将显示核心全面升级到了Radeon HD 8000D系列,其变化主要是在频率上有了一定程度的提升。其中拥有384个流处理器的HD 8670D(用于A10 APU)频率增加到844MHz,配备256个流处理器的HD8570D(用于A8 APU)频率提升到800MHz。这些举措让APU的整合3D性能有了不小的提升。前者已可在全高清分辨率、较好画质下流畅运行《坦克世界》、《尘埃》等3D大作,后者的性能则全面超越GeForce GT 630这样的低端独立显卡。
在2013年,AMD的另一重大举措就是全力推动异构运算的发展。软件上,AMD发布了对异构运算进行重大优化、增加多项OpenCL加速的SDK——SDK v2.9,同时软件厂商也做出了积极的配合,不仅Photoshop、Winzip对异构运算提供了良好支持,今年新发布的PCMark 8评测软件也首次加入了对系统异构运算性能的测试。从现在开始,单单通过CPU内核性能来评估处理器性能已经是不科学的了,只有对CPU与其整合显示核心的联合运算能力即异构运算性能进行考察才能做到准确、客观。同时,AMD还在今年研发了第一款采用异构架构设计,CPU、GPU统一内存寻址的Kaveri处理器。在这种处理器中,数据会被存放在共用的统一内存单元,无论是CPU还是GPU,都可以去统一的内存池中调用所需要的数据,从而避免相互的数据拷贝和带宽浪费。据AMD官方透露,采用这种架构后,可以为处理器带来高6倍性能功耗比的提升。此外,Kaveri还将采用新一代TSMC28nm工艺生产的“压路机”架构核心,多拥有512个流处理器的GCN架构整合显示核心,因此即将在2014年第一季度发布的Kaveri APU的性能将非常值得期待。
除了APU,AMD在2013年的另一大惊喜就是回归高端市场,推出了主频高达5GHz的超级处理器一AMD FX-9590。FX-9590采用打桩机架构,拥有四模块八核心,基准频率为4.7GHz,Turbo频率达到了5.0GHz。这也是全球首款主频达到如此之高的x86处理器。
FX-9590的创新之处在于超高的频率。FX-9590的核心依旧是基于推土机架构进行微小调整的打桩机架构,之所以能运行在如此高的频率上,其原因有两点:首先是AMD在CPU架构设计上有独到之处,在如此高的频率下可以稳定运行的处理器着实不多见;其次是AMD在产品控制和工艺上有比较独到的经验,AMD能够特别挑选一批体制优秀,在较高电压和较高频率下通过测试稳定工作的芯片,并完成商业化,这本身就是一件非常不容易的事情。由于频率高,这款CPU的性能也非常优秀。FX-9590的多线程性能、办公性能、游戏性能等关键指标上,相比之前的AMD产品都有了长足的进步,部分领域甚至超过了英特尔Core i7 4770K、Core i7 2600K这样的顶级产品。这标志着AMD重新回到顶级市场,带给了玩家全新的选择。
AMD的2013年,实际上是AMD重整旗鼓,再度起飞的重要年份。在接下来的2014年,随着AMD全新Kaveri APU的发布,AMD必将在APU和异构计算的市场上投下一枚重磅炸弹,以更为领先、更为优秀的姿态出现在用户面前。