众所周知,AMD APU的问世将处理器的发展带入到了一个新的时代。CPU与GPU的完美融合不仅提供了强大的整合3D性能、适中的CPU性能,也为GPU通用运算、异构运算等新理念、新技术的高速发展创造了条件。现在,已有不少消费级软件对APU进行了特别优化。不过这并不意味着结束,就像人们常说的那句话——“没有好,只有更好。”本月初,AMD发布了新一代台式机APU——Trinity。相比之前的产品,它的CPU、 GPU核心、内存控制器,以及功能都得到了全方位进化,那么它的性能表现,它为用户提供的使用体验是否也会得到“同步进化”呢?
在2011年6月20日AMD Llano APU发布后,APU已俨然成为AMD在CPU市场上的新主力。APU依靠不错的CPU性能和优秀的集成GPU性能,打入了英特尔(缺少强大的集成显示核心)和NVIDIA(缺少X86处理器产品)等竞争对手完全无法控制的市场空间。在为AMD赚取眼球的同时也获得不少消费者的认可,甚至AMD一直以来都没有起色的移动平台也借助APU的东风,得到了越来越多的关注。
回头来看,Llano APU其实并不算完美,比如CPU性能还不能令人满意、GPU架构也落后于当时低端桌面独立显卡。因此AMD需要在APU市场上进一步发展、深耕才能获得更多支持并拓宽市场需求。于是,我们看到了AMD在今年5月,也就是第一代面向主流市场的Llano APU发布后不到一年,新一代代号为Trinity的APU就已经在移动市场正式开卖。而在5个月后的10月2日,Trinity的台式机版本即新一代台式机APU正式入驻桌面领域,一起到来的还有与其配套的A85主板。相比移动版产品,台式机APU拥有更高的工作频率、更加丰富的功能,也将为用户带来更多的惊喜。
根据AMD计划,APU在未来将不再分CPU部分和GPU部分,而是彻底融合在一起。不过在目前技术不够成熟、软件和应用环境才初露苗头的情况下,无论上一代Llano还是新一代台式机APU,依旧还是选择了比较传统的CPU和GPU分离设计,然后通过诸如HT总线、内存控制器等部件将其连接,并在物理结构上制造在一起。
新一代台式机APU仍采用分离式设计,划分为内存控制器、处理器核心、集成GPU、高清媒体加速器等几大块。
Llano APU采用的是改进的K10架构,GPU部分则继承了来自于Radeon HD 5000系列的VLIW 5D架构,但新一代台式机APU却做出了较大的改进。其CPU部分跳过了“推土机”架构,而直接采用了新的改进版本“推土机”,也就是第二代“打桩机”架构。相比之前的“推土机,“打桩机”在缓存延迟、分支预测方面做出一些改进,因此性能也会更为出色。同时,Trinity集成的HD 7000系列GPU采用了性能功耗比更为出色的、来自于Radeon HD 6900系列的VLIW 4D架构,3D性能又有了一定的进步。总的来看,Trinity的各个方面都得到了进化,使得这款处理器无论是在性能、功能还是功耗表现上都有了相当大的改善。
新一代台式机APU对内存控制器、显示输出控制器、CPU核心等五大部分进行了全面改进。
AMD在发布K7产品后,一直到K10以及“K10.5”,都只是在CPU外部连接、缓存设计以及工艺和频率上做出调整,对CPU本身架构的改动也只是小修小补。AMD真正的堪称CPU核心架构上的革新就只有去年发布的“推土机”架构了。
由于种种原因,推土机架构的实际产品表现不是非常理想。首先AMD合作伙伴所掌握的32nm SOI工艺不成熟,导致CPU发热高,功耗大,频率提升困难。其次,推土机内置的内存控制器延迟太高,虽然理论带宽看起来不错,但实际性能却远远没有理论带宽数据那样漂亮。除了内存部分,推土机架构中的CPU缓存延迟、长流水线带来的数据延迟等,都影响了CPU性能的提升——这些问题都需要使用高频率来解决,但工艺瓶颈却让AMD无法完全发挥CPU优势。此外,AMD的推土机架构使用了比较长的流水线,但并没有相应的优秀分支预测和缓存命中设计经验,在分支预测失败、缓存未命中时,流水线刷新等待带来了一定的性能损失。
而初问世的Llano APU没有采用推土机架构,原因在于产品研发时间错位等问题(APU几乎和推土机是并行开展研发的),但可以判断的是,即使它采用了推土机架构,其CPU性能和功耗表现也不会好到哪里去。那么新一代台式机APU的打桩机架构,又有什么优势呢?根据AMD的说明,打桩机架构基于推土机架构,但做出了一些改进。AMD在打桩机上的主要任务是提升IPC(每周期指令)性能,让CPU内部处理效率更高。总的来看,打桩机架构在以下几个方面做出了较大的改进:
1.分支预测系统
AMD宣称打桩机在分支预测系统做出了改进,因此打桩机在指令预测方面命中率更高。不过AMD没有给出内部细节。比较可信的说法是打桩机架构将之前的分支预测数据暂存在寄存器中,借此提高分支预测的能力。同时,AMD为打桩机架构增加了指令窗口的大小,这可以让CPU处理更大的指令组,对性能的提升也是有帮助的。打桩机架构的指令解码宽度为4路,在单核心和单模组模式下,可以多同时处理4条指令,在双模组时多可以处理8条。这样也能够提升指令处理效能,提高IPC。
2.对内部指令的改进
在指令执行效率方面,AMD还加入了一些指令集来辅助提高CPU的性能,比如FMA3指令(用于乘加计算)、F16C指令(16bit的浮点转换指令),再加上推土机架构所支持的FMA4,打桩机架构在指令支持上已经相当齐全。根据AMD的介绍,在指令方面特别是指令执行时间的改进上,打桩机架构在浮点和整数性能上表现更出色,指令的调用和返回速度也得到了提升。
3.缓存与内存系统的改进
打桩机架构对缓存读取延迟和存储预取功能等影响性能的重要部分,进行了改进,从而可以获得比较明显的性能提升。此外,AMD还降低了打桩机架构的读取/存储单元的延迟,包括改进存储—读取的排队序列,这样可以降低预测编译部分的工作请求,并降低Buffer,简称为TLB)通道增加到64个,是上代产品Llano的2倍。此外,新一代台式机APU的内存控制器性能也得到了增强,AMD官方标称是高可以支持到DDR3 1866内存,对于严重依赖内存性能的集成GPU来说,这显然是件好事。
4.CPU部分采用谐振时钟网络技术用于辅助提升频率
AMD对推土机以及打桩机的频率非常在意,并认为这是提升CPU性能的关键。在新的打桩机架构上,AMD加入了全新的谐振时钟网络(Resonant Clock Mesh)技术来帮助提升频率。这项技术能够使CPU频率提升10%,或者在同频率下降低10%的功耗,特别是时钟分派功耗降低24%。
在谐振时钟网络技术的帮助下,采用32nm工艺制造的Trinity核心拥有很强的超频能力。
谐振时钟网络技术来源于美国的Cyclos半导体公司,其原理就是在时钟网络的电容器和新型电感器上构建谐振电路,将谐振电路的电容器和电感器之间交换能源时的电气信号作为时钟来使用。谐振时钟网络会使用片内电感器创建一个“电摆”(electric pendulum)或者叫“振荡回路”(tank circuit),利用Cyclos的新型电感器(能够提供超过1GHz的时钟频率,电感电量为0.75~1.25nH,产品面积小于100平方微米)和时钟控制电路去重新利用时钟功耗,而不是在每个时钟周期内将它们白白浪费掉,从而降低功耗,提升频率。
5.全新的智能超频3.0技术
频率控制技术是目前有效的在热设计功耗范围内提升CPU性能的方法,毕竟CPU不是在所有时间内都处于满载状态,留下的一部分TDP空间可以用于提升工作状态中的频率,从而达到提升性能的目的。
在打桩机架构中,AMD加入了新的功耗、频率控制技术,被称为智能超频3.0。这个技术的本质和之前英特尔的睿频技术差别不大。AMD在打桩机的每个模块中都加入了自己独立的功率检测器,在APU上,GPU部分也有独立的功率检测器。所有的功率检测器将实时动态监测CPU各个部分的功率情况,并将所有的功耗数据和TDP相比较,反馈给P-state Manager进行管理。当APU所有部件的实际功耗小于TDP时,GPU和CPU会被自动提升频率档次,运行在更高的频率上并获得性能增益。在实际操作中,APU会根据产品类型和使用环境,对单模块、双模块、多模块以及GPU进行动态调整。这个过程完全无需人工干涉,是自动进行的。从后面的规格表中,可以看到,新一代台式机APU的处理器核心可以智能超频的频率很高,高已达到4.2GHz,而Llano APU则没有智能超频功能。
总的来看,打桩机架构相对推土机架构来说,只是一个小幅进化,通过部分内部结构的微调等,带来性能功耗比的提升,但CPU的绝对性能由于架构限制并不会提高太多。在宏观角度来看,打桩机架构和推土机架构基本上相同,包括其内部的模块化设计、每个模块两个整数核心以及一个共享128bit浮点核心的配置方式都毫无差异。
新一代台式机APU所集成的HD 7000系列GPU架构采用了VLIW 4架构设计,这是什么意思?实际上有关VLIW架构以及其发展方法,在Radeon HD系列显卡的发展过程中,本刊已经介绍过多次。在Trinity上面所采用的VLIW 4架构也和之前Radeon HD 6900系列上采用的完全相同。在2011年2月下的《Radeon HD 6970/6950图形技术解读》一文中,本刊已经深入阐述过VLIW 4D架构和之前VLIW 5D(或者叫做VLIW 4D+1D)架构的不同和优势之处。如果想详细了解VLIW 4D架构的读者可以回顾之前的文章,在这里,我们只做一些重点分析。
之前AMD在Llano APU中采用了VLIW 5D的架构,这种架构基于经典的图形处理,一次操作中可以完整执行XYW(或者RGBA)以及一个特殊操作,但VLIW 5D的灵活性比较差,它内部单元是不能拆分的,只能每次接受一个完整的操作,如果出现1D指令或者2D指令等VLIW 5D的效率就会直线下降。AMD从Radeon HD 2000系列到Radeon HD 6800系列都采用了VLIW 5D的架构,但是在Radeon HD6900系列上,AMD考虑到如果继续使用VLIW 5D架构,对产品未来的发展和继续提高每晶体管效率已经没有太大帮助了,因此他们考虑将VLIW 5D中体积较大的特殊计算单元取消,直接使用四个对等的ALU单元进行计算。这样处理后,AMD认为每平方毫米的性能可以提升10%,这也就是目前Trinity以及Radeon HD 6900上所使用的VLIW 4D架构。
从AMD给出的资料看,Trinity中集成的HD 7000系列GPU“麻雀虽小、五脏俱全”,Trinity APU中集成的GPU部分高拥有384个流处理单元,虽然从数据上来说看起来小于前代Llano APU中集成的400个,但执行效率更高,实际性能表现也会更为出色。从功能和特性来说,Trinity APU完整支持整个DirectX 11特效,拥有真正的曲面细分单元,支持抗锯齿和各向异性过滤,支持MLAA等AMD特色技术,是目前整合类GPU中无与伦比的强者。AMD在新一代台式机APU上依据产品档次,将APU内置的ALU数目划分成384、256、192、128四类不同数量和档次,频率则有800MHz、760MHz、723MHz三种,以区分不同档次和市场的需求。
此外,HD 7000系列集成GPU不仅仍拥有传统的双显卡加速技术,可以和HD 6570之类的低端独立显卡组建交火提升性能,还集成了完整的DP、HDMI、DVI显示输出控制器。因此,新一代台式机APU也可支持AMD的Eyefinity宽域多屏显示技术,无需独立显卡,就可为用户提供分辨率达5760×1080的三屏显示。
采用VLIW 4架构设计,拥有384个ALU单元的HD 7660D显示核心。
新一代台式机APU核心面积大约为246mm2,晶体管数量是13.03亿,桌面版本TDP功耗为65W~100W,与此相对的数据是上代LlanoAPU的核心面积、晶体管数量分别是228mm2和11.78亿,TDP也是65W~100W。如上表所示,目前AMD公布了八款使用Trinity核心的APU产品,其中6款拥有GPU核心的APU产品,其余2款被屏蔽了GPU核心,可以当作普通的CPU使用。
表中产品型号中带K的产品是不锁倍频的,玩家可以自由超频。缓存方面,只有A6 5400K和A4 5300被削减到只有1MB二级缓存,这对性能的影响是相当严重的,其余APU和CPU产品都拥有4MB二级缓存。频率方面,这些产品中频率高的A10 5800K默认/智能超频状态下的频率达到了3.8GHz/4.2GHz,较低的A8 5500和Athlon X4740在默认/超频状态下的频率也达到了3.2GHz/3.7GHz,主频设定幅度之高,相当惊人。
新一代台式机APU的另一个重大变动是将处理器接口变为FM2,相比之前的FM1,FM2彻底改变了接口的定义。比如FM1接口有905个针脚,而FM2减少了一个只有904针,接口上三个空槽的位置、结构也有改变。因此FM2和FM1无法兼容,需要购买新一代台式机APU的用户,必须得同时购买使用FM2接口的主板。
在芯片组的搭配上,Trinity APU既可以搭配采用FM2接口的上一代A75(目前市面上已有不少采用FM2接口的A75主板),也可以搭配新一代A85芯片组。A85的芯片代号是Hudson-D4,在规格上相比A75变化不大。
A85通过UMI总线和Trinity APU相连接,其主要功能依旧是扮演传统南北桥芯片架构中的南桥角色,也就是提供大量的外设接口。在PCI-E的支持方面,A85主板可以将Trinity APU提供的一条PCI-Ex16通道拆分为2个PCI-E x8的插槽,用于搭建双卡互联的CrossFireX系统。不过目前A85的PCI-E包括Trinity APU的PCI-E通道只能支持到PCI-E 2.0,带宽上相比目主流的PCI-E 3.0要低很多,好在对显卡造成的性能损失不大,基本无需担心。
通过与A8 3870K(右)的对比,不难看出,A10 5800K(左)的FM2针脚在三处位置上有明显变化,无法与FM1接口兼容。
与A75相比,A85大的不同体现在扩展支持方面。A85支持多8个SATA 6Gb/s接口,并支持组建RAID 0、1、10、5多种磁盘阵列,而A75只提供6个SATA 6Gb/s接口,且不支持RAID 5。此外,A85还提供4个USB 3.0,10个USB 2.0接口,以及额外的4条PCI-E通道,并支持PCI接口。总的来说,A85的扩展支持还是很到位的,基本上可以满足绝大部分用户的需求。
与A75芯片组相比,A85芯片组在外形上并无差异,仍为单芯片组设计,其功能也仍然是充当南桥,提供存储功能,只是在扩展能力、磁盘阵列组建功能上有所升级。
从架构图来看,A85芯片组还具备将DP数字信号转换为VGA模拟信号的功能。
测试平台:
处理器 | AMD A10 5800K、AMD A8 3870K、英特尔Core i5 3470、 AMD FX 8150 |
主板 | 华硕F2A85-M PRO、技嘉GA-F2A85X-UP4 |
显卡 | GeForce GT 430(只在与集显GPU对比时使用) |
内存 | 博帝DDR3 2400 4GB×2 |
硬盘 | 浦科特M5P 128GB、日立 Deskstar 7K4000 4TB |
电源 | X7-1200 |
操作系统 | Windows7 Ultimate 64bit |
测试目的:主要了解相对于Llano APU,新一代台式机APU的性能提升幅度,以及在实际应用、游戏中是否能为用户带来更好的体验。其次测试谐振时钟网络技术对于减少处理器功耗、提升处理器的超频能力是否有明显帮助。
测试方法:首先我们将通过SiSoftware Sandra、CINEBENCHR11.5等基准性能测试软件,以及Photoshop CS6、Winzip 16.5、《战地3》、《幽灵行动:未来战士》、OCCT等应用软件与游戏,测试新一代台式机APU的性能、应用体验水准、功耗。同时,由于此次进行评测的是定位高端的A10 5800K APU,因此我们将采用LlanoAPU中的NO.1——A8 3870K与其进行对比测试。此外,我们还将采用A10 5800K的目标竞争对手——英特尔Ivy bridge Core i5系列进行对比。这样,通过与上一代产品、目标竞争对手的比较,我们就能了解它是否能有更好的表现。
其次,针对芯片组的变化,以及一些特殊功能,我们还将进行以下测试:1.测试A85芯片组的存储性能,在使用机械硬盘、SSD固态硬盘、USB 3.0闪存盘时的读写性能与A75、Z77相比有无优势与不足;2.测试新一代台式机APU是否能真的实现集显平台组建三屏显示,是否能很方便地进行组建。
此外,鉴于谐振时钟网络技术的采用,我们还将重点测试该技术对于新一代台式机APU的超频性能是否有所提升。测试中,我们除了使用传统的风冷超频外,还将与著名超频玩家CD-KEY合作,对A10 5800K进行液氮超频。后,为了比较打桩机核心与推土机核心在性能上的差异,我们还将关闭FX 8150处理器的两个模块,只使用四个核心,并降频至3.8GHz与A10 5800K进行简单的性能对比。
测试中,我们将使用专业的Kingpin Cooling F1 Extreme液氮炮对A10 5800K进行极限超频。
测试点评:与采用推土机架构的处理器类似,由于采用打桩机架构设计的新一代台式机APU仍采用两个核心共享一个128bit浮点核心的设计方式,即四核心处理器只有两个浮点运算单元的配置,因此在浮点运算性能上不敌拥有四个浮点运算单元的Llano APU,所以在CINEBENCH R11.5、wPrime 32M中的成绩都出现了小幅落后。
处理器与内存性能测试:
应用性能测试:
但在只使用一个浮点运算单元的Super Pi运算测试中,打桩机架构的胜出则说明其单个浮点运算单元较K10.5架构更有效率。
同时,在测试中我们也发现,由于新一代台式机APU具备完整的四个整数单元,因此在“公平”的4 VS. 4测试中,它有非常优异的表现。其多媒体整数性能达到Llano APU的两倍以上,从而令它在浮点性能不足的情况下,在处理器算术性能、多媒体性能这些对处理器运算性能进行整体评估的测试中战胜对手,这进一步证实打桩机架构的确较老旧的K10.5架构更加优秀。
内存测试方面,尽管在新一代台式机APU上,AMD官方才宣布正式支持DDR3 1866,但实际上很多Llano APU与A75主板都可对DDR3 1866主板提供良好支持,因此在相同的DDR3 1866设置上,打桩机架构并未体验出任何优势,推土机架构内存延迟高的缺点也未发现得到明显改变。而Core i5 3470在测试中仍表现出了英特尔传统的处理器性能、效率优势,在所有处理器、内存测试中都明显领先于两款AMD产品。
测试点评:在这个测试中我们意外地发现,尽管Core i5 3470在处理器性能测试中表现优异,但在实际应用里,却没有体现出相应的优势。原因很简单,现在的不少软件对OpenCL异构运算、GPU通用计算等新技术进行了优化。如在使用Photoshop CS6的光圈模糊滤镜效果时,软件将开启OpenCL功能,调用处理器与GPU同时对特效进行处理,这样APU就可借助GPU强大的浮点运算性能在测试中赶上英特尔产品。同样,在Winzip 16.5进行压缩工作时,软件也会使用OpenCL异构运算功能,调用处理器与GPU同时进行压缩工作,从而令压缩时间低于Core i5 3470。而在侧重依赖GPU通用运算性能的应用中,新一代台式机APU更体现出了明显的优势。如在musemage图形处理、Photoshop CS6液化效果滤镜功能、vReveal1080p视频修复及编码这些测试中,它的测试表现都明显优于两位对手。
稍有不足的是,APU播放高清视频的占用率仍略高于英特尔产品,不过对用户应用体验并不会造成影响。而且值得一提的是,厂商还为新一代台式机APU推出了专用的影音播放软件——暴风影音AMD版。使用该软件播放高清视频时,可开启APU或AMD显卡才能使用的专有功能。如防抖动修正功能,开启该功能后,原本画面抖动的视频,会在AMD Steady Video功能的修正下,大程度地消除抖动给观众来带的不适应感,让视频更加的平滑。对于使用家用DV进行拍摄的非专业用户来说,这无疑是大有好处。此外,该软件还具备可一键提升画质的左眼功能,以及一键将普通2D影片转换为红蓝3D电影的3D播放功能。
Winzip 16.5、Photoshop CS6等常用软件均已对OpenCL技术提供完善支持。
通过应用测试或许有人会问,除了Trinity,难道Core i5 3470、Llano APU在这些应用里不支持OpenCL或GPU通用运算吗?事实上,它们对这些技术也能提供完善支持(英特尔处理器在Winzip 16.5中无法支持OpenCL技术),因此它们的落败只有一个原因可以解释——那就是GPU性能不如新一代HD 7000系列,那么在游戏性能测试中是否也会有如此结果?
测试点评:测试结果完全在我们的预料之中,事实上新一代台式机APU在GPU通用运算中的优秀表现已经预示着,HD 7000系列采用的VLIW 4架构拥有更高的性能与效率。因此,它在所有游戏测试中都战胜对手就并不令人意外。但我们并不满足,我们更想了解它的性能是否能战胜低端独立显卡。
游戏性能测试:
测试中,我们并没有采用那些只有64个流处理器、64bit显存位宽,如GeForce GT 210之类的低端独立显卡进行对比。而是采用了拥有96个流处理器、配备128bit 1GB DDR3显存,核心、显存频率分别达到700MHz与1800MHz的GeForce GT 430加强版进行对比。测试结果令人惊喜,A10 5800K的集成GPU在所有测试中仍完胜对手。
芯片组磁盘与USB 3.0性能测试:
对于集成GPU来说,这是一个非常有意义的测试结果,要知道96个流处理器的配置在GPU发展历史上是一个很经典的架构,从初的中端显卡GeForce 9600 GT到GeForce GT 430,直到现在的低端GeForceGT 630都无一例外地采用了该架构。集成GPU的胜利不仅意味着该架构终于行将结束其历史使命,也显示集成GPU发展到了一个新的高度,只需依靠共享内存做显存,就能拥有强悍的性能。此外,如果新一代台式机APU拥有合适的价格的话,那么这也意味着那些采用96个流处理器的399元低端显卡将面临前所未有的生存危机。
测试点评:从A85芯片组与A75芯片组的存储性能测试成绩来看,无论是使用机械硬盘还是SSD、USB 3.0闪存盘,二者都没有明显区别。这也证实了,A85芯片组只是A75芯片组的功能、接口扩展版而已。而英特尔芯片组则体现出了它传统的磁盘性能优势,在固态硬盘性能测试中的表现非常突出,尤其是连续读写测试、随机4KBQD16多任务读写测试中大幅领先两款AMD产品。我们认为这主要是因为英特尔芯片组的AHCI驱动更加完善,以及英特尔处理器性能更强,在多任务测试中更有优势所致。
测试点评:在进行这个测试时,我们按以前的传统方法,即通过主板上的DP接口连接一台具备DP接口的显示器,再连接VGA接口与HDMI接口就很顺利地就组建了三屏显示系统。但在进一步了解时,业内人士向我们透露,在新一代台式机APU上组建三屏系统,并不一定必须使用DP接口,而且连接方法可能有很多种。原因很简单,Trinity多只能实现三屏输出,而不少A85主板将提供VGA、HDMI、DVI、DP四个显示接口。那么其中两个接口就只能靠一个信号切换开关来选择使用,不能同时使用。而这两个接口有可能是DP+DVI,也有可能是VGA+DP,或者HDMI+DVI等等多种组合,因此不同的主板将出现不同的接口连接方法。所以用户在建三屏时,首先需了解主板上的哪三个接口可以同时使用,我们也将在后续的A85主板测试中,对它们的三屏组建方法进行深入的了解。
不少A85主板都提供了四个显示输出接口,但只有三个可以同时使用,至于哪三个,决定权在于主板厂商,因此这将带来无法统一的三屏组建方法。
其次在组建三屏系统时,用户还需要安装AMD的HydraVision驱动程序包,以便对后期多屏显示器的组建进行控制。而在软件、硬件准备完毕后,按照催化剂控制面板里“AMD Eyefinity”的提示,设置每个显示器的排列位置,调整边框补偿就可完成组建。组建后三屏的显示分辨率高达5760×1080,这对于用户开启多个窗口浏览网页、文本大有好处,但对游戏应用来说,新一代台式机APU是否还能满足需求呢?
我们对此进行了简单测试,总体来看,由于分辨率提升到了5760×1080,组建三屏系统后,APU在运行游戏时的帧速的确有大幅下降。即便使用中低画质设置,《光荣使命》、《暗黑破坏神3》的平均运行帧速也分别只有10.5fps、16fps。但在这种设置下,也并不是所有游戏都不具可玩性,《尘埃:决战》仍具备平均24fps的帧速,可基本流畅地运行游戏。我认为,用户如想在三屏系统下流畅地运行游戏,可尝试使用Radeon HD 6570显卡与集成GPU建双卡交火来提升性能,改善游戏运行流畅度。
三屏组建在控制面板里的设置与AMD独立显卡类似,在“AMD Eyefinity”选项里对排列位置、边框补偿进行调节即可。
与AMD独立显卡相同,新一代台式机APU在组建三屏系统后,借助5760×1080分辨率,能带给用户更宽广的显示视角,更好的游戏体验效果。
系统功耗:
测试点评:由于新一代台式机APU仍采用32nm工艺制造,A105800K的TDP与A8 3870K也完全相同,均为100W,因此在处理器核心、集成GPU都处在满载运行的状态下,两者的系统功耗差别很小。同时,得益于谐振时钟网络技术的使用,频率的上升也未造成处理器温度的大幅上升。相对高频率只有3GHz的A8 3870K,高频率可达4.2GHz的A10 5800K的满载温度只高出3℃。因此对于普通用户来说,只需要使用普通的散热器与250W电源就可驾驭它。而Core i5 3450由于HD Graphics 2500核芯显卡规格较低,以及22nm工艺的采用,其系统满载功耗只有100W左右。
测试点评:在APU诞生以后,一个“双超”的概念逐渐在玩家中流行起来。所谓双超即通过同时对处理器核心与集成GPU进行超频,来提升性能。而在新一代台式机APU上,这个概念被更新为三超。在之前的测试中,我们曾谈到,在测试中没有发现DDR3 1866下新老APU内存性能有明显区别。但在超频测试中,我们发现,新型内存控制器对于高频内存有非常好的支持度。在面向主流用户的华硕F2A85-M PRO主板上,我们只需调用DDR3 2400内存的XMP设置,内存电压上调至1.65V,我们就可以轻松地让内存稳定工作在DDR3 2400上。而在之前的Llano平台上,却很难令内存工作在DDR3 2000以上。
此外,谐振时钟网络技术的采用,更成熟的32nm工艺,也令新一代台式机APU的可超幅度大大提升。只需1.55V处理器电压、1.45V北桥电压,我们就可将处理器频率稳定提升到4.5GHz,集成GPU频率提升到1169MHz。而A8 3870K的CPU与GPU风冷超频极限分别只有3.7GHz与1029MHz。
内存、CPU、GPU三超后的新一代台式机APU平台性能获得了大幅提升,3DMark 11性能由原来的1371分提升到2084分,提升幅度高达52%,已接近中端显卡Radeon HD 5770的水准。
内存、CPU、GPU三部分的同时超频,令新一代台式机APU平台性能获得极大提升。
测试点评:风冷超频下的优异表现,让我们不禁更加好奇新一代台式机APU的超频潜力到底有多大。为此,《微型计算机》评测室特别联合国内知名超频玩家CD-KEY,使用定位较高的技嘉GAF2A85X-UP4主板,以及技嘉工程师特别为Trinity超频赶制、研发的F3b版BIOS,对A10 5800K进行了液氮超频。
超频的方法说起来很简单,新一代台式机APU同样继承了AMD处理器没有Cold Bug的优点。因此超频玩家要做的是,不断在蒸发皿中倒入液氮,使APU长时间处于液氮炮所能达到的低温度下,以便后续大幅提升处理器核心电压、北桥电压进行超频。不过,由于大部分性能较好的液氮炮都可以将温度保持在-170℃,甚至更低,因此在液氮炮周围会产生严重的结露现象,需要玩家事先对主板进行细致的防水工作。
在较好的防水措施保护下,同时在将液氮炮温度稳定在-170℃后,我们对A10 5800K进行了大幅加压超频,其中处理器核心电压提升到约1.95V,北桥电压提升到1.55V。我们发现在该设置下,APU可以轻松地以100MHz×62的频率进入系统,但若再提升倍频频率或外频频率后,都无法进入系统。因此在以6.2GHz进入系统后,我们又尝试通过技嘉的Easytune 6软件,在系统下对APU进行超频。在经过无数次尝试、重启、蓝屏后,我们终将A10 5800K的频率提升到7093.69MHz。而上一代Llano APU的世界超频纪录只有6GHz,新一代台式机APU的超频潜力显然令人满意。
在我们的不断努力与多次尝试下,A10 5800K终提升到7093.69MHz,创造了在文章截稿时,新一代台式机APU所能达到的高超频频率。
我们即将对采用打桩机架构设计的AMD FX 8350处理器进行详细测试,敬请期待。
不难看出,新一代台式机APU不论是在应用性能、游戏性能、还是功能扩展、超频能力上,较Llano APU都实现了全面进化,是一款表现更加优秀的产品。从宏观的角度来看,它不仅实现了AMD更新换代的目的,也将主流处理器的性能提升到了一个新的高度,将对其相关硬件产业造成重大影响。举例来说,其高性能的集成GPU势必将推动低端独立显卡进行更快的发展;而谐振时钟网络技术的应用,更快的运行频率、更高的超频潜力则肯定会促使竞争对手也研发采用类似技术,毕竟对方早在很多年前,就想将处理器频率提升到4GHz以上。总体来看,这不仅是一款能为普通用户带来更好体验感受的产品,也将是一针推动硬件产业发展的“兴奋剂”,相信要不了多久,我们就能感受到它的影响。
或许你对新一代台式机APU表现一般的处理器浮点性能并不满意,但我们认为这并不是它面对的主要问题。从发展趋势来看,随着越来越多的软件支持异构运算、GPU通用计算,对于处理器的整体性能,已不能单纯地只从处理器的核心性能进行衡量,而更应结合其集成GPU性能进行综合评估。而对于AMD来说,他们现在需要做的工作,就是要加强对软件厂商的引导,令其GPU的表演舞台更加宽广。
我们认为决定新一代台式机APU走向成功的大因素还是在价格。根据我们的了解,Llano APU由于价格较高、主板价格也不便宜,在一定程度上影响了APU的普及。因此新一代APU要想获得成功,就必须降低价格、提高性价比,必须让APU的价格小于低端处主流用户。本刊也将在后续对新一代台式机APU的价格走向、供销情况进行详细报道,指导大家进行购买选择。
后需要向大家透露的是,相比推土机架构,打桩机架构的确具备更强的性能与效率。在将A10 5800K、FX 8150频率固定设置为3.8GHz,并关闭FX 8150两个模块,只使用四核心后,我们发现除了在Super Pi测试中略有不足外,没有三级缓存的A10 5800K反而在SiSoftware Sandra处理器算术性能、CINEBENCH R11.5测试中小胜对手。显然具备完整配置的高端打桩机处理器非常值得期待,那么它们将拥有怎样的表现呢?请期待《微型计算机》评测室即将为你奉上的FX8350处理器详细测试。