历史上,3DMar k系列测试软件,一直是计算机图形系统性能的代言人。从3DMark 99开始到随后的3DMark 2000、3DMark 2003、3DMark 2005以及比较新的3DMark Vantage和3DMark 11,“3DMark”后面总跟随着数字或者单词,要么表示其发布时间,要么表示它的商业意义(只有3DMark Vantage这一代是这种情况)。而此次新的3DMark在命名上却没有任何后缀,耐人寻味。这充分说明,FutureMark想通过这款新的软件传递出不同的声音。没错,大音希声、大象无形,3DMark,这是一款统一、全面、权威的图形系统测试软件。
苹果在发布首款使用视网膜屏幕的iPad时,并没有像大家意料中的那样将其命名为iPad 3,而是直接起名为the new iPad,凸显其新一代的地位和特征。与此类似的是,在新一代3DMark的命名上,Future Mark也采用了同样的方式,将测试软件直接命名为3DMark,放弃了所有的后缀,凸显新3DMark本身的定位:这是一款全方位、多功能的测试软件(以下本文将用“新3DMark”来代指本次Future Mark新发布的3DMark,以区别3DMark的其他版本)。新3DMark在测试体系上有很多重大改进,甚至和之前的3DMark完全不同。下面让我们一起走进新3DMark的世界。
新3DMark重大的改进就是对全平台的支持。根据新3DMark白皮书的消息,在新3DMark的3种测试场景中,对硬件要求低的Ice Storm模式支持Windows、Windows RT、Android和苹果的iOS系统,而另外的Cloud Gate和Fire Strike模式则只能运行在Windows和Windows RT上。
新3DMark在Windows平台上使用的是微软自家的DirectX(可能是D3D Feature Level 9.1),在Android等移动平台上则使用的是OpenGL ES 2.0。在移动平台上,新3DMark使用了固定分辨率进行渲染,再缩放输出到不同设备上的测试方法,避免了不同设备由于不同分辨率给测试结果带来的影响。虽然新3DMark已经尽可能做到兼容了,但是部分设备还是无法运行,为此新3DMark白皮书也给出了说明:
Android设备:至少使用Android 3.1以上的系统、1GB内存、OpenGL ES 2.0兼容核心,300MB的存储空间。有关CPU的需求尚未确定。
Windows RT设备:虽然从理论上来说,所有使用Windows RT的产品都可以运行新3DMark,但部分设备由于配置实在太低,可能无法完成测试。目前FutureMark正在准备在Windows RT系统上运行的设备的推荐名单。
iOS设备:目前新3DMark暂时仅支持iOS 5.0系统,只能支持iPhone 4、iPad 2、第五代iPod Touch三款设备,需要300MB的存储空间。
新3DMark对iOS的支持很有限,不仅产品数量较少,操作系统也不支持新的iOS6,新的iPad 4也没有出现在支持列表中。
在PC端图形性能的考察上,新3DMark更为全面。新3DMark内含了DirectX 11下的D3D Feature Level 9.1(可能依旧是移动平台使用)、D3D Feature Level 9.3、D3D Feature Level 10.0和D3DFeature Level 11.0四种不同的Direct3D等级,几乎对近几代的显卡做到了全兼容。
为了确保新3DMark跨平台和对硬件广泛的支持,新3DMark基于DirectX11设计了三个不同的测试场景,分别支持不同的Direct3D Feature Level。其中名为Ice Storm的场景需要D3D FeatureLevel 9.1或D3D Feature Level 9.3(也有OpenGL ES 2.0版本),CloudGate场景需要D3D Feature Level 10.0,Fire Strike模式则需要D3DFeature Level 11。做出这样的改变,和新3DMark在测试平台和分数统计上的改变有关。
总的来看,和传统3DMark只能支持某个确定的DirectX的做法完全不同,新3DMark主动兼容了近几代的DirectX版本,这和新的3DMark希望支持ARM、x86以及Windows、iOS、Android、WindowsRT全平台测试是有关系的。
在老版本的3DMark中,场景分是总分统计中的一部分。比如在3DMark 11中,总分是根据不同场景综合测试得来,不同的场景在测试中有各自不同的任务和需求。比如部分测试倾向于全面性能考察,部分测试倾向于对CPU、GPU的特定性能比如物理加速、纹理、像素填充等能力的考察。
新3DMark现在不再给出总分,改用场景分数来代替之前的统计方式,即每个场景都有一个独立的分数。这是一个非常重要的变革。用户在宣布分数时,如果说“我的显卡在新3DMark中得到了4500分”,是不正确的,正确的说法是:“我的显卡在Fire Strike场景中得到了4500分。”
新3DMark做出这样的变化,主要有两个原因。首先是新3DMark各个场景采用了完全不同的Direct3D Feature Level,这就导致了部分显卡无法运行新3DMark的某些测试场景。如果采用总分统一计算的话,很难保证终数据的有效性和准确性。其次,FutureMark希望将新3DMark打造成全平台测试软件,因此不同等级的场景可以用于不同平台的测试。比如在目前的Android或者Windows RT上,由于性能较差、支持规格较低,因此肯定无法运行Fire Strike这种使用D3D Feature Level 11的场景,只能退而求其次运行Ice Storm。在比较分数时,只有按照场景计算分数,才能充分地比较不同平台之间的差异。从总分计算的角度来看,新3DMark的场景分更像是为每个场景设计的“总分”,和老3DMark相比,场景分只是之前总分“分割后”的结果。如果将新3DMark分割成3DMark DX9、3DMarkDX10、3DMark DX11三个不同的测试软件的话,如今的计算方法将得到三个总分。特别值得一提的是,新3DMark的分数统计和3DMark 11有很深的渊源,不但权重和3DMark 11基本相当,连一些关键性的参数都和3DMark 11完全相同。
一般用户使用3DMark,关注的就是分数,但其实还有很多信息隐藏在分数背后。对一些要求比较苛刻的玩家来说,希望能实时观察到帧率图、GPU和CPU的温度等详细信息,老3DMark是不会给玩家提供这些信息的。新3DMark都已经为用户准备好了,包括系统信息、CPU温度、GPU温度、CPU功耗都能一一进行展示。
这里值得一提的是,新3DMark的一个鲜明改变是在后结果输出时会生成帧率曲线图。用户可以根据该帧率曲线图详细分析帧数变动情况,例如一些存在帧数暴跌情况的显卡,虽然可能终得分很高,但是偶尔帧暴跌也会带来很明显的卡顿现象,在新3DMark中都可以得到充分的反映。
对之前部分用户采用显卡驱动程序锁定某些选项(比如曲面细分等级、纹理等级)获取“不正常”的高分数的情况,新3DMark似乎没有太多检测手段,依旧只能依靠有经验的用户通过观察具体的帧率、曲线图等来进行判断。
除了目前已经设定好的三个测试场景外,新3DMark还给出了自定义测试环节。在自定义测试中,玩家可以选择大量的细节选项,比如MSAA等级、曲面细分级数、材质过滤方式、环境光遮蔽质量等级、焦外模糊效果的质量等级以及基本的分辨率、运行方式等。用户可以根据自己的需求进行调整测试,获取自己需要的信息。当然,使用自定义方式测试的成绩,是不会获得终的分数的。