本文主要内容转自知乎《手机标准化评测方法的梳理和解读V2.0》。主要摘选了原文关于GPU性能评测的章节,并在原文基础上对于部分内容作了注解。如有版权不恰当引用,请及时联系我。

在阅读本文前,我先对业内有名的工具做一些介绍。

GFXBench

GFXBench是移动平台最常见也是最权威的GPU测试软件之一了,很多人都知道它的曼哈顿、霸王龙测试,其在移动GPU基准测试上的地位跟PC界的3DMark差不多,反而是3DMark自己在移动平台没那么受欢迎。随着移动GPU的性能不断提升,GFXBench的测试场景也在不断升级,最新的GFXBench 5.0增加了Aztec Ruins(阿兹特克废墟)测试场景,分辨率可达2K级别,并支持DX12、Vulkan等API,其要求之强悍,足以把当前手机/平板的苹果A11、骁龙845、麒麟970榨干。

img

Aztec Ruins

GFXBench 5.0的Aztec Ruins(阿兹特克废墟)开发了三年多了,早在2015年官方就宣布过开发5.0测试了,2016年还在GDC大会上演示过,直到现在才正式发布。至此GFXBench的高级测试中已经有四个主要的测试场景了——曼哈顿、曼哈顿3.1、Car Chase及Aztec Ruins,技术越来越先进,要求也越来越高。

img

说到Aztec Ruins的具体要求,首先它支持的API更加先进,除了移动平台的Metal及OpenGL ES 3.2之外,还有桌面级的DX12、DX11及OpenGL,最重要的则是跨平台的Vulkan,官方介绍中提到Aztec Ruins的引擎支持多线程、后期特效预录制命令缓冲区、延迟渲染等技术。

Aztec Ruins有High及Normal两个级别,前者是2560x1440分辨率的,后者是1920x1080分辨率的,同时每个级别还有offscreen及onscreen之分。

img

虽然现在的测试样本还比较少,不过新的Aztec Ruins场景绝对可以说说移动GPU杀手,High级别offscreen测试中除了iPhone X、iPad Pro能维持10fps以上的帧数,骁龙835及以下处理器帧数都跌破个位数。

img

Normal级别的测试倒是好多了,不过30fps以上的主要还是苹果iPhone X及iPad Pro。

性能测评其实是手机测评里最好测试,数据最好量化的一个部分。因为测试性能你只需要手机本身和一台PC而已,可以说是基本没有门槛的一个项目了。手机的性能测试分为两个部分,分别为基准性能测试(跑分)和游戏帧率测试。

基准性能测试

首先是基准性能测试,许多人现在可能在测评中不太看重跑分了,觉得跑分不太能体现手机的真实性能表现,但是跑分依然是一台手机极限性能的标准测试方式,我们也可以通过一些特殊的方法让基准性能测试展现手机性能的性能释放,散热和降频情况。

工具上我推荐CPU项目的GeekBench5(需要Google Play),GPU项目的3D Mark,GFXBench5.0(需要Google Play)和闪存项目的Androbench5.0。不推荐大家使用安兔兔和鲁大师作为跑分工具,这两个跑分工具在过去都存在过不同程度的争议问题,其中鲁大师还出现过“660跑分比835还高”的闹剧,可信度较低。

关于这几个项目,我具体说一下GFXBench的测试,GFXBench的测试项目在这几个测试工具是最多的,分为高水平测试,低水平测试和其他项目,而高水平测试中又分为新项目(阿兹特科)和老项目(Car Chase,曼哈顿,霸王龙),目前来说,我推荐大家使用高水平测试进行测试,低水平测试对于目前的手机性能来说已经非常小儿科了。

通常来说,如果你想测试一款手机的极限性能,单独测试神庙的几项就可以得到成绩了。但如果你想得到手机在高发热情况的性能释放和散热情况话,把整个高水平测试项目跑完是一种很好的测试方式,在跑完神庙测试后,手机的发热已经达到一个很可观的程度,这个时候的性能释放水平就很有参考性了,散热不好或者调度机制保守的手机这时候就会出现降频的情况。

使用软件测试完数据后,尽量不要使用截图的形式展示成绩,目前大家基本上都是使用手机看文章的,使用竖屏截图对于读者的体验非常差,使用Excel整理数据并制出表格是更好的一种方式,在对比测评中,这样也能更好的展示不同产品数据的差异。

img

游戏帧率测试

然后便是游戏帧率测试了,测试工具首推腾讯的Perfdog,快否由于长期无更新,目前绝大部分手机都不再适配了,而GameBench需要付费使用。

目前来说,腾讯这个既好用,又不需要付费。而且腾讯这个软件支持WiFi传输帧率数据到电脑上,所有的数据都会云备份到电脑端,注意在测试的时候要打开所有的数据采集。

PerfDog | 移动全平台性能测试分析专家perfdog.qq.com/img

Prefdog有许多项数据,这些数据将有助于你对手机的性能释放情况和性能策略进行分析,让你知道为何这台手机在游戏里的帧率很高/很低。

CPU Clock可以查看八颗CPU核心在游戏过程中的频率,你也可以单独选择查看一下,下图展示的就是小米11超大核在原神游戏中的运行情况。

CPU温度

而CPU温度则有助于帮你了解一台手机的温度墙,温度墙,顾名思义就是手机预设的Soc温度的临界值,当传感器采集的温度数据达到这一数值时,Soc将会降低性能,将温度降低至一定程度后再恢复满血输出,如果温度墙设定的过低或者手机的性能释放策略不合理,手机在游戏过程中将会出现较为明显的掉帧,在掉帧的同时关注手机的CPU频率和GPU频率,可以有助于帮助你找到原因。

img

Battery,就是手机在游戏时的功率和消耗的电量,功率上双电芯的手机采集的值通常是手机功率的1/2(当然也有不是的),如果Prefdog采集的功率数过低,而你手上的手机又恰好是双电芯快充的,把数值乘以2就对了。

img

GPU功耗

另外,你也可以使用PrefDog和GFXBench5.0采集手机的GPU功耗数据并计算GPU能耗比。目前绝大多数媒体和发烧友都以GFXBench 5.0为测试GPU的方式,具体方法如下:

GFXBench 5.0需要联网挂载工具运行,因此我们将所有手机的设置统一为“最低亮度”,“开启飞行模式并打开WiFi,连接同一网络”,“后台挂载工具,使用相同节点”,“使用同一版本的GFXBench5”。

使用Prefdog测试功耗,先将手机所有后台和功能关闭,亮度最低,仅开启WiFi,测试手机在此时的空载功耗,具体方法为选择手机桌面为测试软件,将手机静置不做任何操作,关闭动态壁纸和所有的动画,测量1秒后,注意在连接WiFi时部分手机在静置后会开启自动云备份或者APP更新,如果测试出的功耗过高或者测试时出现CPU占用率过高的情况,你可以先将这些功能关闭后再重新测试,如果不是这些情况就需要你自己一个一个排除了。最终我们得到了这样一段功耗曲线和平均功耗值,对数值进行记录。

img

再挂载工具使用GFXBench 5.0进行单项离屏跑分,跑分时采集平均功耗数据并减去空载数据,得到手机处理器的功耗,我们推荐的单项测试项目为1080P曼哈顿3.1离屏,1440P阿兹特克离屏(OpenGL/Vulkan )。

注意,Prefdog可以选定有效数据再导出,为了排除干扰,选择没有网络运行的数据导出并计算平均功耗

img

导出的数据是一个Excel形式的表格,最底下记录了各项数值,你也可以单独使用数据制作折线表。

img

帧率,功耗,和能耗比

最终得到了帧率,功耗,和能耗比。

img

具体的测试游戏方面,其实各位可测的选项有很多,但是要注意的是,市面上绝大部分游戏使用骁龙710这个级别的处理器即可满帧,例如王者荣耀,对于百元机以外的产品完全没有测试的必要,既然要测试,那就测试性能需求高的游戏。

目前市面上比较主流,对性能需求较高的游戏有 三款,分别是和平精英,狂野飙车9和原神。开启全高画质,和平精英满帧至少需要骁龙765G/麒麟810级别的处理器,而崩坏3安卓端和原神至今没有能够满帧运行的处理器。

在测试和平精英的时候,你可能会遇到和平精英没有适配测试机型的情况,例如我前一段测试的Mate 40 Pro,其支持的画质仅仅有HDR高清+40帧,这个时候,你就需要PUBG Tool来破解HDR高清+60帧的画质选项了,正版在酷安可下载,但是不推荐购买付费版,因为你就算买了付费版许多机型依然不能破解90帧的画质选项。

img

还有,许多做手机测评的朋友由于没玩过崩坏3,在崩坏3的测试中会存在一些误区。例如在测试关卡和角色的选择上,崩坏3每个角色都有着不同的粒子效果,有的简单,有的就很丰富,关卡也是差不多的情况,难度高的关卡需要渲染更多的怪物,这对手机性能的需求同样是一种挑战。因此来说,我推荐各位使用活动中的角色试玩关卡进行测试,首先,角色试玩关卡不需要你买新角色,不需要打通多少关卡,门槛非常低,而且角色试玩关卡的内容基本上都是崩坏3新版本的内容,崩坏3每个版本更新都会提升对手机性能的需求,相对来说也有一些前瞻性。

img

原神这个游戏也和崩坏3比较类似,具体的测试场景我推荐在蒙德城和璃月港跑图,以及在庆云顶飞行,这几个场景大多需要渲染更多的内容,而粒子效果较多的场景,我个人更加推荐打无相之雷,操作最简单,例子效果也比较多。

img

最后说一下机身温度测试。目前消费电子产品评测使用的温度测试设备为红外热成像仪,便宜的价格通常在一千到两千元不等,贵的就没数了,一般测温使用的测温枪是不适合测量手机温度的,不少媒体用的是Filr的手机热成像,直接插在手机上就可以用了。