开云体育入口-深度解析苹果A12处理器:性能和能耗比令安卓旗舰SoC汗颜
RAM传输意味着苹果以前使用的GPU不反对RAM传输(喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵喵)、RAM传输可明显提高GPU性能。RAM传输是指从GPU到RAM的半透明框架缓冲区传输。PC末端像NVIDIA和AMD这样的制造商已经应用于该技术n多年,即使存储器比特率没有减少,也能提高GPU的性能。移动SoC的GPU也需要内存传输,因为移动SoC的比特率比桌面级GPU更有限。
Arm的AFBC是移动领域最公开发布的RAM传输方案,高吞吐量和Imagination等其他制造商也有自己的RAM传输技术。相比之下,苹果刚刚在A12引进这个功能可能太晚了,A12意味着效率和性能明显提高。
Vortex核心:大规模内存改良在谈论Vortex核心之前,必须首先了解苹果新SoC的频率。在过去的几代中,苹果公司仍在急剧提高其核心频率,同时也提高了微型结构的IPC。
下表是A12和A11的频率表:A11和A12在单核心装载时的最低频率分别为2380MHz和2500MHz,双核心装载频率分别为2325MHz和2380MHz。然而,在小核心重新加入工作后,A12的大核心频率仍被设计为稳定在2380毫米,而A11不会进一步提高到2083毫米。与越来越保守的大核心相比,A12的小核心部分更加贞操。只启动一个小核心时,A11的频率为1694MHz,A12为1587MHz启动2个和3个时,A11为1587MHz,A12为1562MHz4个小核心装载时,A11仍保持在1587MHz正如之前提到的,苹果在A12的内存结构和内存子系统上投入了很多工作。
在回归线性延迟图中,我们可以看到大核心和小核心几乎随机延迟的不道德:在大核心方面,与A11的Monsoon核心相比,A12的Vortex核心只提高了5%的频率,但L2存储器的意思是从约11.5ns下降到约8.8ns,下降幅度达到29%,Vortex核心的L2存储器可以在更短的时间内完成读写访问。在小核心方面,A12的Tempest核心与A11的Mistral核心相似,但A12在L2区和电源管理方面发生了很大变化,允许采访更大的L2物理区。
这里只进行了64MB队列的深度测试,延迟曲线似乎集中在这个数据上并不陡峭,但内存延迟已经得到改善。当小核心处于活动状态时,内存控制器DVFS的次数不会仅次于频率上升,这也是Tempest核心内存采访中没有小差异的原因:当大核心下有低阻抗时,其性能不会更好。A12的共享存储器也再次发生了很大的变化,存储器的比特率比A11减少,但采访延迟相当提高。
命令吞吐量和延迟由于苹果没有像Arm和三星那样发表其结构设计,为了比较Vortex的核心后端特性,测试了A12命令吞吐量,其中后端性能继续执行单元的数量要求,延迟了其设计质量要求。Vortex的核心看起来与Monsoon的核心非常相似,整数乘法和浮点乘法的延迟增加了两个周期,浮点吞吐量翻了一番。从结构的中端和后端来看,Monsoon的核心是最重要的改版。
到目前为止,A10处理器的大核心代是Hurricane(飓风),其解码宽度为6,Monsoon核心解码宽度减少到7,同时后端整数ALU单元也从4个减少到6个。Monsoon核心和Vortex核心有6个整数继续执行单元(包括2个简单单单元)、2个读取/存储单元、2个分支端口和3个浮点/矢量线,优秀的后端继续执行单元的规模相比,3星M3和Arm上市的Cortex实际上,如果没有典型的共享端口状况,苹果的微型结构在后端单元方面可以说比其他处理器结构多,包括桌面CPU。
CPU性能是安卓旗舰SPEC2006最重要的标准测试软件,与其他测试软件的区别在于处理的数据集更大更简单。GeekBench4已经成为业界的人气,但其测试项目小,工作阻抗也重。因此,作为标准测试,SPEC2006更具代表性,可以充分展示微结构的更好细节,尤其是内存子系统的性能。性能测试在风扇良好的环境下进行,可以确保原始运行测试套件在1~2小时内经常出现问题。
在左侧轴上,条形图对等价工作阻抗下的电力消耗状况作出反应,宽条形意味着消耗的电力越多。条形上的文字显示了消耗电力的明确数值(单位为焦)和测试期间的平均消耗电力(单位为瓦)。在大多数工作阻力下,A12的大核心频率比A11低5%,但实质上频率并不失败,因此在SPECint2006中,A12的平均值比A11好24%。
其中,增长率大于456.hmmer和464.h264ref,这也是SPECint2006套中瓶颈最少的测试。A12结构可能没有确实的根本变化,小幅度快速增长主要是由于更高的频率和内存结构的改良。
445.gobmk测试项目中A12的改良非常大,比A11的增长率为27%。该测试的阻抗特征是存储地址事件的瓶颈和分支错误预测。429.mcf、471.omnetpp、473.Astar、483.xalancbmk和部分403.gcc测试项目存储子系统脆弱,A12在这些项目中提高了30%~42%的平均性能,新的存储结构和存储子系统在这方面获得了相当大的利益在能源消耗率方面,A12比A11平均值提高了12%,但需要注意的是,这里的能源消耗率是指最低性能时的能源消耗量减少了12%,A12表示性能比A11提高了24%,两个SoC的性能消耗曲线已经大不相同。但是,尽管7nm工艺可以减少能源消耗,但在性能提高幅度仅次于的基准测试中,A12的能源消耗比A11不下降,平均电力从3.36瓦减少到3.64瓦。
也就是说,A12花提高性能的功耗比7nm工艺减少的功耗多。其次是SPECfp2006测试,XCode没有Fortran编译器,不是NDK的一部分,在Android工作非常复杂,我们可以自由选择CC和CTO基准测试。
SPECfp2006有更多的内存密集测试,在7次测试中,只有444.namd、447.dealII和453.povray在内存子系统接近标准时才能看到主要性能的回归。这对A12不利,SPECfp的平均性能增加了28%,仅次于433.milc的项目增加了75%。
某种程度的分析限于450.soplex,优秀的存储结构和存储性能提高了40%。470.lbm是一个有趣的测试,展示了苹果的结构与Arm和Samsung相比的性能优势。
470.lbm的特点最代码有大量循环,拒绝架构有更大的指令循环缓冲区优化这种工作阻抗,在循环传递中,核心将跨越decode阶段,从缓冲区提供指令。苹果的结构似乎有类似的机制,苹果处理器内核的矢量持续性能Lbm的热循环大量用于SIMD,超过3倍的继续吞吐量优势最终产生了优异的性能。(公共编号:)记录:高吞吐量的Kryo结构是独特的设计,小龙820在这个项目上的表现比最近的安卓阵营处理器高。与SPECint测试相似,A12在SPECfp测试中的能耗比显着提高,所有测试中总能耗比A11低10%。
另一方面,A12的消耗电力也增加,平均消耗电力从3.65瓦下降到4.27瓦,其中433.milc项目的消耗电力从2.7瓦下降到4.2瓦,减少了75%482.sphinx3项目的消耗电力超过了A12所有SPEC测试项目的最大值5.35瓦。总的来说,苹果在Vortex核心和内存子系统方面的改良,使A12的实际性能比宣传强。与目前最弱的安卓阵营SoC相比,A12在性能和能源消耗比上都有近2倍的压倒性优势,但长期使用A12的优势可能不大。
这也使我们对今年发布的三星M3架构有了更好的理解,也就是说,只有当电力消耗在高效范围内时,更高的电力消耗才能带来更高的性能(Exynostostos9810的电力消耗是苹果上一代A11的两倍,但其性能只有A11的一半)。GPU能耗比1.8倍于骁龙845GPU性能提升是此次A12仅次于亮点之一,通过《极简》将GPU从3核扩展到4核,并引入RAM传输技术,苹果回应A12的GPU性能比A11提高了50%。转入标准测试前必须告诉的是,在过去的两三年里,苹果开始专注于峰值性能,忽略长期运行的稳定性能,短路降频经常导致性能上升。
因此,苹果最近GPU的峰值性能和峰值功耗是一个大问题。在3DMark物理测试中,iPhone与A12相比,iPhone与去年的iPhone相当改变。3DMark物理测试至今为止对苹果的处理器有过友好的关系,这种情况在A11减轻。A12总体上再次提高了SoC的性能和能源消耗比,最后在这次测试中不及小龙845。
在3DMark测试的图形部分,iPhonexS的持续性比去年的iPhonex上升了41%,但一加六更奔放的功耗和温度允许性能更好。但是,在性能峰值方面,iPhoneXS在3DMark测试中遇到了很大的问题,测试时手机的温度低的话,测试中就不会马上崩溃。监控显示,低温时处理器频率高,平台瞬时峰耗电平均约7.5瓦,系统无法获得足够的瞬态电流,不会引起电压上升,甚至破坏GPU。
除了3DMARK,Kishonti的GFXBench多年来仍然是行业标准,新的Aztec测试给我们带来了不同的工作量。不久前,Kishonti公布了GFXBench的5.0版本,该版本在新的图形引擎上运营,引进了HighTier和NormalTier模式下的新测试场景Aztecrruins。新测试更考验着色性能,利用更简单的效果特别强调GPU的算术能力。NormalTier模式下的Aztec。
Ruins测试的拒绝相对较低。苹果XS的峰值性能比去年的苹果X提高了51%,而持续性能提高了61%,比一加6提高了45%。
在HighTier模式下,iPhonexS的持续性比iPhonex高61%,比1加6高31%。在功耗方面,由于没有时间在各种设备上测量Aztec,依然依赖标准的曼哈顿3.1和T-Rex测试数据。曼哈顿3.1中,iPhoneXS的性能比iPhoneX高75%。这里的改进不仅仅是减少的核心,RAM传输技术也是减少RAM功耗的功劳。
环境温度22°C时,A12测试曼哈顿3.1时的峰值功耗超过6瓦。但是,即使在这样的高峰消耗电力下,A12的效率也达到了其他SoC,说明了苹果对消耗电力的控制非常有效。运营测试3分钟后电力恢复到合理的3.79瓦,此时处理器的能源消耗比仅比峰值消耗时间提高16%,证明A12的能源消耗比曲线非常缓慢,6瓦的峰值消耗仍在芯片本身的高效率范围内,苹果在芯片设计中的能源T-Rex测试中,iPhoneXS的持续性能比iPhoneX上升了61%,但消耗电力接近曼哈顿3.1测试,峰值消耗电力略高于6瓦,几分钟后下降到4瓦以下,消耗电力比一定程度上升那么,为什么近两三年的苹果处理器在峰值性能和持续性能之间没有这么大的区别呢?本质上,这种变化是由于日常GPU应用于场景的变化,苹果公司将GPU作为非3D应用于加快市场需求。苹果对API栈的横向构建和严格控制意味着GPU加速成为现实,峰值性能是最重要的指标。
苹果大量使用GPU作为其他用途,例如在应用程序中使用GPU进行摄像头图像处理的硬件加速。这些应用于场景是事务性的工作阻抗,必须提前处理高峰性能。
相比之下,过去几年,安卓在GPU计算方面仍然是一场灾难。这个主要鬼在AOSP中没有反对OpenCL-这使得供应商对OpenCL的反对非常不完善。
RenderScript无法确保性能,因此没有得到过多的注意。目的是Android设备和SoC的碎片化意味着第三方应用程序基本上不能用于GPU计算。由于新的A12处理器,iPhone和XSTMax展示了业界领先的性能和效率,现在是最好的游戏移动平台。但而,苹果仍然用手机的热量做作业。
iPhoneXS像上一代iPhoneX一样热量过于集中,对体验产生影响。via:Anandtech版权文章允许禁止发表。下一篇文章发表了注意事项。
本文关键词:开云体育入口
本文来源:开云体育入口-www.hslsls.com