机情观察室:华为麒麟960性能全面解析

2016-11-10 13:32:24     作者:石雨      来源:it168

标签: 麒麟960 华为Mate 9

随着智能手机所承载的功能越来越多的时候,处理器则显得至关重要。10月17日,华为在上海召开发布会,正式发布最新一代SoC:麒麟960。作为目前国产移动端处理器中唯一可以商用的SoC,每一代麒麟芯片的发展都备受关注。此次麒麟960采用ARM最新发布的A73架构(包括GPU/内存规格的提升),进一步提升Modem,升级ISP图形计算能力。

  【IT168 评测】随着智能手机所承载的功能越来越多的时候,处理器显得愈发重要。10月17日,华为在上海召开发布会,正式发布最新一代SoC:麒麟960。作为目前国产移动端处理器中唯一可以商用的SoC,每一代麒麟芯片的发展都备受关注。而在发布会后,我们也对麒麟960的最新特性进行了简述,此次麒麟960主要在性能、拍照、安全、连接性等各方面均有所提升。我们今天的机情观察室,就这款在网上号称比肩骁龙820的国产处理器进行解读,看看麒麟960究竟是一款怎样的产品。

  对于一款智能手机的SoC,已经不仅仅局限于CPU这一单元,而是包括Modem、ISP、GPU、内存等各部分组件的综合体。而在这一代麒麟960上,通过架构图(下图)可以看到,麒麟960在CPU架构、GPU型号、Modem、ISP、内存规格等各方面均有所提升(黄色部分)。相比之前,麒麟960逐渐补齐了之前为人诟病的短板,在几个关键组件上都达到目前业界大规模商用处理器的旗舰级标准,并且在ISP、安全芯片方面有着自主研发成果的优势。另外大家可能也注意到,麒麟960采用A73架构,而当业界顶级处理器都已采用自研微架构的时候,华为麒麟仍然坚持遵循ARM公版架构的升级。而最新的A73架构实力究竟如何?我们继续往下看。

  全新的A73架构


▲麒麟960架构图

  在移动SoC领域,目前诸如骁龙820、苹果A10 Fusion这样的旗舰芯片都已经采用自研微架构,而麒麟则一直沿用ARM公版架构。此次麒麟960选用ARM最新推出的A73架构,16nm FinFEF+工艺。我们都知道,更先进的架构与更先进的工艺能够将处理器性能提升的同时兼顾功耗的控制。在去年的麒麟950上,华为大胆选择16nm FinFEF+工艺,成为首款采用16nm制程的商用SoC。而在今年的选择中,华为并没有冒进的选择10nm,而是仍然延续了16nm工艺。对此,华为表示在目前可商用量产的范围内,16nm仍然能保证A73架构的功耗,并且横向来看,此次对于工艺和架构相比,架构的提升更为重要,而且在目前的节点10nm工艺量产尚不成熟,因此麒麟最终选择16nm。

  架构方面,麒麟960遵循ARM公版架构升级的方案,选择A73架构。对此,华为表示术业有专攻,自研架构对于麒麟目前并非是最好的结果,更何况决定CPU的指令集与架构都是ARM发明的,因此如果没有大幅度的提升,自研与采用公版架构并没有太大区别。相比于竞品,麒麟更追求在综合性能的提升。

  在官方介绍中,Cortex-A73仍然采用全尺寸ARMv8-A架构,最高可以达到2.8GHz主频,可以使用10nm、14/16nm工艺,而根据ARM官方介绍,当A73使用10nm工艺时,对比上代16nm工艺的A72,性能有30%的提升,并且对AR/VR都有更好的优化。A73是采用ARMv8-A架构中核心最小的处理器,每核心面积在0.65mm,并且继续支持big.LITTLE架构。

  另外,A73与A72在架构上也有很大的区别,A73采用双发射L/S单元,在发射宽度上小于A72的三发射,但由于A73整个处理器的11级核心流水线深度比A72的15级核心流水线深度更精简,因此发射宽度并没有决定性的影响到A73的性能。但由于A73的一级缓存由48kB提升至64kB,二级缓存由A72的最大2MB提升至8MB,并且为一级缓存和二级缓存都配备了独立的预读器,使得A73可以获得接近理论的最大带宽值。得益于各种优化,使得A73在极限性能上相比较A72有所提高,并且支持UF 2.1的内存规格,这也使得麒麟960在数据的读写上相比之前有不小的提升。在麒麟960的闪存读写测试中,连续读写与随机读写的性能比采用A72的麒麟950要高出数倍之多。

  目前智能手机的高度集成化,内部空间几乎是寸土寸金,尤其是对于主板部分,极其复杂的电气结构使得对手机处理器的选择心有余而力不足。A73号称目前处理器中面积最小的高端核心,每颗核心的面积在0.65mm之下,相比于A72上1.15mm2的面积整整小了43%,而根据ARM的数据:A73在采用10nm FinFET工艺,配备2.8GHz四核心的情况下,核心面积只有5mm2。一般来说,手机处理器的制造成本与面积大小成正比,面积越大成本越高,而更小的处理器面积带来更小的成本。

  另外,从架构图上,我们可以看到,在DIC Interrupt Control区域中终于用上了在A72时就已经发布的CCI 500。而在此前麒麟950的介绍中我们对此也已经有所介绍,实际上CoreLink CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,允许CPU所有核心可以同时调度,这样处理器的在执行缓存查询的工作量随之降低,效率更高,相信大家都听过所谓的“一核有难,其它围观”,就是因为之前处理器中簇与簇之间协同效率低下。而相比之前麒麟950中的CCi 400则对内存互联性则支持不够,并且带宽总线也有所限制(CCi 400最高值支持12.8G/s,CCi 500理论可达25.6G/s)。因此在内存贷款得分上,麒麟960相比950以及其它竞品有着将近1倍的提升。

  当G71遇上Vulkan

  此次麒麟960采用ARM旗下最新一代GPU:Mali G71,采用Bifrost架构。与之前midgrad架构相比,Bifrost最大的创新在于使用指令组着色器(ClausedShader)。官方宣称:G71重新设计了执行单元,将指令集分组到预先设置好的程序块,使指令组可以自动执行且不会中断。可以确保所有外部依赖在子执行前便已就绪,临时计算的结果无需访问寄存器组,减小对寄存器文件的压力,显著降低功耗;通过简化执行单元的控制逻辑,GPU的面积也得以缩小。另外Bifrost架构还采用Quad based vectorization技术,相比于之前SIMD矢量化技术一次只能执行单一线程,Quad矢量化技术最高支持四线程执行,共享控制逻辑,使用率接近100%。

  其它方面,Mali G71主频为850MHz,在官方给出的成绩中,基于16nm工艺下,Mali G71拥有27.2Gpix/s像素填充率以及850Mtri/s三角形填充率(基于32核心),相比T880在像素填充率增加一倍,但三角形生成率则只有之前的1/2。出于对功耗及芯片面积大小的控制,此次麒麟960采用Mali G71 MP8(当然不可能用32核)。并且向我们展示麒麟960的跑分测试性能。在曼哈顿1080P离屏测试中,麒麟960成绩甚至提升2倍之多。

  另外,此次Mali G71在支持OpenGL等API的同时还支持Vulkan接口标准。一直以来,大部分3D游戏都通过OpenGL标准交互,但由于其出生于90年代,如今的OpenGL已经显得廉颇老矣,对于目前市面上多核处理器的利用效率较低,在图形处理的效率上比较低,无法完全释放GPU的实力,有种大马拉小车的感觉。因此在麒麟960上,率先完整支持新一代图形API规范:Vulkan。相比OpenGL,Vulkan改善多线程性能,渲染性能更快,摆脱OpenGL依赖CPU运算的方式,使GPU与CPU之间无需事先拷贝数据,在同样的内存下同时进行读写,充分发挥多核处理器的并行计算能力。

  第三代双摄ISP:

  随着人们对手机拍照的要求越来越高,对于图形数据的后期计算的地位甚至几乎与镜头本身的素质相提并论。因为对于如今的智能手机,摄像头镜头模组与机身厚度的矛盾使得注定在画质上无法与单反相比,更多的是从算法上来弥补硬件先天的差距,华为能做的就是自主研发ISP。因此麒麟960采用华为自主研发的PrimISP 2.0,并且内置于SoC中。内置高清HD硬件深度图形处理器、超分辨率技术、支持4K硬件视频防抖。尤其在双摄方面升级至第三代双摄技术,模拟人眼深度感知3D对焦,支持黑白双摄实时融合处理,能够捕捉更多的细节,在暗光情况下能够降低噪点。相比于上代PrimISP,2.0中增加了对图像的深度计算、超级分辨率、视频防抖的支持。

  在华为一直坚持的双摄方面,麒麟960模拟人眼的生物特性,带来第三代双摄技术。在人的眼球中,主要由杆状细胞与锥形细胞两种细胞构成,锥形细胞分辨物体色彩,杆状细胞带来物体细节。在单眼中约有1.2亿个杆状细胞,600-700万个锥形细胞。因此在人们平时观感过程中,对于物体细节的提高比色彩的提高更加敏感。因此华为在双摄技术中始终坚持走“黑白+彩色”的路线,这也与高通所谓的“Clear Sight”有着殊途同归的方向。但不同在于Clear Sight是基于双ISP(黑白+彩色)图像融合,在这方面麒麟与高通还有些差距。

  达到业界领先的Modem

  通讯一直都是华为最值得骄傲的竞争力,但在麒麟950上却出人意料的最高只支持到CAT6规格,而今年年初的竞品也早实现了CAT12规格,并且CDMA外挂基带也一直被人所诟病。因此在麒麟960上集成了全新自研全模Modem,在CDMA专利方面终于有所突破,麒麟960全面支持GSM/UMTS/CDMA/TD-SCDMA/TD-LTE/FDD-LTE目前最常使用的六模330MHz-3.8GHz全频段,麒麟960也成为麒麟系列中首款支持全网通的芯片。在双卡双待方面,麒麟960支持4G+2G、4G+3G、4G+CDMA等各种不同网络制式下的双卡组合,对于目前一些国家已经取消2G网络的情况也可以支持。

  在网络连接性上,麒麟960支持4CA或2CA+4*4 MIMO,峰值下载速度达600Mbps,将通信规格升级到Cat12/Cat13,带来全新的VoLTE语音技术升级为悦音2.0,包括:HD Voice、VoWifi(微信语音通话),频谱范围扩展100%,采样率提升100%。麒麟960的智能语音增强技术SPLC,能够对用户语音进行动态智能补偿,去除50%的杂音和语音断续,减少卡顿感,提升语音通话体验。在理论性能上追平至业界顶级水平。

  更加智能的协处理器:

  从整个设计思路上可以看出,麒麟960整体在性能与功耗上着重下功夫,而对于当前智能手机,在电池技术一直没有突破的情况下对使用协处理器的办法,利用更少的电量做更多的事情,对CPU的功耗问题是个曲线救国的策略。麒麟在之前经历了i3、i5的应用。在麒麟960上,对i6也进行了进一步优化,赋予i6协处理器更多的任务。进一步降低CPU的负担。

  在麒麟960上,i6与A73、A53协同共享资源,在手机休眠时独立接管轻量级任务,但只消耗1%的功耗。与i5相比,在典型PDR业务下,功耗下降75%,计步器业务,功耗下降40%。并且i6的融合运算包括高精度围栏、情景感知、低功耗GPS定位、低功耗多基站定位、低功耗导航、AOD(屏幕常亮)功能。这样的变化也使得在未来运行一些基于LBS的AR类应用(Pokeman Go)降低70%功耗。

  强大的安全性:

  随着智能手机承载的功能越来越多,无论是信息安全还是金融安全都已经变得越来越重要,因此央行以及银联对移动终端金融的安全解决方案也提出了监管的要求:千元级的支付需要单因子验证(静态密码或生物识别)、万元级需要双因子(静态密码及指纹识别)、5万-百万级的支付需要三因子以上(数字证书或电子签名、静态密码、生物识别),因此目前一些主流的手机支付都有一定的额度限制。

  麒麟提出的inSE方案则率先获得银行、银联双重芯片安全认证,是全球首款达到金融及安全的芯片。得益于华为在通信方面多年的深耕,麒麟960从芯片底层主动防御伪基站,在2G/3G网络环境下,手机进入基站范围时对基站机型认证,拒绝与伪基站发生通信,从根本上解决了伪基站的风险,保护用户的连接安全。

  并且麒麟960将安全芯片与SoC集成在一起,相比较于其它安全解决方案,inSE安全方案使得处理器、安全芯片、内存都融合在一起,使得安全芯片无法被替换,从根本上保证了手机的安全,并且麒麟960支持CRT-RSA、RSA、DES/3DES、AES加解密算法,有着很高的安全程度。

  总结:此次沟通会上,华为为麒麟960定下的主题为“创新拒绝迷途”,其实创新这个词从15年开始就被反复提及,在手机已经严重同质化的今天更加难得。关于麒麟960的产品,相信通过前面的分析也已经有了一个大概的印象:尽管在一些发散型功能上麒麟与成熟的高通还有些差距,但在一些关键组件的性能指标已经迎头赶上,整个麒麟960没有哪部分成为明显的短板为人诟病,并且在均衡的基础上,能够发挥自己与终端紧密结合的优势,针对用户实际的需求进一步改进。创新并非可以一蹴而就,需要动心忍性,麒麟960已经证明了自己能够站到第一梯队的高度,我们也期待华为麒麟在之后还能带来更令我们惊喜的产品。

返回沙发首页  
沙发管家微信
扫描关注沙发管家微信 QQ群: 沙发网官方群 微博:

资讯评论

亲,你需要登录后才能进行评论喔!

还没有评论,快来抢沙发吧!

提示

相关文章推荐

热门设备安装方法 查看更多>>

最新设备

智能电视 / 盒子评测

安装指南

应用

热门专题