您的位置: 主页 > VR2048 > ARM下一代GPU Mali Cetus性能概述:强劲的显示驱动 | VR2048

ARM下一代GPU Mali Cetus性能概述:强劲的显示驱动 | VR2048

时间: 2017-07-03阅读:

↑ 点击上方“VR2048”关注我们


在ARM Mali团队中,我们通常不会谈论我们的产品,直到它推向公众并准备开始打进硅。我们为令人那些兴奋的事情做个例外。去年的这个时候,我们为您提供了最新的视频处理器Mali-V61的预览版,提前推出,那时其代号Egil。今年没有什么不同,我们对即将推出的显示处理器非常兴奋,它建立在全新的创新架构之上,我们迫不及待给你细节。


显示 

 

显示处理不是一个拥有很多新闻的领域,但是我们看到它每天都在我们面前工作,但是非常理解,我们很少考虑它是什么,它是如何工作的。那么显示处理器是像智能手机这样的设备应用处理器的最后阶段。其主要功能是将由GPU和VPU处理的像素驱动到显示面板进行查看。看起来很简单吗?它实际上比你想象的要复杂很多。随着我们从CPU和GPU中的需求越来越多,显示处理器可以将GPU / CPU从以SW为中心的功能卸载到固定功能硬件,以减轻实时性能需求,并优化不断缩小移动设备处理器执行丰富的功能,包括多层组成,正交旋转,高质量向上和缩小,色彩和色域管理操作和双显示模式。我们的许多合作伙伴保留自己的专有的内部显示图像处理算法来区分其产品,这意味着我们的显示架构也必须提供一种连接到这些功能的手段,而不需要系统内存。这通过协处理器接口实现,该处理器接口在显示管道中实现多个阶段的区分。

 

代号为Cetus的下一代显示处理器基于我们以前的产品Mali-DP500,Mali-DP550和Mali-DP650的卓越技术,以满足行业日益增长的需求。那么这些驱动要求是什么?几个即将到来的技术,就是这样。我们都知道VR正在推动高性能图形处理的发展,但是你知道它也影响显示吗?这是因为显示器比传统产品更接近您的眼镜,因此我们需要在同一空间内提供更高质量的像素。沉浸式VR体验所需的刷新率也是一个因素,意味着现代显示处理器需要能够以60-90FPS的速度运行4K×2K显示器。高动态范围(HDR)是显示要求演变的另一个因素。它通过驱动显示器来支持HDR视频标准,实现更高的保真度观看体验。其他因素,如多窗口模式,允许多个活动可见,以及自刷新内容以节省电力的命令模式面板,也增加了这些更高的要求,并且要求更多的显示处理器。



随着这些日益增长的压力,显而易见的是,我们现在需要对构建显示处理器的架构进行大修,并解决所需的功耗和质量优化问题。现在我们已经看到了我们需要什么,为什么需要,以及如何解决它们。

 

多层组成

 

随着智能手机成为越来越多消费者选择的设备,我们需要能够与他们做更多的事情,而且重要的是我们需要能够同时做更多的事情。Mali-Cetus的新架构在双显示输出模式下,每个显示器驱动单个显示器或多达4层时,可为Android-N设备提供多达8个独立的组合图层。这可以通过改进层处理单元(LPU)和组合单元来实现,不仅增加了灵活性,还可以在驱动单个显示时实现智能资源共享。

 

Mali-Cetus中的两个接口板的主要作用是从系统缓冲区读取视频或图形层,并将它们引导到单独的管道中,然后再将它们馈送到组合单元。另外,存储器系统可以将组合结果写回存储器,用于离线组合或进一步处理以及通过WiFi传输用作虚拟显示器。AFBC解码器子系统内置在LPU中,每个LPU可以解压缩多达四个显示层,总共八个。然后,组合单元负责这些层的alpha混合以及到缩放子系统和协处理器接口(CPI)的数据流管理,然后将数据引导到显示输出。

 

组合单元包含缩放子系统,其由两个具有12位每分量精度软件可编程滤波器系数的高质量缩放引擎和具有边缘检测机制的初始相位图像增强器组成。这允许系统在组合之前和之后同时缩放。它还使软件能够通过并运行可用的缩放引擎来优化缩放效率。例如,当在4K层上执行缩小时,它将进行水平分割并且在两个分开的缩放引擎上并行执行!当驱动单个显示器时,两个组合单元之间的智能资源共享意味着可以并行执行4个缩放操作。



并排处理

 

Mali-Cetus支持一种称为并行(SBS)处理的新模式。SBS功能将帧分成两半,并行处理每一半,同时只启用一个显示输出。帧的一半由LPU0,CU0和DU0处理,另一半由LPU1,CU1和DU1处理。 基本上,这具有将给定性能点ACLK频率减半的效果,同时导致了下一代优质移动和VR设备定向4K90fps所需的更高吞吐量,但可以通过针对超低驱动电压实现进一步节省电力。

 

正交旋转

 

在非ARM帧缓冲压缩(AFBC)视频YUV层上执行正交旋转会严重影响系统性能,并会消耗比必要或可持续性更多的功率。因此,Mali-Cetus显示架构可以消除非AFBC层从实时路径的旋转,以减少导致可见伪影的风险。显示处理器中的AFBC直接存储器访问(DMA)单元负责读取非AFBC层并将其转换为AFBC(从线性转换为块格式),然后将其写回系统存储器,以便接口板可以把它们作为实时路径的一部分。 全新的显示架构具有显着提高效率的MMU缓存以及旋转层的DRAM存储器访问模式。



显示输出单元

 

显示输出单元(DOU)是显示处理器系统的最后一个阶段,并且在将图像发送到显示器之前执行各种功能。对于HDMI 2.x和eDP / DP,它具有RGB到RGB转换,伽马校正、RGB到YUV转换等能力。其中的后端子系统负责显示定时控制和同步。它在输出端输出,并且还为支持面板自刷新的命令模式。命令模式面板是重要的,因为它们可以提供显着的省电。除了应用处理器以1/60秒60FPS把帧发送给面板,应用程序将等待面板在需要新帧时提供输入。面板自我刷新不改变内容,而不是依赖于处理器来连续发送帧并以特定方式生成时序。



ARM SMMU提升系统性能

 

不仅仅是显示新体验的好处,而是通过使用基于ARM Corelink的SMMU策略,各种优化作为多媒体子系统的一部分可以提供更好的整体性能。这允许系统中更简单的显示处理器和SMMU集成,以及与上一代产品相比,支持ARM Trustzone TZMPv1和TZMPv2架构以及拥有较小的SMMU面积。这个优化的子系统可以导致延迟容差超过以前的Mali-DP650显示处理器的四倍以上。

 

HDR

 

最后,如前所述,HDR是行业未来的重点。借助这种新架构,我们可以使用其协处理器接口之一将ARM Assertive Display与Mali-Cetus无缝集成。这构成了ARM提供的第一个HDR解决方案,也是显示技术的重大进步。它支持HDR10和HLG HDR视频,HDR视频与SDR层的Alpha混合(组合)以及HDR和SDR显示面板的HDR色调映射。



我们与各种显示器供应商公司和标准机构紧密合作,实现优化的显示解决方案和未来新兴AR / VR显示技术,旨在优化系统性能和功耗、降低移植和集成的复杂性。 显示处理器是一个复杂的野兽,所以当然有许多其他的事情我们可以谈论,但请您等待我们最终产品的到来。


VR2048昨日新闻回顾

Pornhub将带有交互远程性爱功能放入了VR分类中 | VR2048


使用VR工具教育小朋友对于开车马虎的司机的危害性 | VR2048


调查:80% VR AR MR开发者在做游戏 | VR2048


Google发布Advr一个关于VR广告植入的实验项目 | VR2048


除了YouTube 推出的VR180格式,这些角度的视频格式你也不能错过 | VR2048





我们致力于服务 VR/AR 爱好者,从业者和开发者,传播先锋资讯。
更多资讯:www.vr2048.com

主编微信:jianxiong_hu
商务合作:press@vr2048.com
欢迎关注微信公众号: vr2048com
点击下方“阅读原文”查看更多

上一篇:Pornhub将带有交互远程性爱功能放入了VR分类中 | VR2048
下一篇:最新交互投影展示了剧场AR的未来前景 | VR2048

相关阅读