本文来源于“东吴电子谢恒团队”微信公众号,为东吴证券分析师谢恒团队发布的最新研究报告,原标题为《5G助推,AR成熟指日可待》。
投资要点
前言
头戴设备最有希望成为继手持终端之后的下一个变革性智能产品,可通过沉浸式交互、视觉和音频三个维度提供丰富的体验。而在这个时点,随着5G成熟以后,通过高带宽通信、边缘计算可以显著改善头戴设备使用体验,头戴设备将从“头盔式VR”升级成“眼镜式AR”,商业成熟指日可待。
【1】沉浸式体验加速实现,AR交互渐入佳境
未来AR设备集成更多AI功能时可以做到更小更轻。通过设备的渲染可以做到沉浸式体验,让体验者真假难辨。我们认为需要从直观交互、视觉和音频三个维度进行提升,利用手势、眼球追踪、平行处理、3D音频等技术加速实现。
【2】5G高速传输和边缘计算崛起,体验感大幅提升
5G高速传输的特点,可以有效降低时延、解决眩晕问题。同时,随着未来AR上的应用增多,对计算能力要求提升,5G时代可以让本地的计算转移到云端,在边缘云上做大量的处理,并通过5G的快速连接迅速传到本地。而本地也会进行一些低延时的处理,这样云端和本地通过5G就可以达成无缝衔接的配合。
【3】国际巨头逐渐浮出水面,行业拐点来临
终端厂中,苹果11年开始介入AR领域并完成多起并购,近期数项专利密集公布,AR设备呼之欲出。华为、三星18年分别推出AR引擎和AR云服务,加速产业布局。芯片大厂高通也在针对未来的AR产品开发相应的芯片方案,适配算法、集成AI引擎、形成不同的人工智能硬件模块,对于开发者提供SDK,对生产制造商提供工具,目标将整个生态做大、做全。
【4】带动相应供应链机会
AR头戴设备信息输入以摄像头为主,并集成丰富的感光、温度等传感器。随着计算边缘云化,信息处理芯片成本有望降低。输出成像方面,光波导式优势相对较大,LCOS和LOE为核心器件。要实现这些技能主要是需要wifi和蓝牙的快速连接,未来的挑战性很大。继续推荐深度布局AR光学元器件、模组的水晶光电,建议关注LCOS生产商韦尔股份(收购豪威),光学元件厂商联创电子、利达光电,深耕微投影技术的福晶科技,光学模组厂欧菲科技、舜宇光学(02382),以及整机代工厂歌尔股份、闻泰科技。
风险提示:AR渗透不及预期,5G建设不及预期。
正文
1. 沉浸式体验加速实现,AR交互渐入佳境
1.1. Oculus掀起头戴式设备热潮
AR、VR技术兴起已有一段时间,Facebook重金收购Oculus后于15年推出OculusRift,凭借带来的沉浸式体验,掀起了头戴设备的热潮,根据IDC数据,2016年全球AR/VR销量就突破了1000万台,以VR设备为主。
1.2. 三个维度提升AR沉浸式体验
早期的AR/VR设备外观体积大且沉重,未来集成更多AI功能时可以做到更小更轻。通过设备的渲染可以做到沉浸式体验,让体验者真假难辨。我们认为需要从以下三个维度进行提升:直观交互,视觉和音频。
1.2.1.直观交互
目前手机的直观交互主要通过双手触摸,PC的交互是打字和鼠标,在AR上这样的交互将会更加广泛。AR在赋予了更多的AI功能后,使用者可以解放双手,利用眼球追踪、手势识别、手柄控制甚至是人体移动范围进行信息输入,AR的基本功能是解放使用者的双手,当设备可以捕捉多种手势的时候,就可以实现无线输入。还有眼球的朝向和动作,若设备捕捉到,则可以用眼神进行交互。
眼球追踪:所谓眼球追踪,是指一项技术能够追踪眼球的运动,并利用这种眼球运动来增强某个产品或服务的体验。眼球追踪对于AR的关键性在于:
1)眼球追踪能够实现注视点渲染。当前AR普遍使用全局渲染,即无论是焦点视线内的还是余光之中的内容,AR全部使用同一个标准渲染,这不符合人类的观看方式。而眼球追踪技术的应用,能够使AR实现局部渲染,实时注视点渲染,将你的目光所到之处渲染,目光之外的保留虚化、模糊,和真实的人眼体验一样。
2)AR画面有时会由于眼球的移动而产生畸变。如果这个时候有眼球追踪功能干预,进行实时追踪,那么这种畸变便能够得到修复。
3)解放双手,实现更好的交互。有了眼球追踪功能,我们可以使用眼球的运动来进行交互,比如当你的眼睛看着一扇门的时候,门可以自动打开,那么我们就不需要使用手柄或者手套。
手势识别:通过摄像头来捕捉图像作为输入,包括二维和三维手势识别。三维手势识别需要通过深度摄像头输入包含有深度的信息,在硬件和软件两方面都比二维手势识别要复杂得多。
以微软的HoloLens2为例,对手势追踪模块升级为Azure Kinect,包含了一个TOF深度传感器,最多可追踪单手25个关节点,密度更高,覆盖更为全面,包括手指弯曲等细节动作也能捕捉到。
1.2.2.视觉
视觉也非常重要,AR中需要有高科技背景的屏幕让使用者感受到画面的细腻和广角体验。这在显示上对设备提出了很高的要求。此外还有视屏的创新处理,未来AR需要有强大的平行处理来渲染出强大的东西。以及视觉聚焦技术,当人的视野很广时是不需要对视野中每个细节进行渲染的。人的身体结构决定了眼球的视角只有0.5°~1°,在这个范围之外余光无法感受到细节。若设备能快速的抓住使用者的眼球运动,就可以对使用者目光聚焦之处进行强烈的渲染,这样的处理能大大节约功耗和性能。
1.2.3.音频
在音频播放时会根据使用者脸的朝向进行一些实时变化,让使用者感受到无论如何转,音频始终是由一个固定位置播放的。这需要设备实施定位使用者的方位,时刻补偿,甚至利用人耳的参数制作出更加有3D效果的音频,目前主流的三维声场重建就是把两个耳朵接收到的声音尽可能准确地模拟出来,让人产生听到三维音频的感觉。
2. 5G高速传输和边缘计算崛起,体验感大幅提升
2.1. 5G高速传输降低时延,眩晕问题有望解决
目前AR/VR设备的使用经常会产生眩晕,产生眩晕的原因主要有两个:1)一方面和3D晕眩症类似,画面元素过于丰富,除大量实焦画面外,还有元素丰富的虚焦布景画面,让眼球重新聚焦,且屡屡聚焦失败,容易产生3D晕眩;2)硬件的延迟造成时间上的不同步,当人转动视角或是移动的时候,画面呈现的速度跟不上,这是造成晕眩的最大问题,降低延迟是当下减弱眩晕的主要手段。随着5G的到来,我们认为这一问题有望解决,大带宽、低延时是5G的两个主要特点,端到端时延要求降至1ms以下,大幅提升使用体验。
2.2. 边缘云计算提高效率,终端侧处理能力提升
进入5G时代,本地的复杂计算可以放到云端,从而节省本地的计算资源和功耗。由于5G数据量非常庞大,传统依赖于集中式数据中心的云计算模型会遇到很多限制,因为将所有计算数据移动到云对于网络带宽资源是一个较大的开销,而且以及造成拥堵,于是边缘云(MEC)的网络资源模型被提出,以小基站为边缘计算的入口,可以降低计算成本,并且进一步缩短时延。
边缘云上完成运算后,通过5G的快速连接可以迅速传到本地。同时本地也会进行一些低延时的处理,如头部、眼部等的快速运动,这样云端和本地通过5G就可以达成无缝衔接的配合。
3. 国际巨头逐渐浮出水面,行业拐点来临
以苹果、华为、三星为代表的终端厂和以高通为代表的芯片厂在AR领域都进行了较早的储备,随着行业拐点来临,布局逐渐浮出水面。
3.1. 苹果:深耕领域多年,AR眼镜呼之欲出
苹果从2011年就开始布局AR,近年来收购多个相关公司,其发布的AR平台也已经迭代到AR Kit2,同时,苹果CEO库克频繁在公开场合发言对AR产业表示看好,认为AR市场将达到智能手机的规模,我们预计苹果很快将推出AR眼镜产品。
最近美国专利局公布苹果的数项专利,显示出其未来在AR领域布局的蛛丝马迹。2019年2月26日成功申请的Patent # US 10217288 B2,其名为“在移动设备上以真实环境的视角来表示兴趣点的方法”,兴趣点(Point of interest,POI)指的是真实环境中的一个位置或真实物体。这项技术可以识别用户环境中的对象并激发潜藏的内容,从而满足不同的玩法需求,举例来说,当用户在未知的地方时,可以用增强现实来获取兴趣点相关的可视化信息。当搜索丢失的对象时,或者试图突出显示房间中某些其它人可能不会注意到的内容时,这个技术会很实用。
同日公布的另一项名为“头戴式显示器的光学系统”的专利,号码为Patent # US 10203489 B2,该专利旨在设计一种更为紧凑、舒适的头戴式显示器。头戴式显示器由于高倍镜头的布置,戴起来可能笨重又疲惫,而苹果试图通过一种反射式光学系统来对此加以改进。
3月7日美国专利和商标局又公布了苹果在AR领域的两项专利。一项名为“具有调节机制的头戴式显示器”,描述了如何穿戴头显以及针对头显调节方式的优化。此外苹果同时表示头显系统可以采用眼动追踪来监控透镜和显示组件与用户眼睛之间的距离,有助于检测头显与眼睛的相对运动,从而帮助软件在用户运动时产生更准确的视觉体验,而且同时告知系统头显穿戴是否足够紧密。另一项专利则是和热量调节相关,用以提高设备舒适度。
3.2. 华为:自主研发AR引擎,垂直整合算法和芯片能力
华为在AR领域的动作也十分迅速。在展示完AR应用场景后不久,华为就在开发者大会上正式发布了自主研发的引擎AREngine,用于在Android上构建增强现实应用的平台,通过垂直整合AR核心算法和海思麒麟芯片提供AR基础能力,提供运动跟踪、平面检测、光照估计和命中检测、手势识别和指关节跟踪、人体姿态识别和骨骼跟踪等功能。
19年2月,华为在世界知识产权组织(WIPO)发布了一项AR智能眼镜架的专利,该专利描述了一种重量轻、分立且相对便宜的AR眼镜。眼镜本身并无相机、显示器或麦克风,需要一个智能手表配合使用。眼镜配有适配器和镜子,通过镜子,智能手表显示屏上显示的内容将通过反射进入用户的眼中。安装之后,智能手表还可将摄像头朝向外侧,以记录用户的活动。
3.3. 三星:推出AR云服务,加速产业布局
三星很早就发布了适配智能机的GearVR头戴设备,销量达到千万级别。18年底,三星正式推出AR服务,运用Project Ware和Unity来构建基于云的AR应用,可以对AR Kit和AR Core跨平台支持。
同时,三星也有AR眼镜专利曝光,叫做“全息透视光学设备”,该专利包含一个微显示屏,一个中继光学系统,至少包括一个波导、一个第一全息光学元件和一个第二全息光学元件,将AR和全息投影整合在一起,我们预计三星AR眼镜有望在2年内推出。
3.4. 高通:底层芯片为基础,目标将整个生态做大、做全
芯片大厂高通也在针对未来的AR产品开发相应的芯片方案,并且不仅仅做芯片,目标将整个生态做大、做全。底层软件适配好后会在上面有一些算法,如头部手部自由度算法、隐形追踪、针对AR/VR的视觉渲染器的算法等。高通还有一些智能网络的AI引擎,在AI引擎上适配Caffe、Maturo等神经网络,同时在底层让神经网络调用CPU、GPU、PSP等作为不同的人工智能硬件模块。高通对于开发者提供SDK,对生产制造商提供工具,帮助他们快速的完成产品的验证和出货。
高通此前推出了专为AR/VR领域所设计的XR1芯片,具有着更低功耗、性能足够、支持AI引擎、6DoF头部追踪以及眼球和手势追踪等特性,定位于基础技术体现,以满足厂商从不同角度挖掘市场的机会,以此来支持合作伙伴来推出差异化的产品。而2019年CES上,高通展示了基于骁龙855芯片的分体式头显,以另一种思路来推进XR的发展。高通表示,将AR/VR连接手机,利用手机的算力、电力即可使用,无需单独给XR做独立算力模块,还能有效降低头显的重量、体积以及成本。
4.产业链投资机会
相比于其他头戴式设备,AR眼镜具备轻薄短小的优势,并且可以突破屏幕的限制,未来整个物理界面都可能成为AR的交互界面,交互方式更加自然,有望成为未来AR硬件的发展重点。我们主要从信息输入、数据处理和输出成像三个环节分析AR眼镜产业链,整机方面,歌尔股份、闻泰科技和正崴都具备代工能力。
4.1. 信息输入:摄像头为主,集成丰富的传感器 作为对现实场景进行模拟和拓展的设备,AR眼镜需要摄像头和各种传感器提取环境信息。摄像头是最主要的输入手段,包括RGB摄像头和深度摄像头(结构光或者TOF),微软的HoloLens使用了6颗摄像头(1颗深度摄像头、4颗环境感知摄像头和1颗200万像素摄像头)。其中,深度摄像头是基于TOF的红外测距摄像头,作用是实现手部追踪、表面重构和目标位置确认;4颗环境感知摄像头是灰度摄像头,作用是创建环境地图;200万像素摄像头的功能是拍摄图片和录制视频。 同时,目前发布的AR设备均集成了丰富的传感器组合,包括用于定位和运动检测的惯性传感器(多轴加速度计和陀螺仪),用于实现智能语音交互的麦克风阵列,以及感知周围光线的环境光传感器等。 4.2. 数据处理:计算边缘云化,芯片成本有望降低 AR设备需要处理庞大的图像信息,除CPU外,还需要配置GPU,微软的HoloLens还自研了HPU用于处理全息和传感数据。另外,HoloLens还搭配了一块1GB的DDR3 RAM存储芯片。 早期AR设备由于计算、存储需求,使用了大量芯片,不仅占用了较大空间,还大幅增加了设备成本,HoloLens开发者版本1000美金成本中,处理芯片CPU、GPU、HPU占25%,存储占15%。我们认为,随着5G来临,越来越多的计算可以在边缘云进行,AR终端的芯片设计可以大幅简化,有效降低设备重量和成本,以高通为代表的芯片平台厂商有望受益。 4.3. 输出成像:光波导方案优势较大,LCOS和LOE为核心器件 目前市场上AR眼镜已有不少成品,其成像技术最主要的区别在于显示系统。AR 眼镜成像技术主要的显示系统的类型有:棱镜式、自由曲面反射式、和光波导式等。 最简单的是棱镜式,GoogleGlass便是采用了这种方案,把显示器产生的光从眼镜框反射进人眼,也同时让现实世界的光透进来,这样做简单便宜。但由于技术限制,视场角仅20°左右(棱镜方式要想做大FOV只能做得更厚),光线需要先后经过半反半透膜层两次,光能利用率低(约为20%),导致画面较暗。 自由曲面指表面形状不能被连续加工、具有传统加工成型的任意性特点的曲面。在这种结构中,光线经过该棱镜的变换,形成虚拟放大的图像,自由曲面全反射的出射面和自由曲面的反射面能消除色差和畸变等像差,因此成像质量更加清晰,视角可以达到54°左右,采用双自由曲面棱镜视角可以进一步提高。缺陷就是体积较大,厚度约在7-10mm。 光波导包括衍射波导和阵列波导两种,HoloLens和Magic Leap采用衍射波导,Lumus则采用阵列波导。 HoloLens的衍射波导由微显示器、全息光栅和平板波导组成,图像经过微型准直透镜后变成平行光进入光波导到达第一个全息光栅,由于全息光栅的衍射效应使平行光改变传输方向从而满足全反射条件并沿波导方向向前无损传播。当传播到第二个全息光栅时,平行光从全息波导出射并进入人眼成像。全息波导使得光学图像可以垂直偏转传播,减小了传播距离和折镜的使用,利于光学系统的简洁化和轻小型设计。该方案波导能够在3mm以内的玻璃上,实现30-40°的视场角,不过设计难度也是最大的。 Lumus的阵列波导选择了光导光学元件 (Light-guide Optical Element,LOE) ,通过一层波导来处理所有颜色。一层LOE的厚度类似于HoloLens多层波导堆叠。他们只是以一定角度切割波导的入口以使光线进入(而非使用特定颜色的衍射光栅),然后再使用一系列经过特别设计的局部反射镜来使光线射出。此方案产品体积小、视场角大,不过加工难度也较大。 相比之下,光波导方案的优势较为显著。其中,微型显示器件LCOS和光导光学元件为核心器件。HoloLens的LCOS由Himax提供,MagicLeap的LCOS由OV提供,Lumus的则由Raontech提供。光导光学元件方面,水晶光电具备制作能力。 AR头戴设备对于信息和数据的快速处理有非常高的要求,给AR设备在无线数据的传输方面带来较大挑战。随着蓝牙5.0等新一代无线传输协议的发布,无线传输技术的速度和稳定性得到了质的提升。如蓝牙5.0相比前代协议,实现了4倍信号范围和2倍连接速度。有望为AR头戴设备的应用提供无线连接的技术支持,助力AR应用快速落地。 5.投资建议 继续推荐深度布局AR光学元器件、模组的水晶光电,建议关注LCOS生产商韦尔股份(收购豪威),光学元件厂商联创电子、利达光电,深耕微投影技术的福晶科技,光学模组厂欧菲科技、舜宇光学,以及整机代工厂歌尔股份、闻泰科技。 6.风险提示 AR渗透不及预期:AR终端的落地需要产业链上传感器、计算芯片和显示系统的配套,配套产业的不成熟会延缓AR的应用进程,同时,AR作为新兴应用,后期渗透率的提升还取决于消费者对新技术的接受程度。 5G建设不及预期:AR生态的完善依赖于5G高速率、低延时通信技术的底层支持,若5G商用进程放缓,会影响AR的通信性能和用户体验,从而对AR推进产生负面影响。