2024开年不久,AI世界迎来了巨大的变革和新一轮的角力。
2月16日凌晨,OpenAI在其官方发布了文生视频模型Sora。用户只需输入文本指令,Sora可以快速生成60s视频内容,同时理解和模拟真实世界,输出准确反映用户提示的视频。
在一些行业观察人士眼里,Sora不仅性能遥遥领先于竞争对手,甚至可以被视为一款“世界模拟器”。在这样的背景下,人工智能产业将在Sora这一革命性技术迭新中迎来新一轮上涨周期,反馈至资本市场中,则体现为Sora概念股引爆了海内外AI行情,2月19日,Sora概念股在A股市场中掀起涨停潮。
比这更令人关注的是,AGI相关产业的投资机会目前还看不到天花板,从中无疑蕴含着爆发式成长机遇。
Sora引领技术变革,2024年或为AI视频年
从年初苹果发布Vision Pro头戴式显示设备、到各家PC大厂接连发布AIPC,再到这次的OpenAI发布Sora,全世界对于人工智能的创新在加速,迭代地越来越快。
OpenAI将Sora定位为一款世界模拟器的视频生成模型,为未来发展理解和模拟真实世界的模型奠定基础。根据官方介绍,目前Sora具备生成包括多个角色、特定类型的运动、准确细节的主体和复杂场景的能力。同时,还能够创建多个镜头,模拟复杂的摄像机运镜效果,使得生成的视频更加生动。
此外,由于OpenAI将扩散模型与LLM相结合,使得Sora具备了理解和模拟真实世界的能力,因此Sora所生成的视频中已经可以展现出空间以及空间内物体之间的真实物理关系。目前Sora除了文生视频功能外,还具备图生视频、视频扩展、视频拼接、视频编辑、图像生成等功能。
这无疑将是视频领域的巨大变革:从产品和技术本身来看,在过去10年内,人类生成视频的速度一直在提高,但从1秒到4秒,花了10年的时间才有所突破。即便如在线工具Pika、Runway也都卡在了十多秒的限制上。
然而,OpenAI的Sora直接将这个限制提升至60秒,且与Pika、Runway等之前的AI文生视频工具相比,Sora不仅具有完成视频向前扩展、视频拼接等更加复杂的任务的能力,还能通过多镜头等方式带来更加生动的多视角视频,同时在生成视频的时长、流畅度和逻辑性等方面优势显著。
图源:华泰证券
工银瑞信研报同步指出,Sora采用了“扩散+Transformer”的视频生成大模型技术路线,可谓有了里程碑式的技术进步。相比以往使用的同为扩散模型的U-Net,Transformer架构的参数可拓展性强,即参数量增加,性能加速提升,同时支持任意分辨率、长宽比、时长的视频训练数据,不会因为压缩导致训练数据质量下降。此外,Sora训练了能在时间和空间上压缩视频的自编码器,这也是其能够大幅提升生成视频时长的原因。
而Sora文生视频模型的巨大成功,标志着AI应用的迭代升级,有望在一定程度上大大缩短AGI通用人工智能的预期时间,带来从技术转变为全产业的巨大变革浪潮,由此来看,Sora的诞生是将AGI实现过程中的重大里程碑事件。
文生视频迭代提速,环球墨非增长潜力凸显
就商业化角度而言,Sora有望深刻改变各大细分赛道,其中又以泛娱乐赛道更为超越预期。由于Sora模型所生成的视频在空间细节上的真实程度超出了很多人的预期,后续将在图像创作、视频创意等领域会有较大的应用潜力。
可预见的是,多模态模型的应用在2024将迎来爆发式增长,率先布局相关领域的企业有望跑出“新生”巨头。
从Sora的泛用性和场景应用上来看,用AI自动创作生成的内容会影响很多的行业领域,或将带来新一轮内容创作产业革命。但按视频生成的底层逻辑来看,Sora统一了图像与视频的数据表示方式,并通过超大量数据集来扩大模型规模,提高模型表现,行业内拥有海量优质图像或视频资源的玩家有望率先受益。
若在此逻辑之下寻找标的,美股上市的3D内容企业环球墨非(GMM.US),无疑有望在这股技术引领的变革浪潮中跑出成长加速度。
智通财经APP了解到,环球墨非是一家以数字技术为核心,通过开发创新的解决方案为元宇宙行业提供定制化服务。公司一直专注于3D可视化,坚持以“AI+3D”为技术发展方向,将虚拟数字资产与真实世界的互动体验相结合,打破了传统媒介的界限,为客户提供了丰富的视效和沉浸式体验。
公司主要通过其专有的“MofyLab”技术平台(该平台由尖端的三维(3D)重建技术和人工智能(AI)交互技术组成),创建广泛的3D高清虚拟版本可以在不同应用中使用的物理世界对象(如人、动物和场景)。截至目前,环球墨非是中国领先的数字资产银行之一,由30000多个高精度3D数字资产组成,而这些均有望成为数字内容和视频生成领域的重要底层资产。
值得关注的是,近年以来,环球墨非一直在文生图像、视频等跨模态领域进行积极布局。在该公司3D数字资产业务中,涉及到大量的三维建模、3D渲染和IP内容资产生成,公司一直致力于将前沿科技和视觉体验呈现给客户,因此在AI应用层面,公司一直积极推动3D模型+AI的落地以及场景应用,以及AIGC的可视化交互体验。
随着3D内容成本的下降,在中国推动数字化和技术进步的过程中,也会有更多的场景来结合譬如Sora这类的新兴技术,实现元宇宙应用的快速落地,从而产生一些内容服务的需求,为环球墨非带来业绩上的增量。倘若再叠加空间计算时代,VR、MR等场景本身也需要AI3D模型来扩充和丰富虚拟现实产业的内容供给。
展望未来,在Sora所引领的AI文生视频技术突破浪潮之下,3D等多模态领域有望持续加速,持续提高AI3D模型的生成效率及精度,推动AI3D引擎技术拐点的到来。而环球墨非有望保有数字资产领先优势,通过建模、仿真等技术连结虚拟与真实世界,为业界提供数据驱动和基于模型的解决方案,作为底层技术变革受益者和内容素材提供者,享受更大的成长红利。