当前,AI技术和产品的快速迭代升级,特别是AI+视频生成,正成为当前AI产业发展的关键节点,更受到业界关注。
近日信达证券在发布的研究报告中认为,视频杂糅了文本、语音、图像等多维度内容,其训练的难点也往往在于视频数据对数量和质量的不足、算法架构需要优化、物理规律性较差等等,但随着AI+视频的技术和产品升级迭代,众多行业有望受益,诸如电影、广告、视频剪辑、视频流媒体平台、UGC创作平台、短视频综合平台等,而目前正处在AI+视频发展的关键性时刻。
信达证券还具体提到,市场主流的AI视频生成技术迭代路径经历了早期的GAN+VAE、Transformer 、 DiffusionModel以及Sora采用的DiT架构(Transformer+Diffusion),技术迭代升级带来视频处理质量上的飞跃性提升。其中,Transformer在并处处理、长时间序列数据处理、多注意力处理上有着强大的优势,通过预训练和微调可提高模型性能;Sora采用的DiT架构有效进行结合,利用Transformer处理潜在空间中的图像数据块,模拟数据的扩散过程以生成时长更长、质量更高的图像和视频。
信达证券还认为,国内AI+视频产品单条价格低于海外产品,其中RunwayGen-3 Alpha和快手可灵为目前AI视频生成的全球第一梯队,在视频分辨率、生成速度、物体符合物理规律、提示词理解、视频时长等诸多维度上表现均较为优秀。
目前,AI+视频大多数用于创意内容生成,直接用于ToB商业化较少。追溯原因,首先生成视频的人物一致性、所需时长、画面质量尚且不满足立即商业化水准;其次目前主流AI视频工具还处在视频生成竞争的阶段,且大多数为单一功能产品。在视频生成之后,诸如准确的提示词生成、修改视频片段、添加字幕、脚本生成、转场衔接、背景音乐添加等众多细节功能暂未集成,因此现今阶段还需要多种不同的视频创作工具串联使用才能达到直接输出可商业化视频的效果,环节繁琐、多工具之间的格式也可能存在不兼容的可能性,给用户带来使用上的不便。
据此信达证券认为,后续需要持续关注能够一站式提供视频生成+编辑等功能的企业,了解用户痛点,打磨产品细节,才能真正将技术用于生产工作、娱乐等众多环节,带来商业化变现的潜在空间;一站式AI视频生成+剪辑+UGC创作,有望解决市场一直在质疑的“AI+视频缺少实质作用问题”。