技术复盘与产业分析:Sora是如何成功的?-中泰证券-20240220.pdf

技术复盘与产业分析:Sora是如何成功的?-中泰证券-20240220.pdf
这份中泰证券的研究报告主要分析了OpenAI的视频生成模型Sora的成功之处及其产业影响。报告认为,Sora的成功是之前研究工作的综合体现,并得益于强大的算力、工程能力以及GPT和DALL·E模型技术的积累。Sora的突破在于能够生成更长时长、更高分辨率的视频,且技术路线上仍遵循LLM范式,利用patches向量化与transformer架构结合,并使用GPT生成prompt。Sora具有很强的通用性,有望统一视频生成生态,并成为真正的“世界模拟器”。 报告推荐关注算力方向(浪潮信息、中科曙光等)、应用方向(万兴科技、焦点科技等)以及安全方向(启明星辰、三未信安等)。报告认为,Sora依旧遵循“大力出奇迹”的路线,算力需求将持续增加。Sora的强大工具产品和视频模态相关标的有望受益,同时需关注Deepfakes问题带来的安全隐患。 报告进一步分析了Sora的技术细节,包括其能够理解和生成复杂场景,支持多模态输入,以及结合GPT、DALL·E的能力提升语言理解能力。Sora的训练思路是Diffusion Model思想与LLM范式的结合,即先加入噪声再反向去噪,并且采用Patches嵌入进行时空信息的处理。 最后,报告认为Sora的成功对产业有重大意义:它代表“多模型协同”是接近AGI的可行道路,代表LLM的通用和涌现范式在视频领域的成功复现,并且可能成为视频生成领域的Base Model。报告同时也指出了AI技术落地不及预期、数据更新不及时以及安全风险等潜在风险。
在线阅读 下载完整报告 | 809.28 KB | 15页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告