Sora划时代:算力应用再加速.pdf

Sora划时代:算力应用再加速.pdf
Sora划时代:算力应用再加速 华西证券发布关于Sora文生视频大模型的深度研究报告。Sora是OpenAI发布的文生视频大模型,能够根据用户提供的文本描述生成长达60秒的视频,且具备3D一致性、较长视频的连贯性和对象持续性,并能与世界互动。 报告的核心逻辑: 1. Sora大模型的技术特性:Sora采用Transformer架构,通过将不同类型的视觉数据转化为统一的格式,进行大规模训练。Sora能够生成跨越不同持续时间、纵横比和分辨率的视频和图像,甚至包括生成长达一分钟的高清视频。Sora在视频的原始纵横比上进行训练,显著提升构图和框架的质量,且能够生成带有动态摄像头运动的视频。此外,Sora 还能够对图像和视频进行多样化提示和编辑。Sora具备图像生成能力,可以根据用户需求,生成可变大小的图像,最高可达惊人的2048 × 2048分辨率。Sora的模型还能够模拟人工过程,比如视频游戏,并可控制《我的世界》中的玩家。 2. 多模态下游应用百花齐放: * **提升创作者效率**: 利用Lumiere,用户可以在单个过程中生成完整的视频序列,而不是简单组合静态帧。 * **彻底改变人车交互**: 商汤提出DriveMLM模型,实现闭环测试中操控车辆。 * **创造多样化营销卖点**: 利用AI技术提升数字人的多样性,进行营销海报的生成。 * **提升教学效率,加强人机互动**: 利用图像生成模型,快速自动生成多种风格的美术类教学资源。 * **为临床医疗任务提供更为智能、高效的解决方案**: 通过多模态融合,对临床医疗数据进行更全面的分析。 * **AI+安防加速演变**: AI技术在生物识别技术、视频结构化和物体识别系统中的应用。 3. 投资建议: * 报告分析了万兴科技、虹软科技、超讯通信、佳都科技、平治信息、博汇科技、美图公司等受益标的;并提示了政策落地不及预期、技术发展不及预期、经济发展不及预期等风险。 4. 风险提示:报告提示了政策落地、技术发展、经济发展不及预期等风险。
在线阅读 下载完整报告 | 4.75 MB | 35页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告