大模型后训练:中美路径与商业闭环-华泰证券-202512.pdf

大模型后训练:中美路径与商业闭环-华泰证券-202512.pdf
大模型后训练:中美路径与商业闭环 报告总结 本报告深入探讨了大模型后训练的发展趋势,特别是中美两国在这一领域的差异化路径和商业化闭环。报告指出,全球大模型竞争集中于中美两国,美国在OpenAI、xAI、Google等头部厂商的推动下,侧重于模型规模的扩张和后训练及推理的深化;而中国由于算力限制,则更注重架构优化和算法精修,以提升单位算力效率。 **核心观点:** 1. **中美路径分化:** 强化学习和后训练成为大模型迭代的关键。美国侧重于高密度集群下的规模扩展,而中国则在算力约束下,更依赖架构和算法的优化。 2. **商业化加速:** 大模型商业化落地是当前头部厂商的重心,AI应用是商业化落地的关键。OpenAI通过ACP协议实现对话内购买,并与多家企业合作构建生态。国内厂商则积极探索多模态应用和2B市场。 3. **算力、存储、电力和应用:** 算力是基石,多模态模型的普及提升存储需求,电力是算力的配套。AI应用是商业化落地的关键。 **投资建议:** 报告建议关注以下四个方面: * **算力:** 前/后训练迭代将推高算力需求,看好海内外算力链企业。 * **存储:** 多模态和长视频将提升容量和带宽需求。 * **电力:** 数据中心对电力的需求持续增长,关注稳定供电能力。 * **应用:** 关注2C和2B领域,特别是拥有入口优势和生态协同的企业。 **行业动态:** 1. **大模型演进:** 模型能力演进呈现预训练、后训练与推理全链路扩展趋势。Scaling Law 2.0下,中美模型迭代路径分化明显。 2. **Transformer 架构:** 尽管新型架构出现,Transformer 仍是主流,Diffusion 技术值得关注。 3. **应用场景:** GPT-5 确立了“统一系统”的方向,头部厂商重心开始向应用和商业化生态转移。 4. **数据标注:** 高质量标注是模型训练的关键投入,其价值被低估。 **公司案例分析:** * **OpenAI:** 强调模型和应用生态的构建,以ACP协议驱动商业化。 * **阿里 Qwen:** 多模态与场景落地是主要方向。 * **DeepSeek、Kimi:** 在模型架构优化上持续创新,例如 DeepSeek V3.2-Exp 引入 Dynamic Sparse Attention,Kimi K2 通过大规模智能体合成数据体系,系统提升模型的工具使用与任务协同能力。 **风险提示:** 宏观经济波动、技术进步不及预期、中美竞争加剧等因素可能对行业发展带来风险。
在线阅读 下载完整报告 | 5.15 MB | 56页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告