20250204-中信建投证券-DeepSeek核心十问十答.pdf

20250204-中信建投证券-DeepSeek核心十问十答.pdf
这份中信建投的行业研究报告聚焦于DeepSeek核心十问十答,核心观点如下: * DeepSeek-R1模型发布,具有高性能和低算力需求,带动小模型推理能力提升,引发全球关注。R1作为开源模型性能接近头部闭源模型,一定程度上反映了AI平权。纯强化学习对推理能力提升带来RL范式泛化可能。预计基模型的持续迭代有望推动AI全产业链保持高景气和高关注度,关注算力、应用、端侧、数据等核心投资机会。 行业动态信息包括: * DeepSeek模型密集更新,具有高性能和低成本,促进用户数增长。 * 技术不断革新,大模型Scaling Law仍然有效。 * DeepSeek-R1促进AI平权,产业链享受发展红利。 报告进一步阐述了 DeepSeek 的用户量趋势、R1和Janus-pro模型的性能、DeepSeek-V3模型的训练成本、DeepSeek-V3/R1技术革新、Janus系列模型技术革新、DeepSeek数据集的特点、Scaling Law是否有效、R1是否意味着AI平权、DeepSeek出圈对产业的影响等问题。 报告还提到,DeepSeek Web端与APP端访问量持续增长,春节期间信息传播加速产品关注度裂变。DeepSeek-R1在推理任务上接近 OpenAI-01的性能。DeepSeek的推理和通用模型成本相较于OpenAI下降至数十分之一。R1 通过蒸馏技术能显著提升小模型推理能力。 DeepSeek通过架构和基础设施创新实现高效训练,并且R1-Zero验证了纯强化学习对推理能力的提升。尽管Pre-Training Scaling面临技术、算力、数据的制约,但强化学习带来了规模化扩张的新方向。报告认为,DeepSeek用户数将持续增长,DeepSeek-R1促进AI平权,产业链享受发展红利,推荐关注算力环节(IDC、服务器、国产芯片等)、A+XÖ端(金蝶国际等)、C端(金山办公等)以及端侧和数据相关标的。 此外,报告分析了DeepSeek对人工智能产业的影响,强调其低成本、高性能以及为小模型带来强大推理能力的蒸馏方式,对 AI 产业链产生了冲击。报告认为算法迭代、架构升级促进 DeepSeek-V3 模型训练成本降低,符合产业趋势。
在线阅读 下载完整报告 | 3.72 MB | 27页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告