240515 国内外大模型发展情况梳理.pdf

240515 国内外大模型发展情况梳理.pdf
这份文档是中信建投证券发布的一份关于国内外大模型发展情况的行业动态研究报告,发布日期为2024年5月15日。报告由分析师于芳博撰写,主要内容包括: **1. 核心观点与摘要:** * 大模型行业进入加速发展阶段,国外基础模型实力强劲,开源模型生态庞大,端侧模型轻量化。国内大模型也在加速发展,性能逼近GPT-4,多模态模型取得突破。 * 国内大模型在网页流量和应用下载量方面增长迅速,已成为日常生活的重要助手。 **2. 国外大模型发展情况:** * 国外大模型分为闭源、开源和端侧三个层级,各具特色。 * 闭源模型如GPT-4持续领跑,Claude 3性能强劲,Gemini原生多模态能力突出。 * 开源模型Llama2和Llama3构建庞大生态,Mixtral 8x7B引入专家混合技术。 * 端侧模型如Phi-3和Gemma2实现轻量级和高性能的平衡。 * 预计GPT-5即将发布,性能将进一步提升。 **3. 国内大模型发展情况:** * 国内大模型整体能力逼近GPT-4,部分模型中文能力接近GPT-4。 * 百度文心大模型4.0成为首个国内面向C端收费的大模型产品。 * 科大讯飞星火大模型V3.5性能逼近GPT-4,即将再度更新。 * 清华智谱ChatGLM4基础模型性能强劲,生态对标OpenAI。 * 商汤SenseNova5.0大模型性能达到或超越GPT-4 Turbo。 * 开源模型方面,通义千问和百川智能实力强劲。 * 国产文生视频大模型Vidu和文生音乐大模型天工Skymusic取得进展,对标Sora和Suno。 * 国内大模型网页流量和应用下载量迅速增长,大模型成为日常生活的重要组成部分。 **4. 国内大模型能力测试与模型概览:** * 报告分析了国内外大模型在SuperClue、SuperBench等评测中的表现,强调国内大模型与GPT-4的差距正在缩小。 * 报告罗列了国内主要的闭源和开源大模型,以及行业大模型。 **5. 国内外代表性模型:** * 百度文心一言4.0:技术持续升级,能力提升,首个国内C端收费大模型。 * 科大讯飞星火大模型V3.5:七大核心能力全面提升,语言理解、数学能力、语音交互能力超过 GPT-4 Turbo。 * 清华智谱ChatGLM4:基座大模型,具备强大的多模态能力,可自主理解和执行复杂任务。 * 商汤日日新SenseNova5.0:主流客观评测指标达到或超越GPT-4 Turbo。 * 百川智能Baichuan 3:超千亿参数大语言模型,在中文任务上超越GPT-4。 * 通义千问Qwen:打造丰富的开源大模型矩阵。 * 字节跳动“豆包”大模型:主力模型定价极具价格竞争力。 * 月之暗面Kimi智能助手:上下文长度突破200万字。 * Deepseek-V2:具备较强的推理成本优势。 **6. 国内模型流量与应用:** * 国内大模型网页流量整体平稳,部分模型流量快速上升,Kimi网页访问量提升迅速。 * 安卓平台大模型应用下载量攀升,豆包、讯飞星火、文心一言领先。 **7. 风险提示:** * 技术发展不及预期、商业化落地不及预期、算力基础设施支持不及预期、政策监管力度不及预期、数据数量与质量不及预期。
在线阅读 下载完整报告 | 6.39 MB | 43页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告