【国金证券】文心一言、GPT3.5及GPT-4的应用测评对比(1).pdf

【国金证券】文心一言、GPT3.5及GPT-4的应用测评对比(1).pdf
本文是国金证券的计算机行业研究报告,主要对文心一言、GPT-3.5和GPT-4这三大模型在不同应用场景下的表现进行了测评对比。 **核心观点:** * 三大模型在常识问答、文字生成等领域表现出色,但在逻辑推理、数学计算和代码生成方面仍有提升空间。 * 文心一言在图像创作和归纳总结方面表现较好,但文心在逻辑推理方面略逊于GPT-3.5和GPT-4。 * GPT-4在文本创作方面细节更丰富,但图像生成功能暂未开放。 * 随着百度文心及OpenAI生态的增长,各模型性能有望进一步优化。 * 建议关注在AI领域持续布局且有成熟应用场景的公司。 **测评内容及结果:** 报告从多个维度对三大模型进行测评,主要包括: 1. **常识和创作:** 在常识问答方面,三大模型表现均正确。在文字创作方面,文心一言分词有待提高,但总体体现正面价值观。GPT-4的创作细节更丰富。文心一言图像生成能力较好。 2. **归纳和推理:** 文心在演绎推理、逻辑推理方面略逊于GPT系列,但在归纳总结方面表现较好。GPT-4的逻辑推理能力相对较强。 3. **数学和代码:** GPT-3.5 在数学计算方面表现更好,但代码生成方面,模型均有改进空间。 4. **现实应用场景测试:** * AI生活助手:三大模型均能提供正确建议。 * 售后客服:三大模型均能完成任务,GPT-3.5表现更优。 * 办公场景助手:GPT-4表述更丰富,GPT-3.5文言文表达惊艳。 * 产品推荐:文心表现较好。 * 诗词理解:文心表现最好。 **投资建议:** 报告建议关注在人工智能领域持续布局且拥有成熟应用场景的公司,如万兴科技、汉得信息、凌志软件、同花顺、金山办公。 **风险提示:** 报告提示了海外基础软硬件使用受限、应用落地不及预期、行业竞争加剧、以及测评问题有限可能导致的偏差等风险。
在线阅读 下载完整报告 | 6.49 MB | 32页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告