人工智能行业机器人智能化三部曲(一):谷歌篇,机器人大模型引领者-中信建投-20230825.pdf

人工智能行业机器人智能化三部曲(一):谷歌篇,机器人大模型引领者-中信建投-20230825.pdf
这份文档是中信建投证券关于机器人智能化的行业动态报告,聚焦于谷歌在机器人大模型领域的进展,特别是Google DeepMind和Google Brain两大团队的发展路线。 **核心观点:** * 随着AI技术发展,具备与物理世界交互能力的智能机器人成为研究热点。Google凭借其在AI领域的优势,引领着机器人模型的发展。 * DeepMind发布了具备“自我完善”能力的RoboCat,以及融合大语言模型能力的VLA模型RT-2,推动机器人智能化。 **技术路线:** * **RoboCat:** DeepMind延续Gato模型架构,通过更大规模的训练数据集和“自我完善”方法,打造更强的机器人智能体,具备泛化能力。 * **RT-2:** Google Brain的RT-2模型,则通过大语言模型的赋能,具备更强的泛化能力、逻辑推理能力和知识能力。从RT-1到PaLM-E,最终融合为RT-2,将视觉、语言和机器人操作融合到一个模型中,提升智能化程度。 * **团队整合:** Google Brain和DeepMind的差异化路线最终走向整合,合并为Google DeepMind,有望加速机器人模型发展。 **发展历程:** * 文档回顾了Google AI和DeepMind在机器人模型领域的发展历程,包括AlphaGo、AlphaZero、AlphaFold等,以及RoboCat和RT系列模型的迭代。 * 文档还对比了RoboCat和RT系列模型的架构、训练数据、性能等方面。 **技术细节:** * 文档详细介绍了RoboCat的“自我学习”训练周期,以及RT-2利用互联网图文知识和思维链推理的能力。 **展望:** * 文档认为,高质量数据集的收集、边缘侧算力的发展和更高效的模型架构创新是机器人模型发展的重要方向。 **风险提示:** 文档也提示了算力发展不及预期、机器人模型技术发展不及预期、数据数量与数据质量不及预期,以及机器人大模型研发竞争激烈等风险。
在线阅读 下载完整报告 | 2.94 MB | 24页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告