Google上下文工程:会话和记忆(中文版).pdf

Google上下文工程:会话和记忆(中文版).pdf
上下文工程(Context Engineering, CE)是构建有状态、个性化AI智能体的核心方法。它通过动态管理和组装信息,克服了大语言模型(LLM)“无记忆”的本质限制。 CE的支柱是: 1. **会话(Sessions):** 作为单次对话的容器,包含不可变的事件日志和可变的工作状态(State)。核心挑战是性能优化和上下文长度管理,需采用智能压缩策略,如递归摘要或选择性截断。 2. **记忆(Memory):** 驱动长期个性化体验,实现跨会话持久化知识。记忆管理器是一个主动系统,而非被动的向量数据库。它通过LLM驱动的ETL流程完成核心工作: * **提取(Extraction):** 从对话中识别并提炼有价值的关键信息。 * **整合(Consolidation):** 解决信息重复和冲突,通过“自我编辑”机制将新旧知识合并,确保知识体系的连贯性。 * **检索(Retrieval):** 采用混合评分(相关性、时效性、重要性)选择最优记忆,嵌入上下文。检索时机可选择主动加载或被动触发(记忆即工具)。 **程序性记忆**(Procedural Memory)是存储智能体“如何做”的技能(如操作手册),它通过动态提示词注入,实现了无需微调的快速学习和适应能力。 在生产环境中,记忆生成必须作为异步后台任务执行,以保障用户体验的低延迟。架构设计必须遵循严格的隐私和安全原则,包括数据隔离、PII脱敏,并部署故障处理机制和并发控制,以实现企业级的可扩展性和韧性。记忆是赋予智能体“用户专家”角色的关键,与RAG(事实专家)协同,共同构建完整的认知能力。
在线阅读 下载完整报告 | 5.68 MB | 53页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告