阅文(马宇峰):AIGC在阅文集团的实践落地.pdf

阅文集团的AIGC技术负责人马宇峰分享了AIGC在阅文集团的实践落地经验。报告主要涵盖了以下几个核心内容:
**1. 挑战与破题思路:**
* **领域问题定义难:** 如何描述网文感和角色“灵魂”?采用数据来定义客观问题,并解决实际业务场景的主观问题。
* **领域数据储备难:** 如何从原始数据到专业标注数据?利用大模型辅助标注提高效率,并在线上直接验证评测结果。
* **领域结果获取难:** 如何规模化和实现业务价值?保留方法路径,筹措对称资源,优化推理成本,关注核心指标。
**2. 智能创作实践:**
* **核心实践:** 经历了开源探索、微调方法跑通、智创场景调优、网文感生成、分布式训练加速、混合指令SFT等阶段,最终发布了妙笔大模型。
* **价值体现:** 通过增量预训练,能够生成更具网文风格和写作风格的文本。
* **技术细节:** 详细介绍了算力、训练方法、模型训练、数据清洗等方面的技术细节,以及各阶段的优化。
**3. 智能创作应用:**
* **世界观设定:** 妙笔帮助作家丰满世界设定,提供灵感,生成画面,但故事内核仍由作家把控。
* **角色设定:** 让角色更立体、细节更丰满,提供成长可能性。
* **提升表达:** 妙笔辅助提升表达和氛围营造,让作家更专注好故事创意。
* **团队协作:** 为每位网文作家配备“专业团队”,辅助创作。
* **持续优化:** 通过显存优化、Int8量化、动态Batching等手段,持续优化推理成本。
**4. 角色对话实践:**
* **技术框架:** 结合 Amis知识管理平台、Prompt 知识挂载、工程支持开启对话等技术,实现角色扮演。
* **模型训练:** 使用不同的数据配比、训练准备以及模型格式对齐的方式,训练角色模型。
* **测试与上线:** 训练后进行验证上线,并进行AB测试。
* **安全措施:** 特别强调了幻觉问题、新鲜度问题和数据安全等方面的挑战。
**5. RAG(检索增强生成)技术:**
* **RAG流程:** 数据提取、embedding、创建索引、检索、自动排序、 LLM归纳。
* **主要价值:** 角色形象更为丰满,让角色更为生动鲜活。
**6. AIGC落地方法论:**
* **关键流程:** 开源探索-> 领域微调-> 场景落地-> 基座领域化-> 参数规模化-> 线上优化。
相关报告
-
2.19 MB 44页 毕马威2024运输燃料的演变报告-替代燃料在可持续发展道路上的作用英文版44页.pdf
-
10.27 MB 82页 2025区块链技术在农业领域的应用:全球经验与肯尼亚实践研究报告.pdf
-
6.84 MB 98页 生成式AI赋能产业变革的实践与路径报告-毕马威-202507.pdf
-
6.77 MB 61页 2025年医疗大模型研究报告-新质生产力大模型在各医疗场景的赋能实践.pdf
-
1.57 MB 26页 银行数字化转型存在马太效应吗? ——基于银行功能的经验阐释.pdf
-
3.25 MB 13页 模块化研发在汽车及离散制造行业的实践之旅.pdf
-
10.37 MB 63页 罗振宇2025“时间的朋友”跨年演讲全文稿.pdf
-
2.26 MB 49页 人工智能行业智能时代的生产力变革:AIGC产业应用实践-DAFRIADG.pdf
-
3.38 MB 35页 人工智能行业智启新质生产力之二:生成式人工智能(AIGC)在医药零售的潜在应用.pdf
-
2.62 MB 16页 毕马威2024人工智能时代价值流的重要性报告英文版16页.pdf
-
2.85 MB 17页 2024人工智能技术及其在生物制药领域不断扩大的作用研究报告-毕马威-202402.pdf
-
1.45 MB 51页 数字时代治理现代化研究报告(2023年)——大模型在政务领域应用的实践及前景-中国信通院.pdf
-
2.07 MB 58页 罗振宇2024“时间的朋友”跨年演讲全文稿(含全套PPT).pdf
-
11.75 MB 29页 亚马逊云科技+AIGC加速企业创新实践指南-30页-202311-.pdf
-
4.5 MB 12页 人工智能在运维中的实践.PDF
-
6.82 MB 34页 中国养老金改革—全球资产管理公司在市场改革中的致胜策略-毕马威-202306.pdf
-
2.7 MB 25页 汽车行业周报:AIGC将有助于自动驾驶的推进落地
-
953.85 KB 7页 高中英语阅读教学中渗透文化意识培养的路径_应科杰.pdf
-
2.11 MB 16页 计算机行业AIGC系列之六,百度文心:一个符合预期的起点
-
1.06 MB 8页 非银金融行业研究-金融科技产业链跟踪三:同花顺,推动AI在金融领域的商业化实践