北京大学-DeepSeek系列 4 -DeepSeek 私有化部署和一体机.pdf

本次DeepSeek内部研讨系列课程,旨在深入探讨DeepSeek模型的私有化部署方案,从模型选型、部署实践到应用场景,全方位覆盖个人用户和企业级用户的需求。课程主要分为四个部分:
1. **大模型与DeepSeek概述**:介绍了大模型相关术语、发展阶段,并重点介绍了DeepSeek的优势、模型特性与不同版本的区别,包含DeepSeek V2、V3和R1等,以及DeepSeek在数学推理、代码生成、中文优化等方面的应用。
2. **个人部署DeepSeek**:详细讲解了使用Ollama在个人电脑上部署DeepSeek(蒸馏版)模型的流程,包括环境准备、模型选择、Ollama的安装与配置,以及在不同平台(Windows、Mac、Linux)上的部署步骤,并介绍了PageAssist、Chatbox等前端UI工具的使用方法,以方便用户快速体验和调试。
3. **企业部署DeepSeek**:主要面向企业级用户,介绍了针对不同企业场景的部署方案,例如使用KTransformers、Unsloth动态量化等低成本部署方案,并分享了企业级70B模型部署案例,包括硬件配置、性能数据、以及VLLM的实际部署与优化经验,帮助企业用户实现高效的推理加速。
4. **DeepSeek一体机**:介绍了DeepSeek一体机的特性,包括软硬件配置,展示了在北大青鸟AI实验室中的应用,分析了不同配置的优劣势以及适用场景,并提供了DeepSeek一体机的报价参考,以便用户根据实际需求进行选择。
课程核心内容总结如下:
* **模型选择**:DeepSeek提供了多种版本的模型,包括蒸馏版、满血版,以及不同参数规模的模型,用户需根据算力、存储和性能需求选择合适的版本。
* **部署方式**:
* **个人部署**:推荐使用Ollama,易于安装和使用,支持多种模型。
* **企业部署**:可采用Transformers、VLLM、KTransformers等框架,实现高性能推理。
* **动态量化**:Unsloth动态量化方案可降低显存占用,提高GPU利用率。
* **一体机**:提供软硬件一体化的解决方案,方便企业用户快速部署。
* **性能优化**:
* **显存优化**:使用量化技术,如4bit量化,降低显存占用。
* **推理加速**:使用VLLM、KTransformers等推理框架,利用GPU加速。
* **应用场景**: DeepSeek模型可应用于多种场景,如对话系统、代码生成、文本生成、科研与学术等。
最后,课程提供了丰富的实践经验和技术细节,并强调了在实际应用中,需要根据实际需求选择合适的模型、部署方案和硬件配置,才能实现最佳的性能和效果。
相关报告
-
18.43 MB 86页 DeepSeek内部研讨系列:DeepSeek提示词工程和落地场景-北京大学-202502.pdf
-
11.47 MB 98页 DeepSeek内部研讨系列:DeepSeek与AIGC应用-北京大学-202502.pdf
-
704.78 KB 17页 养老产业系列研究之一:踏草夕阳间,老龄化加速时代的产业新机遇-西部证券-20230211.pdf
-
756.22 KB 10页 碳中和系列一:各部委各省碳中和已有政策一览-国盛证券-20210424.pdf
-
3.25 MB 60页 2025-2026年中国智算一体机行业研究报告.pdf
-
31.18 MB 212页 DeepSeek完全实用手册V1.5—技术原理·使用技巧·部署进展-至顶AI实验室-202504.pdf
-
18.9 MB 122页 DeepSeek与新媒体运营-北京大学-202504.pdf
-
19.59 MB 101页 DeepSeek应用场景中需要关注的十个安全问题和防范措施-北京大学-202503.pdf
-
38.77 MB 57页 DeepSeek的本地化部署与AI通识教育之未来-浙江大学-202503.pdf
-
8.45 MB 56页 浙江大学·DeepSeek手册Ⅸ《DeepSeek的本地化部署与AI通识教育之未来》.pdf
-
10.43 MB 48页 深度解读DeepSeek:部署、使用、安全-天津大学-202503.pdf
-
8.41 MB 80页 DeepSeek应用与部署PPT-山东大学-202503.pdf
-
11.08 MB 57页 DeepSeek 原理和落地应用-北京大学-202503.pdf