注册 登录 进入教材巡展
#

出版时间:2025-04

出版社:电子工业出版社

以下为《DeepSeek实战:从提示词到部署和实践》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 电子工业出版社
  • 9787121500312
  • 1-1
  • 560131
  • 平塑
  • 16开
  • 2025-04
  • 335
  • 294
  • 计算机科学与技术
  • 本科 高职
内容简介
本书旨在提供一份全面、易懂的DeepSeek大模型实战内容,通过深入浅出的讲解,帮助读者快速掌握DeepSeek的核心技术和应用场景。本书不仅涵盖了DeepSeek的技术原理、架构设计和训练方法,还详细介绍了如何通过API调用、本地部署和云服务等方式将DeepSeek集成到实践项目中。此外,本书通过大量实例和案例分析,展示了DeepSeek在不同领域的应用实践,帮助读者更好地理解和应用这一强大的工具。 本书图文并茂,理论翔实,案例丰富,适合从事DeepSeek开发的科研人员以及广大的开发者作为技术参考和培训资料,亦可作为高校本科生和研究生的教材。
目录
目 录__eol__第1章 DeepSeek初探 1__eol__1.1 大模型的定义 2__eol__1.2 从GPT到DeepSeek 3__eol__1.2.1 GPT模型的发展脉络 4__eol__1.2.2 DeepSeek模型的发展脉络 7__eol__1.2.3 技术突破:从全球竞速到本土创新 10__eol__1.2.4 应用生态的进化:从工具到生态伙伴 11__eol__1.3 DeepSeek的核心能力和独特优势 12__eol__1.3.1 核心能力 12__eol__1.3.2 独特优势 14__eol__1.4 DeepSeek的应用场景 16__eol__1.4.1 智能客服 16__eol__1.4.2 辅助办公 18__eol__1.4.3 智能家居 20__eol__1.4.4 医疗诊断 21__eol__1.4.5 教育学习 22__eol__1.4.6 金融投资 24__eol__1.4.7 智能政务 24__eol__1.5 DeepSeek带来的机遇 25__eol__1.5.1 DeepSeek模型带给个人的机遇 26__eol__1.5.2 DeepSeek带给中小企业的机遇 28__eol__小结 30__eol__第2章 DeepSeek的模型架构 32__eol__2.1 DeepSeek-V3/R1模型的架构 33__eol__2.2 混合专家 35__eol__2.2.1 稠密MoE架构和稀疏MoE架构 36__eol__2.2.2 DeepSeekMoE 37__eol__2.2.3 无辅助损耗负载均衡 39__eol__2.3 多头潜在注意力 41__eol__2.3.1 键值缓存简介 41__eol__2.3.2 RoPE简介 43__eol__2.3.3 传统MHA的缓存机制的不足 46__eol__2.3.4 低秩键值联合压缩的注意力机制 47__eol__2.4 多Token预测 52__eol__2.4.1 块级并行解码策略 53__eol__2.4.2 Meta的MTP方法 53__eol__2.4.3 DeepSeek的MTP方法 54__eol__小结 56__eol__第3章 DeepSeek的训练架构 57__eol__3.1 DeepSeek的训练 58__eol__3.1.1 基础技术 58__eol__3.1.2 训练过程 61__eol__3.2 DeepSeek在硬件层面的训练亮点 62__eol__3.2.1 FP8混合精度训练 62__eol__3.2.2 DualPipe算法 63__eol__3.3 DeepSeek在算法层面的训练亮点 66__eol__3.3.1 组相对策略优化 67__eol__3.3.2 知识蒸馏 69__eol__3.4 DeepSeek的数据优化手段 70__eol__小结 72__eol__第4章 高质量提示词 74__eol__4.1 提示词概述 75__eol__4.1.1 提示词的定义 75__eol__4.1.2 提示词的种类 76__eol__4.2 新手常见误区和陷阱 77__eol__4.3 提示词的设计技巧 79__eol__4.3.1 STAR法则:让问题更有条理 79__eol__4.3.2 5W2H法则:全面提问的利器 80__eol__4.3.3 CO-STAR框架:精准表达需求 82__eol__4.3.4 CRISPE框架:激发创意和拓展深度 85__eol__4.3.5 BROKE框架:目标导向和持续优化 86__eol__4.3.6 借助大模型优化提示词 88__eol__4.4 企业层面的提示词应用场景 92__eol__4.4.1 传播策略制定 92__eol__4.4.2 执行发展制定 93__eol__4.4.3 品牌故事生成 94__eol__4.4.4 产品定位 96__eol__小结 97__eol__第5章 面向个人的DeepSeek部署 98__eol__5.1 DeepSeek的模型 99__eol__5.1.1 DeepSeek模型的常见版本 99__eol__5.1.2 DeepSeek模型的版本说明 100__eol__5.1.3 DeepSeek模型的开源协议 101__eol__5.2 硬件需求和配置建议 103__eol__5.2.1 存储精度 103__eol__5.2.2 显存占用估算 105__eol__5.3 软件环境安装和配置 107__eol__5.3.1 Ollama安装 107__eol__5.3.2 使用Ollama部署DeepSeek模型 111__eol__5.3.3 Ollama常用API 113__eol__5.4 DeepSeek模型下载和部署 121__eol__5.4.1 Hugging Face社区简介 121__eol__5.4.2 模型下载 121__eol__5.4.3 常见大模型文件类型 125__eol__5.5 使用Web UI构建对话界面 126__eol__5.5.1 Open-WebUI 126__eol__5.5.2 Hollama 129__eol__5.5.3 ChatBox 132__eol__小结 133__eol__第6章 面向企业的DeepSeek API调用 135__eol__6.1 API调用的优势 136__eol__6.2 常用DeepSeek API调用方式 137__eol__6.2.1 DeepSeek官方开放平台 137__eol__6.2.2 DMXAPI 144__eol__小结 148__eol__第7章 面向企业的DeepSeek云服务部署 149__eol__7.1 本地部署与云服务部署的对比 150__eol__7.1.1 本地部署的特点 150__eol__7.1.2 云服务部署的特点 151__eol__7.2 模型推理加速框架 152__eol__7.2.1 推理加速框架的必要性 153__eol__7.2.2 BladeLLM 153__eol__7.2.3 SGLang 156__eol__7.2.4 vLLM 159__eol__7.3 常用DeepSeek云服务部署方式 164__eol__7.3.1 阿里云 164__eol__7.3.2 腾讯云 171__eol__7.3.3 华为云 176__eol__7.3.4 火山引擎 181__eol__7.3.5 AutoDL 187__eol__小结 198__eol__第8章 DeepSeek模型训练 199__eol__8.1 常用训练框架 200__eol__8.1.1 Unsloth 200__eol__8.1.2 TRL 201__eol__8.2 DeepSeek模型的SFT训练 202__eol__8.2.1 算力租用 202__eol__8.2.2 模型下载和部署 204__eol__8.2.3 数据预处理 207__eol__8.2.4 模型训练 208__eol__8.2.5 模型推理 210__eol__8.3 DeepSeek模型的GRPO训练 212__eol__8.3.1 加载模型 212__eol__8.3.2 配置PEFT模型 213__eol__8.3.3 数据集准备 213__eol__8.3.4 模型训练 216__eol__8.3.5 模型推理 217__eol__小结 219__eol__第9章 DeepSeek的RAG实战 220__eol__9.1 用LangChain构建简单的RAG本地系统 221__eol__9.1.1 RAG管道构建 221__eol__9.1.2 向量数据库构建 223__eol__9.1.3 Web页面启动 225__eol__9.2 开源DeepSeek RAG应用案例 227__eol__9.2.1 Local PDF Chat RAG 227__eol__9.2.2 RAG Flow 231__eol__小结 239?__eol__第10章 DeepSeek的Agent实战 241__eol__10.1 基于LlamaIndex项目构建简单的智能体应用 242__eol__10.1.1 软件安装和模型下载 243__eol__10.1.2 构建本地知识库 245__eol__10.1.3 实现基于本地知识库的智能体问答 246__eol__10.2 基于Swarm框架构建智能体应用 250__eol__10.2.1 Swarm框架介绍 251__eol__10.2.2 DeepSeek模型接入 253__eol__10.2.3 调用外部工具 255__eol__10.3 开源Agent应用框架 260__eol__10.3.1 Browser Use 260__eol__10.3.2 Camel 268__eol__小结 279__eol__参考文献 281__eol____eol__