注册 登录 进入教材巡展
#
  • #

出版时间:2025-07-01

出版社:机械工业出版社

以下为《大语言模型认识与应用》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111783145
  • 1-1
  • 550371
  • 平装
  • 2025-07-01
  • 245
内容简介
本书旨在帮助非计算机专业本科生快速掌握大语言模型(LLM)的入门知识和实用技术。全书共8章,阐述了LLM如何助力解决日常生活与科研中的难题,并深度挖掘了提示工程、检索增强技术以及LLM在智能体领域的应用等实用技巧。同时,书中还涵盖了LLM的应用环境、风险与安全技术,强调理性使用LLM技术的重要性。借助简洁易懂的语言和实际案例,读者既能洞悉LLM的核心理念,又能熟练驾驭其实战应用,深切感受科技创新如何无缝融入日常学习、工作和生活,助力快速获取信息和提高工作效率。
本书适合作为普通高等学校非计算机专业本科生人工智能类通识课或选修课教材或参考书,也可供对大语言模型技术与应用感兴趣的读者参考阅读。
目录
目 录
知名LLM推荐语
前言
致谢
第1章 导论1
1.1 自然语言1
1.1.1 歧义性1
1.1.2 简略性2
1.1.3 易变性2
1.2 语言模型3
1.2.1 基于规则的语言模型3
1.2.2 统计语言模型4
1.2.3 神经网络语言模型4
1.2.4 预训练语言模型7
1.2.5 大语言模型9
1.3 技术成熟度曲线12
1.4 总结13
1.5 习题14
第2章 语言模型基础技术15
2.1 统计语言模型15
2.2 神经网络语言模型16
2.2.1 Word2Vec模型17
2.2.2 RNN模型17
2.3 预训练语言模型18
2.3.1 编码器-解码器架构18
2.3.2 注意力机制19
2.3.3 Transformer架构21
2.3.4 MoE架构22
2.4 大语言模型25
2.4.1 大语言模型之大25
2.4.2 ChatGPT—闭源典型代表26
2.4.3 LLaMA—开源典型代表27
2.5 多模态大语言模型29
2.5.1 多模态定义29
2.5.2 多模态大语言模型的架构30
2.5.3 应用领域32
2.6 大语言模型的开发与使用模式33
2.6.1 预训练微调模式33
2.6.2 提示指令模式34
2.7 总结35
2.8 习题35
第3章 大语言模型的使用37
3.1 基本概念37
3.1.1 提示学习37
3.1.2 提示词范式37
3.1.3 提示工程的优势38
3.2 提示词的优化技巧39
3.2.1 清晰准确表述39
3.2.2 赋予身份角色40
3.2.3 留出思考时间41
3.2.4 提供相似示例42
3.2.5 情感物质激励42
3.2.6 结构化提示词42
3.3 思维链44
3.3.1 基本范式44
3.3.2 零样本思维链45
3.3.3 多思维链46
3.4 高级思维链47
3.4.1 思维树48
3.4.2 思维图49
3.5 总结50
3.6 习题51
第4章 大语言模型的多工具52
4.1 RAG基本概念52
4.1.1 必要性52
4.1.2 发展历程53
4.2 初级RAG53
4.3 高级RAG55
4.3.1 预检索56
4.3.2 后检索56
4.3.3 优缺点56
4.4 模块化RAG56
4.4.1 模块组56
4.4.2 模式组57
4.4.3 优缺点57
4.5 检索自由型RAG58
4.6 知识图谱型RAG59
4.6.1 知识图谱概念59
4.6.2 知识图谱构建61
4.6.3 GraphRAG62
4.6.4 LightRAG65
4.7 总结67
4.8 习题67
第5章 大语言模型的多智能体69
5.1 智能体基本概念69
5.1.1 智能体的定义69
5.1.2 智能体的特征69
5.1.3 智能体的行动力70
5.2 LLM作为智能体大脑71
5.2.1 LLM出现前的智能体71
5.2.2 LLM出现后的智能体72
5.3 单智能体模式74
5.3.1 单智能体特点74
5.3.2 ReAct框架74
5.3.3 ReAct示例76
5.3.4 ReAct特点76
5.4 多智能体模式77
5.4.1 多智能体特点77
5.4.2 两智能体系统78
5.4.3 三智能体模式79
5.5 群体智能体智能81
5.5.1 群体智能体特点81
5.5.2 ChatDev框架81
5.5.3 ChatDev示例83
5.6 生成式智能体84
5.6.1 生成式智能体特点84
5.6.2 斯坦福AI小镇简介84
5.6.3 斯坦福AI小镇框架86
5.7 总结88
5.8 习题88
第6章 大语言模型的多载体90
6.1 超大型云服务器90
6.1.1 基本配置90
6.1.2 适配的语言模型91
6.2 小型服务器92
6.2.1 基本配置92
6.2.2 适配的语言模型94
6.3 手机端96
6.3.1 基本配置96
6.3.2 MiniCPM模型97
6.4 数据库端100
6.4.1 基本配置100
6.4.2 HeatWave GenAI101
6.5 端云协同102
6.5.1 端云协同部署102
6.5.2 适配的语言模型102
6.5.3 技术挑战103
6.6 软硬件适配与协同优化104
6.6.1 现存软硬件配置104
6.6.2 大模型的软硬件适配105
6.6.3 大模型的软硬件协同优化107
6.7 总结108
6.8 习题108
第7章 大语言模型的风险及安全技术110
7.1 LLM面临的风险110
7.1.1 幻觉问题110
7.1.2 偏见歧视112
7.1.3 隐私泄露113
7.1.4 伦理问题115
7.2 LLM的安全技术115
7.2.1 减少幻觉和偏见115
7.2.2 防御提示注入攻击116
7.2.3 减少外部工具威胁116
7.2.4 严查伦理问题117
7.3 硅基人工智能已/将具有意识117
7.3.1 碳基生物117
7.3.2 硅基人工智能118
7.3.3 硅基人工智能是否已/将具有意识119
7.4 总结120
7.5 习题121
第8章 大语言模型的调用方式122
8.1 在线LLM的网页调用122
8.1.1 DeepSeek122
8.1.2 星火认知124
8.1.3 文心一言126
8.1.4 通义千问128
8.1.5 混元130
8.1.6 豆包132
8.1.7 ChatGPT134
8.1.8 DALL·E137
8.1.9 PixVerse138
8.2 在线LLM的API调用140
8.2.1 基础设置140
8.2.2 DeepSeek141
8.2.3 星火认知142
8.2.4 文心一言143
8.2.5 通义千问144
8.2.6 混元145
8.2.7 ChatGPT147
8.3 开源LLM的代码调用147
8.3.1 DeepSeek147
8.3.2 Qwen149
8.3.3 ChatGLM151
8.3.4 MOSS151
8.3.5 LLaMA152
8.4 总结153
8.5 习题153
附录155
附录A 实验155
附录B 习题参考答案156
参考文献160