机器学习与社会科学应用
¥58.00定价
作者: 郭峰等
出版时间:2024-07
出版社:上海财经大学出版社
- 上海财经大学出版社
- 9787564243616
- 1版
- 533455
- 2024-07
- 经济学、社会学
- 本科
作者简介
内容简介
本书由上海财经大学“机器学习与数字经济实验室”团队集体智慧结晶而成,团队领头人郭峰教授基于多年学习与研究经验,结合个人从数字金融从业背景转向研究Python和机器学习的学术旅程,精心策划并组织撰写。
本书主要介绍机器学习的基本原理,以及它们在社会科学中的应用。本书的定位是面向熟悉计量经济学、因果识别理论,但不熟悉机器学习的社会科学研究者。因此,本书更加侧重于以浅显直白的语言介绍机器学习的基本原理,并以文献综述、案例详解等方式,介绍机器学习各个算法在社会科学实证研究中的代表性应用。对于代码实操,本书尽量选取了贴近社会科学研究者的案例,进行详细阐述。
本书中的所有机器学习算法的演示性代码,均是基于Python语言编写,并提供在线课程资源链接(智慧树平台课程网址:(https://coursehome.zhihuishu.com/courseHome/1000002241)及作者个人主页(http://www.guof1984.net)上的代码与数据下载,方便读者学练。
本书主要介绍机器学习的基本原理,以及它们在社会科学中的应用。本书的定位是面向熟悉计量经济学、因果识别理论,但不熟悉机器学习的社会科学研究者。因此,本书更加侧重于以浅显直白的语言介绍机器学习的基本原理,并以文献综述、案例详解等方式,介绍机器学习各个算法在社会科学实证研究中的代表性应用。对于代码实操,本书尽量选取了贴近社会科学研究者的案例,进行详细阐述。
本书中的所有机器学习算法的演示性代码,均是基于Python语言编写,并提供在线课程资源链接(智慧树平台课程网址:(https://coursehome.zhihuishu.com/courseHome/1000002241)及作者个人主页(http://www.guof1984.net)上的代码与数据下载,方便读者学练。
目录
第一章 机器学习基本原理与启示/ 1
第一节 为什么需要学习机器学习/ 1
第二节 机器学习的基本任务/ 5
第三节 机器学习基本原理/ 9
第四节 机器学习的应用与启示/ 18
参考文献/ 21
第二章 经典回归算法/ 24
第一节 OLS回归算法/ 24
第二节 岭回归算法/ 33
第三节 Lasso回归算法/ 41
第四节 算法调参/ 49
参考文献/ 57
第三章 经典分类算法/ 59
第一节 分类算法简介/ 59
第二节 K近邻算法/ 61
第三节 朴素贝叶斯算法/ 70
第四节 决策树算法/ 75
第五节 支持向量机算法/ 83
第六节 分类算法评估/ 92
参考文献/ 95
第四章 自然语言处理入门/ 97
第一节 自然语言处理的基本任务/ 97
第二节 分词/ 103
第三节 TF-IDF/ 116
第四节 文本相似度/ 121
参考文献/ 134
第五章 集成算法/ 136
第一节 集成算法基本原理/ 136
第二节 随机森林算法/ 139
第三节 梯度提升树算法/ 146
第四节 XGBoost算法/ 152
参考文献/ 158
第六章 无监督学习算法/ 159
第一节 无监督学习简介/ 159
第二节 聚类算法/ 161
第三节 降维算法/ 168
第四节 LDA主题模型/ 175
参考文献/ 191
第七章 深度学习算法/ 193
第一节 神经网络基本原理与前馈神经网络/ 193
第二节 卷积神经网络/ 207
第三节 循环神经网络/ 217
第四节 Word2Vec词嵌入算法/ 223
第五节 大语言模型简介/ 229
参考文献/ 235
第八章 特征工程入门与实践/ 237
第一节 特征工程简介/ 237
第二节 特征理解:探索性分析/ 238
第三节 特征增强:清洗数据/ 244
第四节 特征构造:生成新数据/ 261
第五节 特征选择:筛选属性/ 263
第六节 特征转换:数据降维/ 270
参考文献/ 272
第九章 机器学习与因果识别/ 273
第一节 机器学习助力因果识别的基本逻辑/ 273
第二节 更好识别和控制混淆因素/ 275
第三节 更好地构建对照组/ 279
第四节 更好地识别异质性因果效应/ 287
第五节 更好地检验因果关系的外部有效性/ 291
第六节 大数据和机器学习对因果识别的冲击/ 292
第七节 未来展望/ 295
参考文献/ 296
第十章 机器学习与异质性政策效应分析/ 306
第一节 异质性政策效应评估的价值和传统方法/ 306
第二节 传统异质性政策评估方法的问题/ 311
第三节 机器学习在异质性政策效应评估中的应用/ 315
第四节 机器学习的局限以及未来方向/ 324
参考文献/ 330
第一节 为什么需要学习机器学习/ 1
第二节 机器学习的基本任务/ 5
第三节 机器学习基本原理/ 9
第四节 机器学习的应用与启示/ 18
参考文献/ 21
第二章 经典回归算法/ 24
第一节 OLS回归算法/ 24
第二节 岭回归算法/ 33
第三节 Lasso回归算法/ 41
第四节 算法调参/ 49
参考文献/ 57
第三章 经典分类算法/ 59
第一节 分类算法简介/ 59
第二节 K近邻算法/ 61
第三节 朴素贝叶斯算法/ 70
第四节 决策树算法/ 75
第五节 支持向量机算法/ 83
第六节 分类算法评估/ 92
参考文献/ 95
第四章 自然语言处理入门/ 97
第一节 自然语言处理的基本任务/ 97
第二节 分词/ 103
第三节 TF-IDF/ 116
第四节 文本相似度/ 121
参考文献/ 134
第五章 集成算法/ 136
第一节 集成算法基本原理/ 136
第二节 随机森林算法/ 139
第三节 梯度提升树算法/ 146
第四节 XGBoost算法/ 152
参考文献/ 158
第六章 无监督学习算法/ 159
第一节 无监督学习简介/ 159
第二节 聚类算法/ 161
第三节 降维算法/ 168
第四节 LDA主题模型/ 175
参考文献/ 191
第七章 深度学习算法/ 193
第一节 神经网络基本原理与前馈神经网络/ 193
第二节 卷积神经网络/ 207
第三节 循环神经网络/ 217
第四节 Word2Vec词嵌入算法/ 223
第五节 大语言模型简介/ 229
参考文献/ 235
第八章 特征工程入门与实践/ 237
第一节 特征工程简介/ 237
第二节 特征理解:探索性分析/ 238
第三节 特征增强:清洗数据/ 244
第四节 特征构造:生成新数据/ 261
第五节 特征选择:筛选属性/ 263
第六节 特征转换:数据降维/ 270
参考文献/ 272
第九章 机器学习与因果识别/ 273
第一节 机器学习助力因果识别的基本逻辑/ 273
第二节 更好识别和控制混淆因素/ 275
第三节 更好地构建对照组/ 279
第四节 更好地识别异质性因果效应/ 287
第五节 更好地检验因果关系的外部有效性/ 291
第六节 大数据和机器学习对因果识别的冲击/ 292
第七节 未来展望/ 295
参考文献/ 296
第十章 机器学习与异质性政策效应分析/ 306
第一节 异质性政策效应评估的价值和传统方法/ 306
第二节 传统异质性政策评估方法的问题/ 311
第三节 机器学习在异质性政策效应评估中的应用/ 315
第四节 机器学习的局限以及未来方向/ 324
参考文献/ 330