定 价:59 元
丛书名:
- 作者:周军杰
- 出版时间:2025/10/1
- ISBN:9787121514746
- 出 版 社:电子工业出版社
适用读者:本书既可以作为工商管理、市场营销、人力资源管理、大数据管理与引用、电子商务、数据科学等本科专业教材,还可以供社会上对人工智能、大数据及商业数据挖掘赋能商业管理及创新有兴趣的读者阅读。
- 中图法分类:TP18;F713.5
- 页码:280
- 纸张:
- 版次:01
- 开本:16开
- 字数:459.200012207031(单位:千字)
本书以社会对"具有数据分析技能的管理者”的需求为导向,从"场景引用驱动的商业数据挖掘”出发,将人工智能及数据挖掘赋能企业运营和商业创新工作。全书从数据分析思维切入,尝试以工商管理类学生容易接受的语言介绍商业数据挖掘的知识点及精髓。全书分为思维篇、方法篇和案例篇三部分,思维篇从应用的角度介绍数据的商业价值,期望让读者明白数据分析的业务场景与目标;方法篇则着重将业务场景及问题转化为可能的数据挖掘技术,将业务目标转化为技术目标并实现;案例篇则以研究生、本科生完成的实际案例为例,向读者展示具体的实现过程。
周军杰,博士,教授。2013年6月毕业于中国人民大学商学院,获管理学博士学位。2017年3月至2018年3月,俄勒冈州立大学商学院访问学者。研究关注传统服务的数字化与智能化转型,重点关注医疗健康与养老服务行业,在MISQ等国际顶级期刊和CMR、JKM、管理评论、中国管理科学等主要期刊发表论文20余篇,主持及参与国家自然科学基金、国家社会科学基金、省部级基金8项。
第1篇 思维篇
第1章 人工智能、机器学习与数据挖掘概论 2
1.1 人工智能概论 4
1.1.1 人工智能的定义 4
1.1.2 人工智能的特点 5
1.1.3 人工智能的发展历史 7
1.1.4 人工智能的类型 10
1.1.5 人工智能的前沿发展 11
1.1.6 人工智能的伦理问题 13
1.2 机器学习概论 16
1.2.1 开发机器智能的策略 16
1.2.2 机器学习 17
1.2.3 知识图谱 18
1.3 数据挖掘概论 21
1.3.1 数据挖掘的定义 21
1.3.2 数据挖掘技术 21
1.4 三者之间的关系辨析 22
1.4.1 人工智能与机器学习的关系 22
1.4.2 机器学习与数据挖掘的关系 23
1.4.3 三者之间的融合 23
第2章 数据与数据的价值 25
2.1 无处不在的数据 27
2.1.1 数据爆发的原因 27
2.1.2 数据的模态与类型 32
2.2 数据的价值 35
2.2.1 数据金字塔 35
2.2.2 数据价值的演进 35
2.2.3 数据商业价值的实现方式 36
2.3 警惕“数据至上主义” 38
2.3.1 数据的局限性 39
2.3.2 数据利用的伦理问题 39
2.3.3 数据隐私与安全保护 40
2.3.4 人与数据的关系 41
第3章 数据思维与商业应用 43
3.1 思维范式 45
3.1.1 数据思维 45
3.1.2 模型思维 47
3.2 商业需求与决策 47
3.2.1 认识现实,理解现状是什么 47
3.2.2 识别模式,按照规律做决策 48
3.2.3 厘清关系,根据因果做决策 48
3.2.4 预测未来,通过预判来决策 49
3.3 驱动商业决策的技术体系 49
3.3.1 描述性分析 50
3.3.2 预测性分析 50
3.3.3 规范性分析 51
3.3.4 商业需求决定数据分析技术选择 52
第4章 业务引领的商业数据挖掘过程 54
4.1 商业数据挖掘过程中的数据思维 56
4.2 步骤1:设置靶子,明确所要解决的业务问题 57
4.2.1 分析业务存在的问题 57
4.2.2 确定数据分析的目标 58
4.3 步骤2:分解问题,构建问题对应的业务指标体系 59
4.3.1 分解问题的重要性 59
4.3.2 构建业务指标体系 59
4.4 步骤3:准备数据,收集和理解问题所需的数据 61
4.4.1 数据收集 61
4.4.2 数据清洗 61
4.4.3 数据标签体系 62
4.5 步骤4:分析数据,找到业务问题的数据答案 62
4.5.1 选择数据分析技术的“原则” 62
4.5.2 使用机器学习找到答案 63
4.6 步骤5:回到业务,确定分析结果的商业解释 64
4.6.1 将分析结果转化为业务洞察 64
4.6.2 将业务洞察转化为商业行动 64
4.7 步骤6:呈现结果,基于数据分析过程形成商业数据分析报告 65
4.7.1 商业数据分析报告的结构 65
4.7.2 优秀商业数据分析报告的要点 65
第2篇 技术篇
第5章 聚类分析 68
5.1 聚类分析的商业应用场景 70
5.1.1 聚类分析的基础知识 70
5.1.2 聚类分析在商业领域的应用 70
5.2 K-means算法 71
5.2.1 算法简介 71
5.2.2 计算步骤 72
5.2.3 K值选择 73
5.2.4 算法优缺点 75
5.3 K-modes算法 76
5.3.1 算法简介 76
5.3.2 计算步骤 76
5.3.3 K值选择 76
5.3.4 算法优缺点 76
5.4 K-prototypes算法 77
5.4.1 算法简介 77
5.4.2 计算步骤 77
5.4.3 K值选择 77
5.4.4 算法优缺点 77
5.5 层次聚类算法 78
5.5.1 算法简介 78
5.5.2 计算步骤 78
5.5.3 K值选择 78
5.5.4 算法优缺点 80
5.6 聚类分析的Python实现方式 80
5.6.1 K-means算法 80
5.6.2 K-modes算法 81
5.6.3 K-prototypes算法 81
5.6.4 层次聚类算法 82
第6章 分类分析 84
6.1 分类分析的商业应用场景 86
6.1.1 分类分析的基础知识 86
6.1.2 分类分析在商业领域的应用 87
6.2 KNN算法 89
6.2.1 算法简介 89
6.2.2 计算步骤 89
6.2.3 算法优缺点 90
6.3 决策树算法 90
6.3.1 算法简介 90
6.3.2 计算步骤 91
6.3.3 算法优缺点 93
6.4 支持向量机算法 94
6.4.1 算法简介 94
6.4.2 计算步骤 95
6.4.3 算法优缺点 95
6.5 分类准确率的测量方法 95
6.5.1 混淆矩阵 96
6.5.2 评价指标 96
6.5.3 分类准确率的提升方法 96
6.6 分类分析的Python实现方式 98
6.6.1 KNN算法 98
6.6.2 决策树算法 99
6.6.3 支持向量机算法 99
第7章 关联规则分析 101
7.1 关联规则分析的商业应用场景 102
7.1.1 关联规则分析的基础知识 102
7.1.2 关联规则分析在商业领域的应用 104
7.2 常见的关联规则分析算法 105
7.2.1 Apriori算法 105
7.2.2 FP-Growth算法 105
7.3 关联规则分析的Python实现方式 106
7.3.1 Apriori算法 106
7.3.2 FP-Growth算法 107
第8章 回归分析 109
8.1 回归分析的商业应用场景 111
8.1.1 回归分析的基础知识 111
8.1.2 回归分析在商业领域的应用 111
8.2 简单线性回归 113
8.2.1 定义与数学模型 113
8.2.2 回归系数估计 113
8.2.3 计算步骤 114
8.3 多元线性回归 114
8.3.1 定义与数学模型 114
8.3.2 回归系数估计 115
8.3.3 计算步骤 116
8.4 逻辑回归 116
8.4.1 定义与数学模型 116
8.4.2 模型参数估计 118
8.4.3 梯度下降法的实现步骤 118
8.5 岭回归与Lasso回归 119
8.5.1 岭回归 119
8.5.2 Lasso回归 120
8.5.3 岭回归与Lasso回归的对比 121
8.6 回归结果显著性检验 121
8.6.1 模型拟合优度 121
8.6.2 显著性检验 123
8.6.3 置信区间估计 125
8.7 回归分析的诊断与改进 125
8.7.1 残差分析 125
8.7.2 多重共线性 127
8.7.3 异方差 128
8.7.4 自相关 129
8.8 回归分析的Python实现方式 131
8.8.1 简单线性回归 131
8.8.2 多元线性回归 132
8.8.3 逻辑回归 133
8.8.4 岭回归 134
8.8.5 Lasso回归 134
8.8.6 回归结果显著性检验 135
8.8.7 回归分析的诊断与改进 136
第9章 人工神经网络 138
9.1 人工神经网络的商业应用 141
9.1.1 人工神经网络的基础知识 141
9.1.2 人工神经网络的商业应用 141
9.2 感知机 143
9.2.1 简单逻辑电路 143
9.2.2 工作原理 144
9.2.3 线性不可分的局限 144
9.2.4 多层感知机 145
9.3 全连接神经网络 146
9.3.1 基本结构 146
9.3.2 激活函数 147
9.3.3 损失函数 150
9.4 卷积神经网络 152
9.4.1 基本结构 152
9.4.2 训练流程 155
9.4.3 代表性网络结构 155
9.5 循环神经网络 156
9.5.1 基本结构 157
9.5.2 训练流程 157
9.5.3 代表性网络结构 158
9.6 训练技巧 160
9.6.1 参数初始化 160
9.6.2 批处理 162
9.6.3 优化算法 163
9.6.4 偏差与方差 164
9.6.5 超参数调优 166
9.7 深度学习框架 167
9.7.1 TensorFlow和Keras 167
9.7.2 PyTorch 168
9.7.3 PyTorch与TensorFlow的差异 169
9.8 人工神经网络的Python代码实现 169
9.8.1 全连接神经网络 169
9.8.2 卷积神经网络 171
9.8.3 循环神经网络 171
9.8.4 LSTM网络 174
9.8.5 门控循环单元 176
第10章 商业文本挖掘 179
10.1 文本挖掘的商业应用场景 181
10.1.1 文本挖掘的基础知识 181
10.1.2 文本挖掘在商业领域的应用 183
10.2 文本向量化方法 184
10.2.1 独热编码 184
10.2.2 词袋模型 184
10.2.3 TF-IDF模型 185
10.2.4 Word2Vec模型 186
10.2.5 Doc2Vec模型 187
10.2.6 其他方法 188
10.3 文本挖掘任务 189
10.3.1 文本分类 189
10.3.2 文本关联规则 190
10.3.3 文本情感分析 190
10.3.4 文本主题提取 191
10.4 文本挖掘的Python实现方式 193
10.4.1 文本预处理与分词 193
10.4.2 文本可视化 194
10.4.3 使用scikit-learn库进行文本挖掘 195
10.4.4 使用VADER进行情感分析 197
10.4.5 使用gensim进行Word2Vec模型训练 198
第3篇 案例篇
第11章 “翠峰伍号”顾客细分 202
11.1 玩具配送企业面临的问题 202
11.2 关于客户需求的业务指标设计 203
11.3 数据清洗与准备 203
11.3.1 数据清洗和预处理 203
11.3.2 探索性分析 206
11.4 聚类分析 211
11.4.1 特征工程 211
11.4.2 聚类分析过程 212
11.5 基于用户画像的营销策略设计 217
11.6 指导老师点评 218
第12章 “僵尸粉丝”识别——分类分析 219
12.1 “粉丝经济”的兴起与虚假粉丝问题 219
12.2 “僵尸粉丝”特征指标选择 219
12.3 数据收集与用户特征选择 220
12.3.1 数据收集 220
12.3.2 用户特征选择 220
12.4 数据清洗与预处理 221
12.4.1 去重与缺失值处理 221
12.4.2 数据编码 221
12.4.3 数据标准化 223
12.4.4 数据降维 223
12.5 分类模型构建与调优 226
12.5.1 关键参数解释 226
12.5.2 训练过程 227
12.5.3 模型参数调优 227
12.5.4 评估模型性能 227
12.6 分类结果分析 228
12.6.1 参数优化结果分析 228
12.6.2 降维前分类结果分析 228
12.6.3 降维后分类结果分析 229
12.7 “僵尸粉丝”问题的应对策略 230
12.7.1 “僵尸粉丝”检测与清理机制 230
12.7.2 用户价值分层体系 230
12.7.3 平台运营优化策略 230
12.8 指导老师点评 231
第13章 消费者对猫咖的认知态度研究 232
13.1 “它经济”与猫咖的兴起 232
13.2 消费者认知的业务指标 233
13.3 数据收集、清洗与准备 233
13.3.1 数据收集 233
13.3.2 数据预处理 233
13.4 数据分析与结果 236
13.4.1 词云图 236
13.4.2 情感分析 237
13.4.3 LDA主题提取 240
13.5 基于消费者需求的猫咖运营改进建议 244
13.6 指导老师点评 245
第14章 青年旅舍的客户需求分析与运营建议 247
14.1 青年旅舍的行业现状与问题 247
14.2 消费者需求指标的设计 248
14.3 数据收集与清洗 248
14.3.1 数据收集 248
14.3.2 数据清洗 249
14.4 青年旅舍文本数据分析 250
14.4.1 数据的基本分布 250
14.4.2 主题聚类分析 250
14.4.3 基于主题聚类的情感分析 254
14.4.4 客群特征与差异 257
14.5 针对青年旅舍的服务改进建议 259
14.6 指导老师点评 260
参考文献 262