本书以VSCode为主要开发工具,全面系统地介绍了Python数据应用开发的相关知识。本书采用理论与案例相结合,多样化的案例、通俗易懂的讲解形式、详细的演示步骤,帮助大家轻松地学习Python数据分析的相关知识。全书共6个项目,前两个项目介绍了文件采集和MySQL与Python交互的应用,后面四个项目介绍了Python数据分析的常用库及其应用,涵盖了科学计算库NumPy、数据分析库Pandas、数据清洗和数据可视化库Matplotlib和pyecharts。每个项目中都结合所学的技术开发了综合实训,演示如何在项目中运用所学的知识,通过动手操作和练习,帮助读者更好地理解和掌握所学的知识。
蔺首晶, 毕业于哈尔滨师范大学计算机科学与技术专业本科学历,在东北财经大学获得硕士学位,"双师型”教师,自2005年至今,从教于大连电子学校软件及应用教学部,现任高级讲师,长期工作在职业院校计算机软件专业教学管理一线,有着较强的教育教学管理能力和丰富的教学经验,多次参编教材,主持、参与科研课题多项,在各项教学比赛、课件比赛中荣获国家级、省级、市级等多个奖项,多篇教学论文在国内期刊教育专栏发表并获奖。2021年被评为大连市职业院校骨干教师,具备很好的教学素质,并有一定的研究能力,可以带动身边的教师一起参与研究。
项目1 文件采集 001
1.1 第三方模块 002
1.1.1 第三方模块的概念 002
1.1.2 NumPy、Pandas模块的下载与安装 004
1.2 CSV格式化数据的读写 006
1.2.1 CSV文件和csv模块 006
1.2.2 使用NumPy模块读写CSV文件 013
1.2.3 Pandas读取和写入CSV文件 015
1.3 XML文件读写 017
1.3.1 XML文件结构 017
1.3.2 解析XML文件 018
1.4 JSON格式化数据的读写 020
1.4.1 JSON数据格式 020
1.4.2 JSON文件读取 020
1.5 Excel格式化数据的读写 024
1.5.1 使用xlrd和xlwt模块读写Excel文件 024
1.5.2 使用Pandas读写Excel文件 030
任务拓展 031
实训1:汽车数据写入CSV文件 031
实训2:网络数据爬取 038
课后练习 047
项目2 Python访问MySQL与MongoDB数据库 049
2.1 数据库基础 050
2.1.1 概述 050
2.1.2 数据库分类 051
2.2 MySQL与Python交互 052
2.2.1 pymysql库 052
2.2.2 访问及查询MySQL数据库 053
2.3 MongoDB与Python交互 064
2.3.1 pymongo库概述 064
2.3.2 访问MongoDB 数据库 064
任务拓展 069
实训3:构建基于MySQL与Python交互的汽车数据管理系统 069
课后练习 075
项目3 NumPy库 077
3.1 Ndarray对象 078
3.1.1 认识NumPy数组对象 078
3.1.2 创建NumPy数组 079
3.1.3 NumPy数组属性 081
3.1.4 NumPy切片和索引 083
3.2 NumPy数组操作 088
3.2.1 修改数组形状 089
3.2.2 连接数组 089
3.2.3 分割数组 093
3.2.4 数组元素的添加与删除 095
3.3 NumPy函数 098
3.3.1 NumPy通用函数 099
3.3.2 NumPy统计函数 102
任务拓展 108
实训4:管理手机卡用户数据 108
课后练习 117
项目4 Pandas库 119
4.1 Pandas数据结构 120
4.1.1 Series的组成及创建 120
4.1.2 DataFrame的组成及创建 123
4.1.3 DataFrame的数据切片与合并 127
4.1.4 numpy.array与pandas.DataFrame的转换 131
4.2 数据访问 132
4.2.1 获取DataFrame的字段信息 132
4.2.2 获取指定的行和列 135
4.2.3 获取数值型字段的统计信息 139
4.2.4 获取文本型字段的取值信息 140
任务拓展 141
实训5:药店数据维护与销售情况分析 141
课后练习 146
项目5 数据清洗 148
5.1 数据清洗 149
5.1.1 缺失值的处理 149
5.1.2 重复值的处理 155
5.1.3 异常值的处理 157
5.1.4 更改数据类型 161
5.2 数据转换 164
5.2.1 重命名轴索引 165
5.2.2 离散化连续数据 167
5.2.3 哑变量处理类别型数据 168
任务拓展 170
实训6:餐饮数据清洗 170
课后练习 177
项目6 数据可视化 179
6.1 数据可视化概述 180
6.1.1 什么是数据可视化 180
6.1.2 常见的图表类型 180
6.1.3 数据可视化工具 184
6.2 使用Matplotlib绘制图表 190
6.2.1 通过figure()函数创建画布 190
6.2.2 通过subplot()函数创建单个子图 194
6.2.3 通过subplots()函数创建多个子图 197
6.2.4 通过add_subplot()方法添加和选中子图 198
6.3 使用Matplotlib绘制其他简单图表 200
6.3.1 plot()函数绘制折线图 200
6.3.2 通过scatter()绘制散点图或气泡图 203
6.3.2 通过hist()函数绘制直方图 206
6.3.3 通过pie()函数绘制饼图或圆环图 208
6.3.4 通过barth()方法绘制条形图或堆积条形图 210
任务拓展 215
实训7:使用pyecharts 绘制常见图表 215
课后练习 235