R语言程序设计
定 价:59 元 本教材已被 5 所学校申请过!
丛书名:全国高等学校计算机教育研究会“十四五”系列教材
本书分为基础篇、进阶篇、拓展篇三个模块,共9个章节,包括R语言基础知识、常用模型和特色应用。同时,本书将R语言和数据科学相结合,讲解了数据获取、数据描述、数据预处理、数据分析、数据挖掘、数据可视化的理论知识以及R语言的实现方法。除第9章外,每章配有综合实验,引导学生解决应用问题。 本书是学习R语言、数据科学类课程的基础教材,配有完备的教学资料,支持多种教学模式,可作为各类高等院校开设R语言、数据科学类课程的通识基础教材,也可供数据科学、R语言爱好者自学使用。
本书的特色和价值: 1.培养学生计算思维能力,掌握数据处理问题的解决思路和方法,教材内容和本课程先修课程如大学计算机基础、数据科学素养等有衔接,为后续专业课程的学习建立数字素养和数据处理的基础能力。 2.基于OBE理念构建课程教材,章节设计与教学目标、学习成果达成度一致,建立立体化教学资源,支持个性化教学、分层教学、混合式教学等多种方式教学情境。 3.课程内容支持48~64学时,分为基础篇、进阶篇、拓展篇三大模块,分别介绍R语言的基础知识、常用数学建模方法、R高级特性及综合应用等内容。
大数据时代已经到来,基于数据科学的方法发现问题并做出科学客观的决策越来越重要。R是世界上应用广泛的数据分析、数据挖掘及数据可视化语言,是从大数据中获取信息的重要工具。它是开源、免费、跨平台、第三方支持的语言,在程序设计语言类排名中位于前十,在经济、金融、管理、生物、医学等众多领域发挥着巨大作用。近年来随着大数据、数据科学、机器学习、开源平台的发展,R语言的功能不断丰富,几乎能够完成任何数据处理任务,可安装运行于所有主流平台,是科学研究、大数据人才培养的重要工具。国内外有丰富的R语言开放论坛、在线平台等资源,例如,RStudio网站中Resources专栏涵盖了从基础入门到高级R编程的丰富内容,Kaggle、Datacmap等在线平台从课程到项目再到竞赛一应俱全,国外很多高校公开了R语言的课程和学习资料库。相对而言,我国开设R语言程序设计的通识课程还不多,相关教材和实验资源较少。编者所在的北京交通大学设置了全校信息技术通识课R语言程序设计,面向大学低年级学生选修。本书结合此课程的教学目标和教学实践编写,有以下特点。(1) 本书帮助学生较为全面地了解R语言,包括R语言基础知识、常用模型和特色应用,是读者学习和拓展R语言应用的基础资料。(2) 本书将R语言和数据科学相结合,内容涵盖数据获取、数据描述、数据预处理、数据分析、数据挖掘、数据可视化的理论知识和R语言的主要实现方法,每章配有综合实验,引导学生利用所学知识解决问题。理论和实践相结合,为学生后续课程中的数据处理打下基础。(3) 本书分为基础篇、进阶篇、拓展篇三个模块,共9个章节,支持32~64学时的R语言程序设计数据科学等信息技术类通识课程,支持个性化教学、分层教学、混合式教学等多种教学模式。(4) 为帮助师生更好地使用本书,本书配有完备的教学资料,包括教学大纲、PPT课件和习题。本课程在中国大学MOOC(春季学期)上开课,方便学习。本书可作为各类高等院校开设R语言、数据科学等通识类课程的教材,也可供数据科学、R语言爱好者自学使用。感谢为本书的编写提供直接或间接帮助的各位朋友。在编写过程中,李皓维、卢静、蒋方冰、廖云飞、陈晓瑜、罗叙卿参与了资料收集、案例测试等工作,北京交通大学R语言程序设计选修课的同学们参与了本书的实验测试,并对教材内容进行了反馈,在此表示感谢。R语言的实用性很强,同学们在今后的科研实践活动中能用得上,有些同学使用R语言参加建模方面的竞赛,获得一些成绩,作为教师非常高兴。面对日新月异的大数据时代,希望读者以此书为起点,学有所获,让学习常态化,不断进取。在本书的编写过程中,编者总能发现有很多值得完善的地方,今后会在中国大学MOOC的在线课程中不断优化完善。由于水平和精力所限,书中难免有错误和不足之处,恳请广大读者批评指正。
周围崔濒月2023年2月
基础篇第1章R语言概述31.1认识R语言31.1.1R语言是什么31.1.2R语言与数据科学31.1.3R语言与计算思维41.2第一个R语言会话41.2.1开发环境配置41.2.2程序编写运行61.3R语言包91.3.1包的含义91.3.2包的安装和使用91.4R语言数据集91.5综合实验101.5.1实验1: R语言软件安装101.5.2实验2: RStudio安装151.5.3实验3: 编写Hello World!程序191.5.4实验4: 工作空间的管理和使用201.5.5实验5: 使用rmarkdown包22思考与练习25第2章数据对象272.1数据类型272.1.1数据类型分类272.1.2数据类型的转换272.1.3数据类型的查看282.2数据结构292.3向量302.3.1创建向量302.3.2向量的运算312.3.3向量的索引322.3.4向量的排序342.4矩阵342.4.1创建矩阵342.4.2矩阵的合并352.4.3矩阵的运算362.4.4矩阵的索引372.5数组382.6数据框392.6.1创建数据框402.6.2数据框的索引402.7列表412.7.1创建列表412.7.2列表的索引412.8因子422.8.1创建因子422.8.2创建有规律的因子442.9综合实验442.9.1实验1: 熟悉向量的计算442.9.2实验2: 灵活使用矩阵452.9.3实验3: 综合运用数据框502.9.4实验4: 熟悉因子52思考与练习53〖3〗R语言程序设计目录〖3〗第3章数据管理553.1控制结构553.1.1分支结构553.1.2循环结构563.1.3控制语句583.2函数593.2.1数学运算函数593.2.2字符处理函数623.2.3日期处理函数643.2.4自定义函数663.2.5函数的嵌套683.3apply函数族683.3.1函数族683.3.2apply()函数693.3.3tapply()函数703.3.4lapply()函数713.3.5sapply()函数713.4数据输入与输出713.4.1数据输入713.4.2数据输出723.5综合实验733.5.1实验1: 编写自定义函数733.5.2实验2: 百分制成绩换算753.5.3实验3: 两种方法实现数据处理763.5.4实验4: 实现爬虫功能77思考与练习78第4章数据可视化794.1绘图基础794.1.1高级绘图函数794.1.2低级绘图函数834.1.3绘制图形894.2绘图进阶934.2.1ggplot2绘图包934.2.2使用qplot()函数绘图944.2.3使用ggplot()函数绘图944.3绘制更丰富的图形964.4综合实验984.4.1实验1: 绘制鸢尾花数据图形984.4.2实验2: 绘制汽车数据图形1004.4.3实验3: 绘制交互式图形106思考与练习110进阶篇第5章数据探索1135.1数据描述1135.1.1数据的类别1135.1.2数据的集中趋势1145.1.3数据的离散程度1145.1.4数据的分布特征1155.1.5数据的相似性1175.2数据清洗1185.2.1处理缺失数据1185.2.2处理异常数据1195.2.3处理重复数据1215.3数据集成1215.3.1数据集的合并1215.3.2数据子集的获取1225.3.3数据的分组汇总1235.3.4数据的频数计算1245.3.5使用SQL语句1255.4数据规范1255.5数据重构1265.6综合实验1285.6.1实验1: 对mtcars数据集的初步探索1285.6.2实验2: 处理数据集中的缺失值1305.6.3实验3: 对mtcars数据集的标准化1325.6.4实验4: 数据重构133思考与练习135第6章数据分析1376.1随机数模拟1376.1.1生成随机数1376.1.2特定分布的随机数1376.1.3随机抽样1386.2假设检验1396.2.1假设检验的方法1396.2.2均值检验1396.2.3相关性检验1416.3方差分析1426.4线性回归1436.4.1变量间关系1446.4.2一元线性回归1446.4.3多项式回归1466.4.4多元线性回归1476.5广义线性模型1496.5.1广义线性模型概况1496.5.2Logistic回归1506.5.3泊松回归1536.6综合实验1546.6.1实验1: 假设检验的应用1546.6.2实验2: 方差分析1556.6.3实验3: 一元线性回归分析1606.6.4实验4: 多项式回归分析1626.6.5实验5: 泊松回归分析1646.6.6实验6: Logistics回归分析166思考与练习172第7章数据挖掘1747.1相关概念1747.1.1数据分析与数据挖掘1747.1.2数据挖掘与机器学习1757.1.3数据驱动为核心的机器学习1757.1.4模型评估1767.2分类与回归1787.2.1决策树1787.2.2随机森林1787.2.3KNN1787.2.4朴素贝叶斯1797.2.5支持向量机1797.2.6人工神经网络1807.3聚类分析1807.3.1K均值聚类1807.3.2主成分分析1817.4可视化挖掘工具1817.5综合实验1817.5.1实验1: 决策树1817.5.2实验2: 随机森林1837.5.3实验3: KNN1867.5.4实验4: 朴素贝叶斯1877.5.5实验5: 支持向量机1897.5.6实验6: 人工神经网络1927.5.7实验7: KMeans聚类1947.5.8实验8: 主成分分析196思考与练习199拓展篇第8章高级特性2038.1面向对象的编程2038.1.1面向对象的含义2038.1.2R语言与面向对象编程2048.1.3S3类2068.1.4S4类2078.2程序调试2098.2.1程序调试介绍2098.2.2R语言如何调试2098.3性能提升2108.3.1向量化2108.3.2语句优化2128.4并行计算2128.5综合实验213思考与练习217第9章应用拓展2199.1R语言与数学2199.1.1微积分2199.1.2线性代数2199.1.3概率论与数理统计2209.1.4多元统计分析2209.1.5数值计算2209.2R语言的应用拓展2209.2.1关联规则2209.2.2智能推荐2219.2.3时间序列2219.2.4深度学习222思考与练习222附录A本书使用的函数223参考文献229
平台介绍|荣誉资质|联系我们|出版社登陆