💪掌握数据之钥,探索数据世界,开启智能之源💪

💥在大数据时代,数据分析与挖掘已成为企业、科研机构乃至个人获取竞争优势的关键手段。此时,一本能够系统介绍Python在数据分析和挖掘领域的实战应用的书籍显得尤为重要。《Python数据分析与挖掘实战(第2版)》就是这样一本书,它为读者提供了一个全方位的学习体验。

📘全书分为几个部分,每一部分都有明确的主题,结构清晰,内容丰富。作者从基础的数据处理开始,详细介绍了如何使用Python进行数据清洗、数据探索、特征工程、模型训练和评估等关键环节。书中不仅提供了大量的实例和代码,还穿插了许多实用的技巧和经验分享,使读者在掌握理论知识的同时,也能提高实际操作能力。

👉书中的重点金句:“数据是企业的财富,而Python是处理数据的利器。”这句话简洁地概括了书的核心思想。在数据分析的每个阶段,Python都能发挥其强大的功能,使得原本复杂的过程变得简单高效。通过这本书,读者可以更加深入地了解Python在数据分析中的巨大潜力。

📚在阅读过程中,我深刻感受到了这本书的实战价值。书中所用的实例和代码都非常实用,无论是对于初学者还是有一定经验的从业者,都能从中受益。尤其值得一提的是,作者在书中还分享了自己在实际项目中遇到的问题和解决方法,这使得整本书更加贴近实际,具有很高的参考价值。

📚然而,正如作者所言,“任何工具都不是万能的”,Python也不例外。虽然Python在数据处理方面有着强大的能力,但过度依赖工具也会导致我们忽略问题的本质。因此,在使用Python进行数据分析时,我们还需要结合其他工具和方法,以获得更加全面和准确的结果。

👍《Python数据分析与挖掘实战(第2版)》是一本非常值得一读的书籍。它不仅提供了丰富的知识和实例,还通过实战案例帮助读者加深理解和应用。对于想要深入了解Python在数据分析领域应用的人,这本书无疑是一个很好的选择。如果你想在这个快速发展的数据时代站稳脚跟,那么我强烈推荐你阅读这本书,并尝试在自己的项目中实践其中的方法和技术。

👆请点击上面《Python数据分析与挖掘实战(第2版)》了解更多详情!👆

书籍信息

书名: Python数据分析与挖掘实战(第2版)
作者: 张良均
出版社: 机械工业出版社
出品方: 华章科技
出版年: 2019-12
页数: 352
定价: 79.00
装帧: 平装
丛书: 数据分析与决策技术丛书
ISBN: 9787111640028

Python数据分析与挖掘实战(第2版)

内容简介

本书是Python数据分析与挖掘领域的公认的事实标准,第1版销售超过10万册,销售势头依然强劲,被国内100余所高等院校采用为教材,同时也被广大数据科学工作者奉为经典。
作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验,不仅掌握行业的新技术和实践方法,而且洞悉学生和老师的需求与痛点,这为本书的内容和形式提供了强有力的保障,这是本书第1版能大获成功的关键因素。
全书共13章,分为三个部分,从技术理论、工程实践和进阶提升三个维度对数据分析与挖掘进行了详细的讲解。
第一部分 基础篇(第1~5章)
主要讲解了Python数据分析与挖掘的工具和技术理论,包括数据挖掘的基础知识、Python数据挖掘与建模工具、数据挖掘的建模过程,以及挖掘建模的常用算法和原理等内容。
第二部分 实战篇(第6~12章)
通过工程实践案例讲解了数据挖掘技术在金融、航空、零售、能源、制造、电商等行业的应用。在案例组织结构上,本书按照“介绍案例背景与挖掘目标→阐述分析方法与过程→完成模型构建”的顺序进行,在建模过程关键环节,穿插程序实现代码。最后,通过上机实践加深对案例应用中的数据挖掘技术的理解。
第三部分 提高篇(第13章)
重点讲解了基于Python引擎的开源数据挖掘建模平台(TipDM)的功能和使用方法,以航空公司客户价值分析为案例,介绍了如何使用该平台快速搭建数据分析与挖掘工程。
本书不仅提供TipDM这样的上机实践环境,而且还提供配套的案例建模数据、Python源代码、教学PPT。

作者简介

张良均
资深大数据挖掘与分析专家、模式识别专家、AI技术专家。有10余年大数据挖掘与分析经验,擅长Python、R、Hadoop、Matlab等技术实现的数据挖掘与分析,对机器学习等AI技术驱动的数据分析也有深入研究。
为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。
华南师范大学、中南财经政法大学、广东工业大学、西安理工大学、广西科技大学、重庆交通大学、桂林电子科技大学等校外硕导或兼职教授。
撰写了《R语言数据分析与挖掘实战》《数据挖掘:实用案例分析》《Hadoop大数据分析与挖掘实战》等10余部畅销书,累计销售超过30万册。

书籍目录

前言
基础篇
第1章 数据挖掘基础2
1.1 某知名连锁餐饮企业的困惑2
1.2 从餐饮服务到数据挖掘4
1.3 数据挖掘的基本任务5
1.4 数据挖掘建模过程5
1.4.1 定义挖掘目标6
1.4.2 数据取样6
1.4.3 数据探索7
1.4.4 数据预处理8
1.4.5 挖掘建模8
1.4.6 模型评价8
1.5 常用数据挖掘建模工具9
1.6 小结11
第2章 Python数据分析简介12
2.1 搭建Python开发平台14
2.1.1 所要考虑的问题14
2.1.2 基础平台的搭建14
2.2 Python使用入门16
2.2.1 运行方式16
2.2.2 基本命令17
2.2.3 数据结构19
2.2.4 库的导入与添加24
2.3 Python数据分析工具26
2.3.1 NumPy27
2.3.2 SciPy28
2.3.3 Matplotlib29
2.3.4 pandas31
2.3.5 StatsModels33
2.3.6 scikit-learn33
2.3.7 Keras34
2.3.8 Gensim36
2.4 配套附件使用设置37
2.5 小结38
第3章 数据探索39
3.1 数据质量分析39
3.1.1 缺失值分析40
3.1.2 异常值分析40
3.1.3 一致性分析44
3.2 数据特征分析44
3.2.1 分布分析44
3.2.2 对比分析48
3.2.3 统计量分析51
3.2.4 周期性分析54
3.2.5 贡献度分析55
3.2.6 相关性分析58
3.3 Python主要数据探索函数62
3.3.1 基本统计特征函数62
3.3.2 拓展统计特征函数66
3.3.3 统计绘图函数67
3.4 小结74
第4章 数据预处理75
4.1 数据清洗75
4.1.1 缺失值处理75
4.1.2 异常值处理80
4.2 数据集成80
4.2.1 实体识别81
4.2.2 冗余属性识别81
4.2.3 数据变换81
4.2.4 简单函数变换81
4.2.5 规范化82
4.2.6 连续属性离散化84
4.2.7 属性构造87
4.2.8 小波变换88
4.3 数据归约91
4.3.1 属性归约91
4.3.2 数值归约95
4.4 Python主要数据预处理函数98
4.5 小结101
第5章 挖掘建模102
5.1 分类与预测102
5.1.1 实现过程103
5.1.2 常用的分类与预测算法103
5.1.3 回归分析104
5.1.4 决策树108
5.1.5 人工神经网络115
5.1.6 分类与预测算法评价120
5.1.7 Python分类预测模型特点125
5.2 聚类分析125
5.2.1 常用聚类分析算法126
5.2.2 K-Means聚类算法127
5.2.3 聚类分析算法评价132
5.2.4 Python主要聚类分析算法133
5.3 关联规则135
5.3.1 常用关联规则算法136
5.3.2 Apriori算法136
5.4 时序模式142
5.4.1 时间序列算法142
5.4.2 时间序列的预处理143
5.4.3 平稳时间序列分析145
5.4.4 非平稳时间序列分析148
5.4.5 Python主要时序模式算法156
5.5 离群点检测159
5.5.1 离群点的成因及类型160
5.5.2 离群点检测方法160
5.5.3 基于模型的离群点检测方法161
5.5.4 基于聚类的离群点检测方法164
5.6 小结167
实战篇
第6章 财政收入影响因素分析及预测170
6.1 背景与挖掘目标170
6.2 分析方法与过程171
6.2.1 分析步骤与流程172
6.2.2 数据探索分析172
6.2.3 数据预处理176
6.2.4 模型构建178
6.3 上机实验184
6.4 拓展思考185
6.5 小结186
第7章 航空公司客户价值分析187
7.1 背景与挖掘目标187
7.2 分析方法与过程188
7.2.1 分析步骤与流程189
7.2.2 数据探索分析189
7.2.3 数据预处理200
7.2.4 模型构建207
7.2.5 模型应用212
7.3 上机实验214
7.4 拓展思考215
7.5 小结216
第8章 商品零售购物篮分析217
8.1 背景与挖掘目标217
8.2 分析方法与过程218
8.2.1 数据探索分析219
8.2.2 数据预处理224
8.2.3 模型构建226
8.3 上机实验232
8.4 拓展思考233
8.5 小结233
第9章 基于水色图像的水质评价234
9.1 背景与挖掘目标234
9.2 分析方法与过程235
9.2.1 分析步骤与流程236
9.2.2 数据预处理236
9.2.3 模型构建240
9.2.4 水质评价241
9.3 上机实验242
9.4 拓展思考242
9.5 小结243
第10章 家用热水器用户行为分析与事件识别244
10.1 背景与挖掘目标244
10.2 分析方法与过程245
10.2.1 数据探索分析246
10.2.2 数据预处理249
10.2.3 模型构建260
10.2.4 模型检验261
10.3 上机实验262
10.4 拓展思考264
10.5 小结265
第11章 电子商务网站用户行为分析及服务推荐266
11.1 背景与挖掘目标266
11.2 分析方法与过程267
11.2.1 分析步骤与流程267
11.2.2 数据抽取269
11.2.3 数据探索分析270
11.2.4 数据预处理279
11.2.5 构建智能推荐模型283
11.3 上机实验291
11.4 拓展思考293
11.5 小结293
第12章 电商产品评论数据情感分析294
12.1 背景与挖掘目标294
12.2 分析方法与过程295
12.2.1 评论预处理296
12.2.2 评论分词297
12.2.3 构建模型303
12.3 上机实验315
12.4 拓展思考316
12.5 小结318
提高篇
第13章 基于Python引擎的开源数据挖掘建模平台(TipDM)320
13.1 平台简介321
13.1.1 模板321
13.1.2 数据源322
13.1.3 工程323
13.1.4 系统组件324
13.1.5 TipDM数据挖掘建模平台的本地化部署326
13.2 快速构建数据挖掘工程327
13.2.1 导入数据329
13.2.2 配置输入源组件331
13.2.3 配置缺失值处理组件332
13.2.4 配置记录选择组件334
13.2.5 配置数据标准化组件334
13.2.6 配置K-Means组件336
13.3 小结339

版权声明:
作者:admin
链接:https://manboo.net/150.html
来源:学习笔记
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
QQ群
< <上一篇
下一篇>>
文章目录
关闭
目 录