图书列表
大数据分析实务初级教程(Python篇)

作者:北京大数据协会

出版社:中国统计出版社

ISBN:978-7-5037-9956-3

出版时间:2022-09-30

装帧:平装

开本:16

定价:42.00元

42.00
订购方式
  • 内容简介
  • 作者介绍
  • 目录

大数据分析实务初级教程(Python篇)作为大数据实务初级教程的Python软件应用部分,主要讲述如何运用Python进行数据整理、数据分析过程。本书致力于呈现Python常用的数据分析方法,结合实际案例对于海量数据的处理提供了参考。本书依据北京大数据协会和智蓝大数据科技有限公司共同制定的《大数据分析人员职业技术技能标准》(全国团体标准T/BBDA 01-2021)编写,是中国大数据网联合北京大数据协会举办的全国大学生大数据分析技术技能大赛和北京大数据协会初级数据分析师证书考试指定的参考书目,也可作为本科及高职院校相关专业的教材。通过本书的学习,使读者能够系统地掌握Python语言基本特性,并能够胜任一些常规的数据处理和数据分析的任务。

北京大数据协会(英文简称:BBDA,Beijing Big Data Association),是在国家统计局、北京市统计局领导下,由百余家高校、科研机构、企事业单位共同发起的国内第一家在民政部门登记注册的大数据社会组织,共有高校会员百余家、企业会员两千余家。“普及数据科学、实现数据价值”是协会宗旨,旨在大数据领域广泛开展技术研究和学术交流,促进大数据在政、企、产、学、研等领域的协同发展,推动大数据采集、整理、分类、分析、存储、发布等技术行业标准的制订与推广,探索构建大数据分析专业人才协同培养模式,助力大数据教育工作者业务素质和教学水平的提高,推广大数据科技成果在政府管理部门和实际工作中的应用,力促大数据国际技术合作,提高全民数据素养,解决经济社会发展重大现实问题。

第1章 Python数据分析概述
1 1数据分析概述
1 1 1数据分析流程
1 1 2数据分析层次
1 1 3常见数据分析应用场景
1 2Python开发环境
1 2 1Anaconda的安装和使用
1 2 2Jupyter Notebook开发环境
1 2 3Spyder开发环境
1 3Python语言编程基础
1 3 1语法基础
1 3 2数据结构基础
1 3 3运算符
1 3 4Python常用控制结构
1 3 5函数和类
1 3 6模块和包
1 4Python数据分析模块
1 4 1NumPy模块
1 4 2pandas 模块
1 4 3Matplotlib/Seaborn模块
1 4 4其他模块
要点解析
本章练习

第2章 数据导入和导出
2 1导入数据
2 1 1导入Excel表格数据文件
2 1 2导入CSV格式数据
2 1 3导入JSON格式数据
2 1 4导入txt格式数据
2 1 5导入(爬取)网络数据
2 2输出数据
2 2 1CSV格式数据输出
2 2 2xlsx格式数据输出
2 2 3导出到多个Sheet页中
要点解析
本章练习

第3章 数据预处理
3 1熟悉数据
3 1 1数据表的基本信息查看
3 1 2查看数据表的大小
3 1 3数据格式查看
3 1 4查看具体的数据分布
3 2缺失值处理
3 2 1缺失值检查
3 2 2缺失值删除
3 2 3缺失值替换/填充
3 3重复值处理
3 3 1发现重复值
3 3 2处理重复值
3 4异常值的检测与处理
3 4 1检测异常值
3 4 2处理异常值
3 5数据类型转换
3 5 1数据类型检查
3 5 2数据类型的转换
3 6索引设置
3 6 1添加索引
3 6 2更改索引
3 6 3重命名索引
3 7其他
3 7 1大小写转换
3 7 2数据修改与替换
3 7 3数据删除
要点解析
本章练习

第4章 数据选择与运算
4 1数据选择
4 1 1NumPy数据选择
4 1 2pandas数据选择
4 2多表合并
4 2 1使用merge()方法合并数据集
4 2 2使用join()方法合并数据集
4 2 3使用concat()方法合并数据集
4 3算术运算与比较运算
4 4数据运算
4 4 1非空值计数
4 4 2求和运算
4 4 3均值运算
4 4 4最大值运算
4 4 5最小值运算
4 4 6中位数运算
4 4 7众数运算
4 4 8分位数运算
4 5数值排序与排名
要点解析
本章练习

第5章 数据分类汇总与统计
5 1Groupby分类统计
5 1 1按列分组
5 1 2遍历各分组
5 1 3使用字典和Series分组
5 1 4使用函数分组
5 1 5根据索引层级分组
5 2数据聚合
5 2 1groupby的聚合函数
5 2 2逐列及多函数应用
5 2 3返回不含行索引的聚合数据
5 3分组后apply函数
5 4数据透视表与交叉表
5 4 1数据透视表
5 4 2交叉表
5 5数据采样
要点解析
本章练习

第6章 时间序列
6 1获取当前时间
6 1 1datetime模块
6 1 2时间戳与time模块
6 2字符串和时间转换
6 3时间运算
6 4时间序列分析
6 4 1自回归(Autoregressive model/AR)模型
6 4 2滑动平均(moving average model/MA)模型
6 4 3自回归滑动平均(Autoregressive moving average model/ARMA)
模型
6 4 4自回归差分滑动平均(Autoregressive Integrated Moving Average 
model/ARIMA)模型
要点解析
本章练习

第7章 数据可视化
7 1图形绘制基础
7 2常用图形绘制
7 2 1折线图的绘制
7 2 2散点图的绘制
7 2 3柱状图的绘制
7 2 4箱形图的绘制
7 2 5饼状图的绘制
7 3组合图形的绘制
7 3 1多个折线图的组合绘制
7 3 2折线图和散点图的组合绘制
7 4双坐标轴图形绘制
要点解析
本章练习

第8章 数据分析
8 1数据特征分析
8 1 1对比分析
8 1 2相关性分析
8 1 3时间序列分析
8 2数据挖掘建模
8 2 1回归分析
8 2 2决策树
8 2 3主成分分析
8 2 4聚类分析
要点解析
本章练习

第9章 数据分析案例
9 1电商销售数据分析预测
9 1 1项目概述
9 1 2实现过程
9 2金融产品推荐
9 2 1项目概述
9 2 2实现过程
9 3客户价值分析
9 3 1项目概述
9 3 2实现过程
要点解析

参考文献

推荐图书 更多
  • 中国统计年鉴2025
  • 宏观经济统计分析与写作
  • 统统告诉你
  • 统计热点问题解读(第⼆辑)