内容简介
本书前三版作为全国统计教材编审委员会规划教材,收到良好的反响。第四版在前三版基础上又做了一定的增删。本书编写的目的是希望读者在学习之后,能够知道实际中哪些是统计问题,最好能够自己解决一部分统计问题,即使不能解决也知道能够在哪里查到答案和向谁请教。通过学习获得解决和处理问题的能力。第四版采用免费的自由软件R,由浅入深地把统计最基本和最有用的部分在这么一本不厚的教科书中完整地介绍给读者,而且让读者可以边学习,边着手用统计软件处理数据。不仅可供没有学过概率论和数理统计的非统计专业的本科生和研究生使用,也可以供统计专业的本科生作为理解统计本来含义的教材使用(以代替不能满足需要的“描述统计学”等类课程),它还可以为各领域的广大实际工作者作为应用各种统计方法的参考书。前面的章节是对统计基本概念的介绍。后面的部分介绍更有针对性的一些统计模型和方法。
目录
第一章 一些基本概念
1.1 统计是什么?
1.2 现实中的随机性和规律性,概率和机会
1.3 变量和数据
1.4 变量之间的关系
1.4.1 定量变量间的关系
1.4.2 定性变量间的关系
1.4.3 定性和定量变量间的混和关系
1.5 统计、计算机与统计软件
1.6 小结
1.7 习题
第二章 数据的收集
2.1 数据是怎样得到的?
2.2 个体、总体和样本
2.3 收集数据时的误差
2.4 抽样调查和一些常用的方法
2.5 计算机中常用的数据形式
2.6 小结
2.7 习题
第三章 数据的描述
3.1 如何用图来表示数据?
3.1.1 定量变量的图表示:直方图、盒形图、茎叶图和散点图
3.1.2 定性变量的图表示:饼图和条形图
3.1.3 其他图描述法
3.2 如何用少量数字来概括数据?
3.2.1 数据的“位置”
3.2.2 数据的“尺度”
3.2.3 数据的标准得分
3.3 小结
3.3.1 本章的概括和公式
3.3.2 R语句的说明
3.4 习题
第四章 机会的度量:概率和分布
4.1 得到概率的几种途径
4.2 概率的运算
4.3 变量的分布
4.3.1 离散随机变量的分布
4.3.2 连续随机变量的分布
4.3.3 累积分布函数
4.4 抽样分布、中心极限定理
4.5 用小概率事件进行判断
4.6 小结
4.6.1 本章的概括和公式
4.6.2 本章例题和R语句说明
4.6.3 生成本章 图形的R代码
4.7 习题
第五章 简单统计推断:总体参数的估计
5.1 用估计量估计总体参数
5.2 点估计
5.3 区间估计
5.3.1 一个正态总体均值μ的区间估计
5.3.2 两个正态总体均值之差μ1-μ2的区间估计
5.3.3 总体比例(Bernoulli试验成功概率)p的区间估计
5.3.4 总体比例(Bernoulli试验成功概率)之差p1-p2的区间估计
5.4 关于置信区间的注意点
5.5 小结
5.5.1 本章的概括和公式
5.5.2 R语句的说明
5.6 习题
第六章 简单统计推断:总体参数的假设检验
6.1 假设检验的过程和逻辑
6.1.1 假设检验的过程和逻辑
6.1.2 假设检验在前计算机时代发展的一些概念和步骤
6.2 对于正态总体均值的检验
6.2.1 根据一个样本对其总体均值大小进行检验
6.2.2 根据来自两个总体的独立样本对其总体均值的检验
6.2.3 成对样本的问题
6.2.4 关于正态性检验的问题
6.3 对于比例的检验
6.3.1 对于总体比例的检验
6.3.2 对于连续变量比例的检验
6.4 非参数检验
6.4.1 关于非参数检验的一些常识
6.4.2 关于单样本位置的符号检验
6.4.3 关于单样本位置的Wilcoxon符号秩检验
6.4.4 关于随机性的游程检验(runs test)
6.4.5 比较两独立总体中位数的Wilcoxon (MannWhitney)秩和检验
6.5 从一个例子说明“接受零假设”的说法不妥
6.6 小结
6.6.1 本章的概括和公式
6.6.2 R语句的说明
6.7 习题
第七章 变量之间的关系;回归和分类
7.1 问题的提出
7.2 定量变量的线性相关
7.3 经典回归和分类
7.3.1 一个数量自变量的线性回归
7.3.2 多个数量自变量的线性回归
7.3.3 自变量中有定性变量的线性回归
7.3.4 Logistic回归
7.3.5 自变量为数量变量时的分类:经典判别分析
7.4 现代分类和回归:机器学习方法
7.4.1 决策树
7.4.2 关于组合算法
7.4.3 Boosting
7.4.4 随机森林
7.4.5 支持向量机
7.4.6 交叉验证比较各个模型
7.5 频数或列联表数据
7.5.1 列联表数据及二维列联表的独立性检验
7.5.2 高维列联表和多项分布对数线性模型
7.5.3 Poisson对数线性模型
7.6 小结
7.6.1 本章的概括和公式
7.6.2 R语句的说明
7.7 习题
第八章 多元分析
8.1 寻找多个变量的代表:主成分分析和因子分析
8.1.1 主成分分析
8.1.2 因子分析
8.1.3 因子分析和主成分分析的一些注意事项
8.2 把对象分类:聚类分析
8.2.1 如何度量距离远近
8.2.2 事先要确定分多少类:k均值聚类
8.2.3 事先不用确定分多少类:分层聚类
8.2.4 聚类要注意的问题
8.3 两组变量之间的相关:典型相关分析
8.3.1 两组变量的相关问题
8.3.2 典型相关分析
8.4 列联表行变量和列变量的关系:对应分析
8.5 小结
8.5.1 本章的概括和公式
8.5.2 R语句的说明
8.6 习题
第九章 随时间变化的对象:时间序列分析
9.1 时间序列的组成部分
9.2 指数平滑
9.3 Box-Jenkins 方法:ARIMA模型
9.3.1 ARIMA模型介绍
9.3.2 ARMA模型识别和估计
9.3.3 用ARIMA模型拟合
9.4 小结
9.4.1 本章的概括和公式
9.5 习题
第十章 生存分析简介
10.1 对生命数据的简单描述
10.2 Cox比例危险模型
10.3 小结
10.3.1 本章的概括和公式
10.3.2 R语句的说明
10.4 习题
第十一章 指数简介
11.1 指数漫谈
11.2 价格指数
11.3 数量指数(生活标准指数)
11.4 总花费指数
11.5 一两个常见的经济指数
11.6 小结
附录A 练习:熟练使用R软件