1.1 数据的描述性分析
在建立随机模型之前,首先要分析数据的主要特征,也就是数据的数字特征.这些特征通常是均值、方差,或者是数据服从什么分布.只有在确定了这些特征之后,才能建立起符合实际的模型.
本节介绍数据的描述性分析的统计方法,以及完成此类分析的R函数.
1.1.1 数据的数字特征
1.1.2 随机变量的分布
1.随机变量
从一个总体中抽取不同的样本,分析各个样本所获得的点估计往往不尽相同,这种表现出变异性特征的量称为变量.
在进行统计试验以前,一般并不知道某一试验的确切结果,但是可以赋予试验结果以实际数量的一个函数.因此这一变量称为随机变量.随机变量常用大写字母表示,如X,Y,Z.它们可能出现的具体结果或数值则可用小写字母表示,如x,y,z.
最常见的随机变量有两类.一类是以计数形式表示的随机变量,称为离散型随机变量;另一类是取值在某个有限或无限区间的随机变量,称为连续型随机变量.
2.分布函数
3.概率函数与概率密度函数
4.分位数
1.1.3 常用的分布
1.1.4 数据的图形描述
可以通过数据的图形描述判断数据的分布情况,比如是否来自于正态分布等.
1.直方图
直方图又称柱状图或质量分布图,是一种统计报告图,由一系列高度不等的纵条纹或线段表示数据的分布情况.直方图是用来展示连续数据分布的常用工具,用来估计数据的概率分布.
在R中,hist()函数绘制数据的直方图,其使用格式为