100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 贾俊平-第四章:数据的概括性度量

贾俊平-第四章:数据的概括性度量

时间:2018-09-20 23:30:28

相关推荐

贾俊平-第四章:数据的概括性度量

贾俊平-第四章:数据的概括性度量

4.1 集中趋势的度量

集中趋势&离散趋势:

集中趋势:低层次数据的集中趋势测度值适用于高层次的测量数据;但反之并不适用。

4.1.1 分类数据:众数M0

只有在数据量较大的情况下众数才有意义;众数可以有多个。

4.1.2 顺序数据:中位数Me和分位数

中位数:不适用于分类数据

4.1.3 数值型数据:平均数

①简单平均数与加权平均数

②调和平均数Hn(平均数的另一种表现形式)

③几何平均数Gm

4.1.4 众数、中位数和平均数的比较

4.2 离散程度度量

数据离散程度越大,集中趋势的测度值对该组数据的代表性就越差;反之则越好。

4.2.1 分类数据:异众比率

4.2.2 顺序数据:四分位差

4.2.3 数值型数据:方差和标准差

1.极差(易受极值影响,且不能反映中间数据的分散情况)

2.平均差

3.方差和标准差

4.2.4 相对位置的度量:标准分数

1.标准分数

2.经验法则

当一组数据对称分布时:

约有68%的数据在平均数加减1个标准差的范围之内;

约有95%的数据在平均数加减2个标准差的范围之内;

约有99%的数据在平均数加减3个标准差的范围之内;

在3个标准差之外的数据,在统计上也称为异常值或离群点。

3.切比雪夫不等式

对于任意分布形态的数据,至少有(1-1/k2)的数据落在k各标准差之内;其中k时大于1的任意值,但不一定是整数。

eg:当k=2,指至少有75%的数据落在平均数加减2各标准差的范围之内。

4.2.5 相对离散程度:离散系数

4.3 偏态与峰态的度量

集中/离散是数据分布的特征,偏态/峰态是数据分布的特点

4.3.1 偏态即其测度

当SK=0,则分布对称(变量与平均数三次方后,累加时会相互抵消);

当SK>0,正偏/右偏;

当SK<0,负偏/左偏。

SK值越大,偏斜程度越大。

4.3.2 峰态及其测度

K=0 ——正态分布

K>0 ——尖峰分布

K<0 ——扁平分布

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。