统计学(五):几种常见的假设检验

定义

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
 
基本原理
  (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
  (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。
 

假设的形式

  H0——原假设, H1——备择假设

  双侧检验:H0:μ = μ0 ,H_1:\mu\ne\mu_0

  单侧检验:H_0:\mu\ge\mu_0 ,H1:μ < μ0  或  H_0:\mu\le\mu_0, H1:μ > μ0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。

 
假设检验的种类
下面介绍几种常见的假设检验
1. T检验
    亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的 正态分布资料。

目的:比较样本均数 所代表的未知总体均数μ和已知总体均数μ0。

  计算公式:

  t统计量:t=\frac{|\overline{X}-\mu_0|}{S_{\overline{X}}}=\frac{\bar{X}-\mu_0}{s/\sqrt{n}}

  自由度:v=n - 1

  适用条件:

  (1) 已知一个总体均数;

  (2) 可得到一个样本均数及该样本标准误;

  (3) 样本来自正态或近似正态总体。

T检验的步骤

  1、建立虚无假设H0:μ1 = μ2,即先假定两个总体平均数之间没有显著差异;

  2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;

  1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值的计算公式为:

  T=\frac{\bar{X}-\mu_0}{\frac{S}{n-1}}

  2)如果要评断两组样本平均数之间的差异程度,其统计量T值的计算公式为:

  T=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{\sum x_1^2+\sum x_2^2}{n_1+n_2-2}}\times\frac{n_1+n_2}{n_1\times n_2}}

  3、根据自由度df=n-1,查T值表,找出规定的T理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为T(df)0.01和T(df)0.05

  4、比较计算得到的t值和理论T值,推断发生的概率,依据下表给出的T值与差异显著性关系表作出判断。

T值与差异显著性关系表
TP值差异显著程度
T\ge T(df)0.01P\le 0.01差异非常显著
T\ge T(df)0.05P\le 0.05差异显著
T < T(df)0.05P > 0.05差异不显著

  5、根据是以上分析,结合具体情况,作出结论。

T检验的应用领域:

T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别。

2. z检验(U检验)
Z检验是一般用于大样本(即 样本容量大于30)平均值差异性检验的方法。它是用标准 正态分布的理论来推断差异发生的概率,从而比较两个 平均数的差异是否显著。

第一步:建立虚无假设 H0:μ1 = μ2 ,即先假定两个平均数之间没有显著差异,

  第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法,

  1、如果检验一个样本平均数(\bar{X})与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:

  Z=\frac{\bar{X}-\mu_0}{\frac{S}{\sqrt{n}}}

  其中:

  • \bar{X}是检验样本的平均数;
  • μ0是已知总体的平均数;
  • S是样本的标准差
  • n是样本容量。

  2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:

  Z=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{S_1}{n_1}+\frac{S_2}{n_2}}}

  其中:

  • \bar{X_1},\bar{X_2}是样本1,样本2的平均数;
  • S1,S2是样本1,样本2的标准差;
  • n1,n2是样本1,样本2的容量。

  第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示:

Z值与P值关系
\left| Z \right|P值差异程度
\ge2.58\le0.01非常显著
\ge1.96\le0.05显著
<1.96>0.05不显著

  第四步:根据是以上分析,结合具体情况,作出结论。

3. F检验
4. 卡方检验
相关推荐
©️2020 CSDN 皮肤主题: 博客之星2020 设计师:CY__ 返回首页