14 12
发新话题
打印

[心理学方法] u检验、t检验、F检验、X2检验

u检验、t检验、F检验、X2检验

常用显著性检验& [5 }! d2 F, l) s5 c* q

& [; N. O/ S6 |! U; b# g  1.t检验6 p# h' y% A3 f! e6 z, p  X
8 Y& c) c) D: e) y
  适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。1 S: r/ \0 X" l: t
8 t1 R  i/ d! [
  2.t'检验0 v" j" g, Y! P. }: T: s6 A
. \9 |$ f  [2 ?  K. S( {1 T/ H
  应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。; {- [2 s7 _0 x. E/ G# Q6 l
* l. i- E+ O, M! H. ^
  3.U检验+ v7 [7 q5 P$ |$ Z' a

- m; C5 C, @# r! j2 r% J  应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。+ @- t/ r2 D9 w; Q/ _1 `7 w/ Z

: s4 t7 w, l; g8 B5 Y6 K  4.方差分析
; v$ Z' x! v) j- G' O1 |
8 T) h* _7 Z/ x% e8 w4 r! k  用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。1 N* V- J4 j' P* D
+ I& |7 ?) n; [4 G1 J
  5.X2检验
7 A3 o1 Q) _/ D7 f6 i4 P8 v8 p7 i0 G
  是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况:四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。( k6 k0 @8 H( J2 F8 u4 L

( y8 Y( O/ {' O4 ?# u. W  6.零反应检验
$ n- i" p2 {8 i. ]. R' K9 H6 l! V
+ n: m. w) \6 C/ V) f" j  用于计数资料。是当实验组或对照组中出现概率为0或100%时,X2检验的一种特殊形式。属于直接概率计算法。9 U) I7 n9 P9 X0 p; g( y

; i4 C- Q: G/ y, x7 e. _  7.符号检验、秩和检验和Ridit检验! v2 c2 N! e/ O  d3 {! L5 y: s
& N4 W$ i1 h' u4 O
  三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。
) t$ \3 {; b! e( T9 l. J2 L
- t! W8 ^0 c. R8 J. k! S% G  8.Hotelling检验
) M; e! z  y. M9 ^' w2 M. ~* W2 @& _& J
  用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。# s3 A0 s' q; ?! B2 O/ L
3 `9 q% ]0 g' k
9 `2 O" e) o, D1 v  j) e$ i% Q% H
计量经济学检验方法讨论% B+ |: T; {2 |
; l8 T' W9 R% [# f
计量经济学中的检验方法多种多样,而且在不同的假设前提之下,使用的检验统计量不同,在这里我论述几种比较常见的方法。# r' _  L; Q6 t2 i; Z

8 E  x% P; E4 W" s1 O在讨论不同的检验之前,我们必须知道为什么要检验,到底检验什么?如果这个问题都不知道,那么我觉得我们很荒谬或者说是很模式化。检验的含义是要确实因果关系,计量经济学的核心是要说因果关系是怎么样的。那么如果两个东西之间没有什么因果联系,那么我们寻找的原因就不对。那么这样的结果是没有什么意义的,或者说是意义不大的。那么检验对于我们确认结果非常的重要,也是评价我们的结果是否拥有价值的关键因素。所以要做统计检验。
" v' I* i! i( r. x1 U. ^9 C: b; j+ T, w( W. v, x5 X, k7 ^+ E
t检验,t检验主要是检验单个ols估计值或者说是参数估计值的显著性,什么是显著性?也就是给定一个容忍程度,一个我们可以犯错误的限度,错误分为两类:1、本来是错的但是我们认为是对的。2、本来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的。一般的计量经济学中的这个容忍程度是5%,也就是说可以容忍我们范第一类错误

TOP

的概率是5%。这样说不准确,但是比较好理解。t-stastic是类似标准正态化的正态分布两一样,也就是估计值减去假设值除以估计值得标准差,一般假设值是0,这一点不难理解,如果是0 ,那么也就意味着没有因果关系。这个t-static在经典假设之下服从t分布。t分布一般是和正态分布差不多,尤其是当样本的量足够大的时候,一般的经验认为在样本数量大于120的时候,就可以看成是正态分布的。- _& m. `& Y' L% H: Q
+ W! X  E) p! D
F-statistc:F检验是属于联合检验比较重要的一种,主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题做出的检验。F统计量主要的产生来源是SSR\SST\SSE三个量。但是这个检验有一个缺点是必须在经典假设之下才能有效。
" t6 L+ s5 k' G& G4 g- Q
) x& y# m6 Y! e' |9 s- Q0 W7 J2 vLM检验:这个检验的性质和F检验的性质是一样的,都是检验联合显著性的,不同的是F统计量符合F分布,但是LM统计量服从卡方分布。卡方分布是正态分布的变量的平方和,而F分布是卡方分布的商,并且分子和分布必须独立,这就是为什么F检验适用范围受限的原因。LM=n*SSR、或者是LM=n-SSR。
5 [0 U! Y. c: o5 B' \1 T
% R5 ?9 {/ N; i* F至于其他的White检验、Brusch-pagan检验(异方差的检验方法)、还有序列相关的t检验、DW检验基本原来是相同的。5 X; w( y' p5 e
4 X$ ~  R- i% B
关于异方差检验、序列相关的检验其中存在不同的地方,但是思想基本是相同的。
$ a4 R) M8 J9 G* N
: g+ E- o' c) q, r* v+ C关于异方差检验的讨论:
3 X+ g3 H: l6 R1 H& ?3 u% _4 r9 \5 Y: ~/ D' d. b9 ^5 y( z
1、Brusch-pagan检验:这个检验的思路比较简单,主要是要研究残查和X之间的关系,给定这样的一个方程:u=b0+b1*x1+……+bn*xn+u'的回归,其中进行F检验和LM检验。如果检验通过那么不存在异方差,如果不通过那么存在异方差。& H2 c' Y+ _. ~  C5 Q0 f
2 C0 V1 h* h0 \  ~6 d5 x
2、White检验:这个检验也是对异方差的检验,但是这个检验不同的是不仅对于X的一次方进行回归,而且考虑到残查和x的平方还有Xi*Xj之间的关系。给定如下方程:u=b0+b1*y+b2*y^2+u'。也是用F和LM联合检验来检验显著性。如果通过那么不存在异方差,否则存在。
# J7 g+ A3 P% i. Q2 |+ ^
$ K7 ^% N' s3 Y( v% j序列相关的检验方法的讨论:+ g* [. c7 [0 {/ E1 W5 I; X9 J
* ]& u8 R  a8 Q) c' @' k! v' g5 ~
对于时间序列的问需要知道一个东西,也就是一介自回归过程,也就是一般在教科书中说到的:AR(1)过程,其中的道理主要是说在当期的变量主要是取决于过去一个时期的变量和一个随机误差项。表示如下:Ut=p*U(t-1)+et。在这里我要说到几个概念问题,I(1)(一阶积整)、I(0)(零阶积整)。其中的一介自回归过程AR(1)就属于零阶积整过程,而一阶积整过程实际上是随机游动和飘移的随机游动过程。随机游动过程:Ut=U(t-1)+et。也就是在AR(1)的过程之下,其中的P是等于1的。飘移的随机游动过程:Ut=a+U(t-1)+et。其中随机游动过程和AR(1)

TOP

过程中的不同点在于一个弱相依性的强弱问题,实际上我们在时间序列问题中,我们可以认为任何一个过程是弱相依的,但是问题的关键是我们不知道到底有多弱?或者更加直观地说,我们想知道P到底是多大,如果P是0.9或者是一个比较接近于1得数,那么可能我们可以认为这个时间序列有高度持久性,这个概念表示当期的变量却绝于一个很早的时期的变量,比如一阶积整过程,实际上et是一个独立统分布的变量,而且条件数学期望等于0,没有异方差性。那么实际上这个序列的数学期望是和期数没有什么关系的。那么也就意味着从第0期开始,U的数学期望值就是和很久以后的U的数学期望值一样的。但是方差就不同了,方差随着时间的增加不断扩大。我们知道了,这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题,但是我们说一介自回归的过程是参差序列的特征而已,其他的变量的特征问题我们不谈。4 l, \. g! e% c7 C
$ y/ B3 g5 u2 N: D
在讨论检验的问题以前,我有必要交待一下时间序列在ols估计的时候我们应该注意什么。实际上解决序列自相关问题最主要的问题就是一个差分的方法。因为如果是长期持久的序列或者是不是长期持久的序列,那么一定的差分就可以解除这种问题。
2 q+ w# u  f' x0 {: z$ o3 C3 X4 I- _& `9 n1 a
1、t检验。如果我们知道这个变量是一个一介自回归的过程,如果我们知道自回归过程是AR(1)的。那么我们就可以这样作,首先我们做OLS估计,得到的参差序列我们认为是一阶自相关的。那么为了验证这种情况,那么我们可以做Ut和U(t-1)的回归,当然这里可以包含一个截距项。那么我们验证其中的参数的估计是不是显著的,就用t检验。
- N! m& K3 q' m- q/ @3 F9 L2 ]8 H+ C, L

$ ^6 q8 L. @4 B1 v8 `7 V
3 }: X2 _+ ~3 ~4 \4 Pt检验与F检验有什么区别' J0 l: f$ I4 @8 W  e

( y8 I' h2 s7 y0 Q- S3 o) b' N% G3 i  |+ V& q( c
1.检验有单样本t检验,配对t检验和两样本t检验。( g) g, z8 v& y% R) Z7 P: o% I

* X! f; H/ ~/ E$ ^$ T单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。
( M1 q, t3 B7 r' w" X, \
) {! N* @  k& E. v! ?& @配对t检验:是采用配对设计方法观察以下几种情形,
: b! `1 d& J. \* B" L9 A4 h; G! H0 c( ^2 X
1,两个同质受试对象分别接受两种不同的处理;
. N* v* \. u# a' h2 K: C5 `& @5 A( M0 v0 `1 I. [1 u
2,同一受试对象接受两种不同的处理;# b7 y' S1 l4 Y# ~( u" P6 ~# q

! ]1 r( f3 a3 x$ v) y3,同一受试对象处理前后。
7 Z. c" V3 _3 U$ q0 i; x2 T; P: ~1 ~
2 C! N2 P1 k+ X  i2 ]7 n" GF检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。
5 W; C6 p! l- E- U3 _# X  o% |5 @6 E5 h9 t0 l# Q$ A! _
2.t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类,
! n/ ^8 N. S7 i: n( T- a
! L  X- ^2 v) T2 P2 h( L第一类是针对单组设计定量资料的;) F5 Q/ w4 Z7 A; x* u1 S8 a
* Q& ^% U( P9 Z. D+ l- V4 [
第二类是针对配对设计定量资料的;7 @( t. N7 r+ a: k  z% l
# U' h# d1 `$ [
第三类则是针对成组设计定量资料的。/ h6 `+ T5 x- ~( }5 h7 D
7 c6 F' H) l  D; W3 N
后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。  % r6 X3 P: T. f

. I  G# o) J2 L4 M7 r# ~若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;

TOP

若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。
. j. h' f, p5 {( l
2 `  _* n. k4 p: M# i& X, A之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。  值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。  
: t4 w1 u- i) I6 D0 p- P& \8 T
" O% g! j5 P* `6 a8 r' a7 pt检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:* l" c6 u+ w& I) i+ \

( p" \* E8 \, \5 x不考虑t检验的应用前提,对两组的比较一律用t检验;
5 x# @7 M9 x+ p. v: K8 w9 k+ {0 b5 I/ `( C
将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。, B, t8 t8 _# z

+ r8 O  |0 [& ]' U  e8 t- q以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。
, k, ~. x( B/ ]7 v9 O/ B4 W' U$ \: D- h- W3 u/ z; R: j" T3 k

- [8 ?) M+ T% h+ @; \- M$ x
* m, \2 [" h. Ku检验和t检验区别与联系( N1 \4 E# k9 O- H
  Y  p' R0 d+ f8 t2 u$ [
( k: P9 j6 a/ S$ s4 {6 h* O
7 {. ~* O! ]# Q6 K% m
) F8 X+ r2 h$ w

  P" E# j  `6 n  h, c; s4 |% R8 a* t  {* a0 H- Z
4 p7 R# }' R# J& W* V" B" [
- [3 z; I  @6 R7 l# z( C) v
# C! N4 N# ~0 Y( n; v# Z7 H% f
u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ未知时,可应用t检验,但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。
8 y) x" W( \" ?: ?2 R/ |. b; o" Q
3 l, a$ E/ p3 l! \0 U( G/ H一、样本均数与总体均数比较4 n% @8 e5 J4 J/ ^* D% i# m
' @8 x6 Q0 y* e" G/ p
比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验。, |; N5 ~6 @: t' P4 c, y1 ?" E9 h
, s- I' T/ F- t% a- M/ d
(一)u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值,代入式(19.6)]时。6 i8 O0 C& D  U$ G, {
6 I" C6 \+ U3 A% i* M! s" Q
以算得的统计量u,按表19-3所示关系作判断。
8 e5 e: i3 J" ^5 M' H6 \& c' ~/ Z% v. s  K$ u! n2 c: ?3 ~
表19-3 u值、P值与统计结论
& H4 ?; ], O7 [# E6 X+ @4 U. }% @" w. Z% d- @7 o- \

0 b9 l7 Z6 V- ]; b- }2 S4 U/ ~! ]) I- V: z3 G# v7 ?

5 m# @* Z: |3 x4 C; D, L4 K5 V+ w5 E! `$ U. }, B& W# k/ }& F' ?
0 O8 T# o/ i2 s0 K; a4 T

' O% f  }$ y" @( k: a8 uα 
; ^: }+ C7 h5 e+ u        |t|值 
& ~5 x1 D$ f% Z- X9 y/ `& L        P值 ! ~) u0 O0 Y( f( T' c
        统计结论 5 a# ?& i$ R7 h+ C" n9 m2 Z
, b% ]- Q# n, m" R2 a: T

: b$ A8 {( ^1 z, {5 `( ~! u, X9 N  i/ `$ ~5 |0 g
0.05双侧' O) X' x+ ~1 v& A0 j+ Q
单侧 ' K' ~4 C. M/ Y2 M, g% r; I
        <1.966 A: }5 `+ y. ~+ Y# L
<1.645 . s  M) {' I' X5 A$ H
        >0.05 
+ E+ b9 V( q; Q        不拒绝H0,差别无统计学意义   W% V3 T1 k5 S7 r, O# H
7 Y! n* D+ n: C0 C6 n  [- D  X+ u
' q  `) @: v- k8 u! [
6 A/ T4 X$ Q2 ~. r% ^5 `
0.05双侧' u: `; }; z7 I
单侧 
, ^" B+ O" J- Q1 o0 k  T        ≥1.96' i+ w& I9 j/ p; V' }& a3 c% n
≥1.645 $ j! t1 T+ I% o% N/ K
        ≤0.05 9 L. J( M; c( a4 M
        拒绝H0,接受H1,差别有统计学意义 * j3 `  D) n+ l2 H# p: \1 \8 ^+ b5 E5 U
$ ]: X0 ^2 \" |" H; }
3 \$ a" c9 s. _

4 `5 c5 V/ r# j( O+ z0.01双侧2 o" u0 ?- |2 u- h* T% |6 i
单侧 
2 N, b' B8 d& _& A( _  N        ≥2.581 g  o8 y2 `1 S2 [$ H
≥2.33 
2 t9 R1 j3 v1 j# Z5 n3 R8 p7 ]        ≤0.01 
& r' v3 }- F$ t# j! t6 r) j: j        拒绝H0,接受H1,差别有高度统计学意义 . c0 I$ _; _9 q% w# ]5 _- K' E
2 p6 O7 h* `9 _( q

0 s( ^1 i/ i9 Z1 V
: C$ l! W6 C/ Q" K2 ^3 X& e4 N8 F
3 m. s5 v0 ?( |, M3 v6 U4 O例19.3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,能否据此认为山区成年男子的脉搏高于一般?" E, n; b4 C4 u- ~7 |+ ]

4 t- O' R0 ?5 n+ n据题意,可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25.
( M) O* F: i& z# c/ {6 m8 d% q% e; r$ [: w( U* l! }
H0: μ=μ0; Q: z- w3 F9 Y8 z

0 m2 n( I( V7 A3 vH1: μ>μ00 a/ q" ~3 F; D7 }# q
1 J9 e; v+ c2 N
α=0.05(单侧检验)+ ~: S9 F: N+ @: W- T7 z! o& R

$ e" O6 @3 p9 c算得的统计量u=1.833>1.645,P<0.05,按α=0.05检验水准拒绝H0,可认为该山区健康成年男子的脉搏高于一般。: }& A9 k: u. O: |
" S2 I4 ]5 R7 J
(二)t检验用于σ未知且n较小时。4 ]+ {0 A; i* E8 l) B
4 e& z. i0 @1 c) P, h  Y
以算得的统计量t,按表19-4所示关系作判断。+ w9 W0 ]' E. q

0 k% w$ ]% q% E8 a3 j; d  j表19-4 |t|值、P值与统计结论
- T1 R6 L' ]( Y2 ^
: |. m& b( S2 m% Z- p
* R! Q0 U1 Q: X  j8 U) q' ~# V0 l, H( x" h8 |
α 
7 {5 s% ?' Y4 X4 r        |t|值 4 @. n% e) K( t- u7 m+ c
        P值 - H1 a% ^- ?4 s7 m
        统计结论 
" ]  t8 Y! o! n- q2 c% z6 q" C8 V* @7 P5 Z2 e  a' l  m
, U, q* X/ s7 C9 O
5 s6 ~* \3 Q6 s9 [0 W- S
0.05 
0 M$ G3 {; p; |/ w# B        <t0.05(v) 9 L7 b9 p# I+ y% v: ]
        <0.05 
/ T1 q* U: o) }0 `- V  g        不拒绝H0,差别无统计学意义 
( C, \6 ?$ `5 Z2 c3 C
4 x' K  F$ @' b- w7 O+ J$ Y
- W+ I/ I+ N4 Z: v6 B- v6 q* Q5 b4 M2 [- {- ?
0.05 : I' J9 X& C0 Z* ^/ m- s
        ≥t0.05(v) . {' o4 s* C( a1 l
        ≤0.05 . B; Y9 y: p- f& J7 O+ E9 @
        拒绝H0,接受H1,差别有统计学意义 0 D2 X. t) M4 ?* p- d

9 V3 h$ ]9 [3 M+ a2 g; G' N: {' h
- w9 v7 H) v) u) T! c  k, v  T# d! t7 j. W* H# }& c& D
0.01 3 J+ n# r- u% Z4 y1 z
        ≥t0.01(v) 
! L5 K4 l' ^! i4 T$ c! g8 o        ≤0.01 
; c* ]  U, [2 G: U$ c; T        拒绝H0,接受H1,差别有高度统计学意义 
& l% r4 a7 L3 e9 |/ Q
6 e: U& u' W' X% A+ e
. L, r2 S4 I$ v9 [7 h1 L  v" t

( w7 l1 Z7 E9 [( i+ e例19.4 若例19.3中总体标准差σ未知,但样本标准差已求出,s=6.5次/分,余数据同例19.3.
, [* ^1 Q. K5 T4 F9 b4 m& B+ M8 L7 U/ u
据题意,与例19.3不同之处在于σ未知,可用t检验。
  J+ V: Z% i9 g1 y. }. r+ k5 s. }0 n5 D: Q
H0: μ=μ0
- h( V- j# I) e. S8 y1 A+ {- `  O' U  D/ |. q0 ]8 J1 F* `) B- U
H1: μ>μ0
2 S2 _" b* S; h* W! E2 A1 {' h2 V% ^" i2 m% K
α=0.05(单侧检验)
+ l: K5 U3 A7 T8 T) U7 s& l! F- N
& w# i: y9 @7 l8 P本例自.由度v=25-1=24,查t界值表(单侧)(附表19-1)得t0.05(24)=1.711.算得的统计量t=1.692<1.711,P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为该山区成年男子的脉搏高于一般。
, d4 `0 q2 r5 \. R8 O. z" f- T# A# V, j
二、配对资料的比较7 S! `7 O: n5 p) R3 [
9 P7 ]( p* N5 s2 s8 J, h  o
在医学研究中,常用配对设计。配对设计主要有四种情况:①同一受试对象处理前后的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处理后的数据。情况①的目的是推断其处理有无作用;情况②、③、④的目的是推断两种处理(方法等)的结果有无差别。, u6 \$ g* l8 @6 J, D
  R7 |2 j3 Y  E5 C
公式(19.8)
- A; y5 s# l4 ~$ ~5 f" Y) B, `7 R4 F3 Q* h  r, F' C
式中,0为差数年总体均数,因为假设处理前后或两法无差别,则其差数的均数应为0,d为一组成对数据之差d(简称差数)的均数,其计算公式同式(18.1);Sd为差数均数的标准误,sd为差数年的标准差,计算公式同式(18.3);n为对子数。
4 }2 n5 l& V" }; \1 z: w' s& @& C0 J, y6 \0 _  d
因计算的统计量是t,按表19-4所示关系作判断。
7 O5 R5 j2 D" L3 P1 q+ c' h
9 ]$ I: r4 |4 _7 e+ l- m- ~8 m; ?( v例19.5 应用某药治疗9例高血压病人,治疗前后舒张压如表19-5,试问用药前后舒张压有无变化?
5 E; U: G& U  N4 U3 s( |3 c# E/ s$ W
8 w: \( u- W( u表19-5 高血压病人用某药治疗前后的舒张压(kPa)
' F) |% C4 M) u8 g% U0 M
' A2 b+ {" K4 N4 Y! J0 w+ B. O+ F! u/ J# Q! D* m
7 v: o& N( w6 z& q& m4 J* C
病人编号 / ^( W# v& q& F9 G
        治疗前 
. j7 G4 P7 Z! I        治疗后 0 `4 x0 S# @/ _; G+ t
        差数d ; V7 j: g- W3 h) }/ c
        D2 
7 h/ |. f! C- m5 |) q$ s% F0 s3 i- F' [" f5 W! Q, D% \' ^
! e. o3 Y: r4 o$ I! R( h! i
) f6 ?7 c$ N+ ]% u6 `) e6 C
1 ' v, q/ S( b% i$ ^$ |$ h2 C9 h) ^7 S
        12.8 7 [% d4 i8 o3 J: v( K4 x/ }5 L: h
        11.7 
5 N* x3 C4 z5 |1 y6 m4 r        1.0 
* m7 I* |7 G( |/ b8 `        1.21 
# j9 N) f% K3 M9 O* A# h! _+ \: k. f0 Z" y" \" r! A7 p

/ X4 P! }8 F! p3 c) W# A" ?6 w2 G7 S# O( l9 u( _' O  U
2 7 v5 p9 y+ N5 M
        13.1   n* H& \2 [1 h8 {
        13.1 3 }" k. e+ c6 i" n3 U% m" d+ y: @
        0.0 
" O2 f8 N2 ^; m4 T3 d- F; F        0.00 9 [; t) ^# @  d; a
* Z7 @' I4 S" U# w  m* C! O
& d) s6 M# T% U) a

2 ^& I* `; q# n' X* a8 [3 
/ Q' M, H1 C& X( R0 o        14.9 , J6 O+ w) W4 G# z$ B- G( l- |' r
        14.4 / J8 b6 z  L: S: V' _/ ~, ~% C% R
        0.5 ! \+ q5 N0 v2 L& k
        0.25 
; u. e5 x3 Z# k7 k% y8 v6 c: ]0 p( Q
7 n  D* D0 U) s2 F9 {1 u7 R7 e. Y2 x! O- C4 e% n! O
8 D/ K  @/ [8 \" B8 z$ T. P7 }, z
4 
) v, p" d7 C8 w) a+ b        14.4 
" W: _% z$ v* k' P        13.6 4 O& i8 i9 V3 B9 i) N; R' `, i
        0.8 ; q3 n9 [, w$ ]- \9 y: u5 a9 M8 y9 r
        0.64 8 s5 v. {' V: a  u, Q7 ~1 A

1 y* k! ^% R. c6 L: `2 V6 D1 Z  [1 T# A: |% m
: _* d5 w& ]4 W( G2 [2 D7 w
5 
# a( i; x; ?( i8 j8 T% x, M        13.6 
$ z+ X( i, j7 m, W7 b: c" j6 m' j* Q        13.1 ( g7 U2 U: p1 y2 n0 B* p
        0.5 
4 x) X6 R8 m, S' y6 S7 F5 P        0.25 
% S1 f5 @) k! T$ H. G3 i" e# _
5 I+ r3 W/ R! r
* Q0 p6 E3 ~$ R/ S
+ V! d4 J3 {( ^4 r6 
$ j9 b5 e; y0 v6 c        13.1 
1 e% A3 z4 q( N6 I; F- w3 A  a* W        13.3 - W. ~6 S8 j3 K8 G, k- c
        -0.2 7 E, H- L; `8 f" u
        0.04 % g; x+ g: T# d/ `- j

6 P% D, {/ I) y# \7 ]# @3 `9 y' j+ }# f; F% ~0 A+ u

3 l' h& T! g  q* I* u7 
& R' h: v3 R( z& l' O7 A2 i        13.3 
5 y  |) e- q2 n: k        12.8 
: P  }8 x8 u% v8 I        0.5 
$ |1 t) W6 n: U+ ]        0.25 
( {! d/ j3 X) W" D. b: T- k# B" |; @. N2 n" A
0 V8 p2 H* S; W6 X
. t3 A  T1 m8 ?0 c5 J5 f+ g
8 
5 Z1 _* t/ n8 R' r, z: _        14.1 $ k  d$ n+ r( f3 i) `
        13.6 : y2 P( z, g0 v& N: I( g
        0.5 
# ?; {/ V: H/ N( R! n        0.25 
" t" Y9 B: p8 y1 I
7 l. T* C/ |0 W) \( R* R5 l, x8 `4 m" s, k( Y0 z
0 s! j5 G$ l5 \" ~4 o2 H
9 
0 q0 S/ @# Y9 |        13.3 
/ x/ R+ D3 h- ~        12.3 
. M2 _7 z% _& a5 i        1.0 8 I& O# c; q& H8 G* G
        1.00 
  }, b0 h# n7 g) g) d! @7 J
9 b* a) E9 b1 a+ Y
' ]: t: I5 N3 h, b, k. W+ E8 u' H: j  b( }; G. o
合计 
, }8 f# k  l' }8 q          
9 l5 e% z; g; g  G1 U$ X# T0 K/ @          
" k0 W  P; r0 g0 {* s' g+ N" h- _        4.7 
2 c. n" f" t9 h7 t+ h5 t        3.89 # o0 S$ z2 _0 _/ W' x5 J* ]2 h
- ^8 T" M6 s# I7 |
! a* R8 H+ @2 k7 G, _) p9 h' g# U

7 B5 Q& T, O. `2 }) }: y! w! m( [( G( e) S8 i2 q" g5 C
H0:该药治疗前后的舒张压无变化,即μd=0
$ {! `3 Y" G, r
! ~. s1 q! U1 e* K7 G! fH1:该药治疗前后的舒张压有变化,即μd≠06 \( H7 [- O6 d* ]8 q
' J7 O9 G, Q3 G+ |
α=0.05# \, V0 u% j2 e% B

* h, ~8 o4 y$ M' y0 U3 q" Z自.由度v=n-1=8,查t界值表得t0.05(8)=2.306,t0.01(8)=3.355,本例t=3.714>t0.01(8),P<0.01,按α=0.05检验水准拒绝H0,接受H1,可认为治疗前后舒张压有变化,即该药有降压作用。5 F: E* ]; x8 ?. Y

$ z- g  o6 n. J* P三、完全随机设计的两样本均数的比较
2 [6 q+ \8 J, Z4 F7 v( e/ O1 ]7 y' _- Y) t( N9 g3 W3 @
亦称成组比较。目的是推断两样本各自代表的总体均数μ1与μ2是否相等。根据样本含量n的大小,分u检验与t检验。& |7 ]1 M) [0 u$ w8 O6 M  H& A
& L: J. y7 H8 h3 O0 k9 y
(一)u检验可用于两样本含量n1、n2、均足够大时,如均大于50或100.
) x/ U4 A& Y1 w+ I0 J9 ^7 _5 l) h" Y- E
公式(19.9)6 J4 P& j, n3 t% L) b6 Q" Q0 n4 W
, M% L6 Y) j" J6 X7 e6 a
算得的统计量为u 值,按表19-3所示关系作出判断。( b4 q$ _- Q2 A; r3 @, E7 K
" W% L9 Y! ^3 s; R8 O
例19.6某地抽样调查了部分健康成 人红细胞数,其中男性360人,均数为4.660×1012/L,标准差为0.575×1012/L;女性255人,均数为4.178×1012/L,标准差为0.291×1012/L,试问该地男、女红细胞数的均数有无差别?! v: L8 L$ K  L  j

( H  g! `; ?: W$ D/ c$ }H0: μ=μ0( R6 L" i* K2 @1 x1 x6 g' |% N& P
9 ]3 x1 I. q! O
H1: μ≠μ0
( M! t' K( X+ n1 B: c: y4 w( ^  R$ f% W2 O% e1 Y  X+ h
α=0.05' ], c$ a9 g6 n( Q2 T# ]

2 f, d1 |, J, x今x1=4.660×1012/L,s1=0.575×1012/L,n1=360;
% s" E( d2 B+ p2 M
$ S5 S. Z' f. X! yx2=4.1781012/L,s2=0.2911012/L,n2=255.
. h5 R0 ~9 w$ M) L8 C
, k1 a- G, F0 s8 B5 d$ W; i4 D' A算得的u=13.63>2.58,P<0.01,按 α=0.05检验水准拒绝H0,接受H1,可认为该地男女红细胞数的均数不同,男性高于女性。  T: k0 k, D8 i  t  ^7 H
! D* z8 B; c4 j" D2 h
(二)t检验可用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐(homoscedasticity)。若被检验的两样本方差相差较大且差别有统计学意义则需用t检验。
# p3 z: j# ^+ c: T% h; }3 r% Q' v# o+ b  u3 [
公式(19.10)6 C2 {  L4 }6 u

+ i; N+ L7 `) Y* O8 A$ b/ d公式(19.11)9 L9 Z8 n+ ~, M  H
% I) X9 i& {0 X
公式(19.12); s! k' X% a, b9 v; Y9 i9 ]
7 G: c5 J. U0 ?: a. x, j
式中sx1-x2,为两样本均数之差的标准误,s2c为合并估计方差(combined estimate variance)。算得的统计量为t,按表19-4所示关系作出判断。3 F" a/ ~3 v' e& F
/ @- `; L) G: M2 q7 g
例19.7某医生统广西瑶族和侗族正常妇女骨盆X线测量资料各50例。骨盆入口前后径:瑶族的均数为12.002(cm),标准差0.948(cm),侗族相应的为11.456(cm)和1.215(cm)。问两族妇女的骨盆入口前后径是否有差别?
2 q: c( i: Q* {# g/ X6 ~0 s+ C$ U. y* r% H! |
H0: μ1=μ2
7 c1 H: X* D# S+ A6 d1 \7 }
! A) J7 [, l8 pH1: μ1≠μ2% V* J1 b5 I* C- p- f* f

/ H! L: f! u: p7 |6 sα=0.05# g, j# l( z; B

' |/ }$ D5 m# p5 ?' B4 n已知n1=n2=50, x1=12.002(cm),s1=0.948(cm);
( R1 [1 f- |  O9 |  q
! V. X  y9 p  l% wx2=11.456(cm),s2=1.215(cm)。
7 v1 _. h' M  c1 v1 e  H5 n, h- k1 R5 A$ C: D5 I0 S7 i
2 E2 f3 f5 D0 G' z

; i* t: N8 R! C; c0 P本例自.由度v =n1+n2-2=98,查t界值表[表内自.由度一栏无98,可用内插法(从略)或用v =100估计].T0.05(100)=1948,t0.01(100)=2.626,今t=2.505>t0.05(1000,P<0.05,按α=0.05检验水准拒绝H0,接受H1,可认为广西瑶族和侗族妇女骨盆入口前后径不同,前者大于后者。6 `& E7 w0 X5 K$ }. j& l
/ |* p! C' r9 M- J* i9 Q
四、完全随机设计的两样本几何均数比较
7 b' f7 D3 b  q1 O% |  x7 @4 l* b9 e
医学上有些资料为等比资料或正态分布资料,宜用几何均数表示其平均水平。比较两样本几何均数的目的是推断它们分别代表的总体几何均数是否相等。此种情况下,应先把原始数据X进行对数变换,用变换后的数据代入式(19.10)、(19.11)、(19.12)计算t值。
/ _& e7 ]2 |- E7 _
  u! s3 {4 k" p! ?6 F例19.8 将20名钩端螺旋体病人的血清随机分为两组,分别用标准株或水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?4 K& ]+ l0 [  ]# K' a8 x
% g5 |; B- C; |
X1:标准株(11人)100,200,400,400,400,400,800,1600,1600,1600,3200. R3 D* n2 ^% z+ h) v+ w5 c3 W4 D
- M7 \1 ~, v7 `" [/ q$ E5 F
X2:水生珠(9人)100,100,100,200,200,200,200,400,4004 _% _' x  N- j1 F" I

1 J! k: }5 w1 e- F/ u4 O( p- Y0 eH0: μ1=μ2* T) _) V  u% L  U4 R: p
9 k1 _9 A; H* v7 `3 U+ R- ]
H1: μ1≠μ27 G. u% P4 n& c" }! L  }0 \
- F# t  [* y0 z/ t! O2 `
α=0.05
2 [' I9 J4 c# |' {( L( L
$ t% l! G8 l% c% w( f5 A将两组数据分别取对数,以对数作为新变量X1和X2.
8 r, x+ O2 j  f& ^$ m
7 k1 n- j+ h& C% j! K5 CX1:2.000,2.301,2.602,2.602,2.602,2.602,2.903,3.204,3.204,3.204,3.5051 m9 k( m. [1 {. q1 m* o8 F
: X* ?, x. x& p5 W3 R
X2: 2.000,2.000,2.000,2.301,2.301,2.301,2.301,2.602,2.602
( p- t7 k- X1 S1 \  n6 u  |9 t- A. C1 N% R: F. O+ P
用变换后的数据计算 x1,s12;x2,s22再代入式(19.10)、(19.11)、(19.12)计算t值。2 f3 r" j3 W, ^4 D& C3 r- F8 L

6 m  J  o2 R/ |( Y8 `$ Qx1=2.794,s12=0.2043;x2=2.268,s22=0.0554
: Y1 a5 [) c4 I0 l, x+ `" o1 c/ D& ?7 g0 y, n4 E
自.由度v=11+9-2=18,查t界值表得t0.01(18)=2.878,今t=3.150>2.878,P<0.01,按α=0.05检验水准拒绝H0,接受H1,可认为两组平均效价不同,标准株高于水生株。- y0 J" C( Z6 |. p

5 y# P- F- E5 ]! T, E: G
( B+ p2 _0 J' w& ^+ j% _/ X! Q5 ahttp://hi.baidu.com/֪ʶ֮��/blog/item/54edcd02c2f4ea23b1351dda.html

TOP

方差分析与两样本T检验区别1 ]% X* F1 \' R6 z& F) X
  r, `. K& R1 M/ K/ ]

* H- C; v! d* d( z! u6 @9 H& J6 t$ g3 [6 b* S8 U, s6 [
9 k; D- D* T! x* X0 Z
0 q. L7 b3 F8 L" r  G" J
方差分析与两样本T检验。
, l: G2 X3 ?1 A8 `
6 z' v/ N- P! ]4 u( V0 N1。首先可以看到方差分析(ANOVA)包含两样本T检验,把两样本T检验作为自己的特例。
6 [$ n/ B4 h* \* w2 N, x因为ANOVA可以比较多个总体的均值,当然包含两个总体作为特例。实际上,T的平方就是F统计量(m个自.由度的T分布之平方恰为自.由度为(1,m)的F 分布。因此,这时候二者检验效果完全相同。T 检验和 ANOVA 检验对于所要求的条件也相同:
$ v' C9 _& l5 Y9 g, S
7 W  c4 }1 }" i0 t3 ~, v' d- i1)各个组的样本数据内部要相互独立,
) X' w0 Z6 M6 e, k2 S' [  k2)各组皆要正态分布
& A) x. t. z4 S8 z; M3)各总体的方差相等。
& d* Y' \3 U! z% y$ J6 U上述这3个条件完全相同。+ E# n- Y5 o$ S8 d/ s& r6 e

2 V" |/ p  v/ g0 ~3 n  v2。如果说要指出差别,则区别仅在下列一点上:
% i4 z0 R% S- {+ s4 w9 I
  h1 J+ V9 n3 S( K用ANOVA检验两总体均值相等性时,只限于这样的双侧检验问题,即:, y4 d! R! m4 }: z7 P% y7 h, E
H0:mu1=MU2 <-> Ha:mu1 not= mu2& {& b8 o  V% }6 B

$ D7 T  O4 ]: N: H" n6 {而两样本的T检验则可以比上述情况更广泛,对立假设可以是下面3种中的任何一种.
. U5 g1 A2 s7 uHa:mu1 > mu2
9 p# r( l0 T/ \# p, Q) n9 sHa:mu1 < mu2- D3 \# W- v  d  x4 k
Ha:mu1 not= mu20 n- o$ ~; c. P( R* l6 d3 r( N9 z0 O
/ y/ A- S' l3 ?/ O
这样说来,两样本均值相等性检验虽然可以用ANOVA做, 但这没有任何好处,反而使得对立假设受到限制,因而还是T检验更好。
. A0 R( ?2 [& D: t0 f( }
2 O0 Y6 `; A& C. j; X" q3 u1 z其他表述:
% t( o8 V$ z- c/ I7 |& b1 `8 Mt检验与方差分析,主要差异在于,t检验一般使用在单样本或双样本的检验,方差分析用于2个样本以上的总体均值的检验.同样,双样本也可以使用方差分析, 多样本也可以使用t检验,不过,t检验只能是所有总体两两检验而已." `) t. w+ g6 n. Z! q/ b
两种方法与样本量没有直接关系,而是与数据的分布有关系,如果数据是正态分布的,那不管是小样本或大样本,利用莱维-林德伯格中心极限定理的原理,都是可以用的,如果数据非正态分布,那只能使用大样本利用李雅普诺夫中心极限定理的原理进行2t检验,此时不能利用方差分析,因为方差分析三个条件之一就是正态分布.
8 M: {$ ]/ T( c3 Z0 s2 h
; v. l7 i# o7 Q3 S  S+ d$ T
  q5 `3 j3 a, \0 J: d$ J9 W. i& K9 C' F7 P9 t, L$ b

  @8 w" E* ?$ C. W1 V0 x+ z$ a0 h. C5 x- W5 B5 c

" o( f' X5 L) d( B1 H! n8 W( Y$ Z1 T( Z1 p; b. p
T 检验及其与方差分析的区别
! \/ A. |$ r; N1 j" s  e! {  U% M- r) u. x' k8 Y; X
假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。0 L- K/ w( S& s  l
$ N/ ~1 [& O4 e8 z: n# a
- X$ Z9 G$ Q0 `1 y* M8 l3 y
t 检验:  j" ~4 n( {0 [& C  F

, z9 k# {& W& X+ P# K1.单因素设计的小样本(n<50)计量资料; @& H# _. P6 D. L4 q
$ j( A% V: q: v" T' q# f" D5 X
2.样本来自正态分布总体3 e: {7 f6 N& }, L9 W3 g3 f
, s  \, K, g6 }1 q, \* K/ [3 d
3.总体标准差未知
* j- x, |% D' E
! ^% m( i" o0 r, b1 d5 X& x4.两样本均数比较时,要求两样本相应的总体方差相等; o+ |" e6 k1 X# F
  r1 M; H6 N+ d* S
• 根据研究设计t检验可由三种形式:% i" T- ]7 V+ L
& E) _! ]- _7 M% ^
– 单个样本的t检验+ Q6 C% C; k! s  C4 p0 ^9 @

! k$ u$ X! w2 g) O9 N– 配对样本均数t检验(非独立两样本均数t检验): |. k1 \. U  z* j) p
. _4 S# n+ e& l! @9 g; W( _
– 两个独立样本均数t检验
# ], {/ j7 G0 V5 y5 U8 }- o
: z: \, b; C8 D# `(1)单个样本t检验
) S$ u! @0 ~% m  ^3 }  D8 z; @/ F; I( T" l8 r
• 又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。

TOP

• 已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。
4 {$ [( S1 k6 l- {2 ?0 W+ c* I' e
! w" S2 t! f! ^7 L3 y• 单样t检验的应用条件是总体标准s未知的小样本资料( 如n<50),且服从正态分布。$ L9 @' @) `- h7 @" e" b0 |( K# H

5 {+ ?& M: @2 X! E' Y6 A% m* G(2)配对样本均数t检验$ k9 b6 R1 }5 t& W% S8 h; t6 U

, k5 p9 H4 }( b* W0 L9 r• 配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。
# y! y  g% {" X' t) I8 q" s! b
• 配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
; j' `8 U/ W, S; k
6 `$ F; K3 l+ \7 ?• 应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。
( m' E  G* ?3 E) ?0 u7 c; w, Q8 _9 I
. x" u: @, H9 l6 r8 R( i  `7 M4 A• 配对设计处理分配方式主要有三种情况:
7 Y5 P4 ~3 o/ e& q
0 s4 U) ?' B! x) N①两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;( I0 n0 Z5 f1 G( u  R
: _9 H) a7 {$ w
②同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料;0 M' D7 h' [) T4 j$ Z2 S6 k

& o* \" R# ^, t% I! c; M0 w" X7 T+ [③自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。4 R; Z4 c, w+ M) Q8 M

9 F& @0 N3 [8 U(3)两独立样本t检验
9 W2 S2 K& P, K$ _2 V' m1 J- X3 H
" Q1 ]4 \: w% P$ ~9 @- L两独立样本t 检验(two independent samples t-test),又称成组 t 检验。
1 ?! P; y! i, ]: A9 o; A2 G8 U3 k1 A% }( T: {
• 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。4 S5 u5 z8 s* U: Y9 S
  y2 O# d9 L8 w7 W
• 完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。
8 ]% H# I5 S* o# `. t/ Y
! m4 W4 d! O) n! b/ O0 R! ?0 {; G• 两独立样本t检验要求两样本所代表的总体服从正态分布N(μ1,σ12)和N(μ2,σ22),且两总体方差σ12、σ22相等,即方差齐性(homogeneity of variance, homoscedasticity)。
) t; B' j8 Z) V, w! C% _# M- t2 F  d7 J. z2 ~& G9 Y4 l/ U
• 若两总体方差不等,即方差不齐,可采用t’检验,或进行变量变换,或用秩和检验方法处理。
* l* V# e! n1 E4 s3 {' n+ c: B+ }' z5 I" t# P$ I: R
t 检验中的注意事项& O$ W8 k* F, T" i# @# y- g1 t+ W

5 Y1 o5 b$ S7 g$ \' I2 K/ J# ^1. 假设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。6 P4 j6 Q& P9 J& b7 c8 N
  Q- Y2 K4 @) n% h9 x2 i  ]
2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。
  L& q$ W  }) i. F! ^2 I7 f& b8 f4 u3 f8 U/ C. ?, s
3. 双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的t值计算过程相同,只是t界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。
- s- n& W* m1 L; x( G) |9 c% e1 `
/ B0 c6 s& b/ ^/ ~2 J4. 假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,最好列出概率 P 的确切数值或给出P值的范围,如写成0.02<P<0.05,同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较。当 P接近临界值时,下结论应慎重。
5 k3 M* ~. m2 j2 e4 X* {; I) f' M  E, |  u. p' R
5.正确理解P值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝H0。因此,只能说明统计学意义的“显著” 。
! u) G' H  ~8 \, V0 f8 v" u  w2 f9 T: S7 N1 O
6.假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所在的范围,两者既有联系又有区别。

TOP

T检验属于均值分析,它是用来检验两类母体均值是否相等。均值分析是来考察不同样本之间是否存在差异,而方差分析则是评估不同样本之间的差异是否由某个因素起主要作用。
; Z1 P1 O) T4 @6 C
1 W3 A0 Z- t5 s8 `
. z1 \& F: Q" x9 p3 F% M4 QT检验及其与方差分析的区别! L7 }2 I$ F7 M9 y

5 b' q) x. |' C3 _. c
/ y2 `1 t" x: f$ ?; _假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。
, O: F$ X( a7 i
. h1 m2 I5 M0 O4 B$ i' y2 E% O; E4 A* i7 N0 S4 `
t 检验:( R2 R7 p) r1 m( c4 p+ b% o
; Y9 _% W: g& N5 ?
1.单因素设计的小样本(n<50)计量资料
6 N* E2 u4 a3 K* k/ I5 p) d0 V5 _" l' ]$ W8 S+ ]
2.样本来自正态分布总体- |2 I1 b: y& a* E6 N2 }3 H

) N  g, Y/ `* ]3 t5 D+ w3.总体标准差未知3 x: N' v$ P. f! _! m3 G- O

. V6 X. j* r0 E) j" S' ~0 l4.两样本均数比较时,要求两样本相应的总体方差相等1 m$ u& a6 P8 Z8 A

0 [3 j% `) x4 G. }- q' j• 根据研究设计t检验可由三种形式:
. P, Q4 s+ j. V* u
9 |3 m1 A+ P% {. S- q2 z0 E– 单个样本的t检验
" Z) V* `* t! c  Y0 `; _7 v& @" W3 _- E  l) i  |7 G  |
– 配对样本均数t检验(非独立两样本均数t检验)7 C# W1 w' H! E# g

+ {# o3 w( E4 c8 `  K9 s9 V7 b– 两个独立样本均数t检验
: Z6 D: \& z/ s! u
" @$ y) e9 F# o; b(1)单个样本t检验
# r7 n/ M" ^- u# B% T4 U% f! m  V1 ]( I. O& z; B
• 又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。. k' m' f. k( ~9 s5 Q8 }+ D
. H+ d# q  N/ e7 \9 t) P$ D
• 已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。
0 D* c0 C+ c, B9 l: P) }! A  z6 F! X/ |5 n! s1 b
• 单样t检验的应用条件是总体标准s未知的小样本资料( 如n<50),且服从正态分布。
, ?/ l$ `, H- V$ [( m* i3 i/ Z7 N. a$ D# D6 b# Y* F4 N1 k
(2)配对样本均数t检验
- s9 b# H% \( F, H* s+ O7 B9 `' }; {8 |
• 配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。: ?$ m) q. c- p5 ?
: |4 r% r& e  m3 w% n  U9 H$ Z
• 配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
: |* C6 }# b2 ]1 x# k$ p
+ w( |' [% t: i5 Z7 [• 应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。
1 f4 I8 H* U/ Z, B6 G/ e7 E# m+ W1 f2 O7 W, [, I' j9 a
• 配对设计处理分配方式主要有三种情况:
# i; W, Z; ^$ K5 P* k! c& Y% K% w& e( }2 f) b! a$ |  I. i
①两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;
2 g. R& t  J! N: c3 v: b+ l5 b1 S6 A
②同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料;3 R9 d8 p6 ~% \8 V* S9 J; _2 c' W
$ G( z4 B6 P. I+ Z+ P
③自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。
/ K+ O# g& r8 n3 P% S- P4 U. }$ y) o: q1 v# K# J
(3)两独立样本t检验  L8 i1 X( S% S4 t" \
! K+ B  U# H, `2 a4 q
两独立样本t 检验(two independent samples t-test),又称成组 t 检验。
$ c8 i2 s2 m: d) Q' l+ d2 j; x/ J& O) K# q# |4 q4 {3 X2 g
• 适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。

TOP

• 完全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的处理,分析比较处理的效应。或分别从不同总体中随机抽样进行研究。0 e- o+ \1 R* B6 u# l! O* W1 i1 D

+ y- `& Y3 B0 X( F. a• 两独立样本t检验要求两样本所代表的总体服从正态分布N(μ1,σ12)和N(μ2,σ22),且两总体方差σ12、σ22相等,即方差齐性(homogeneity of variance, homoscedasticity)。7 _( Z4 R( f# a

% o, \3 ]0 f1 G3 s• 若两总体方差不等,即方差不齐,可采用t’检验,或进行变量变换,或用秩和检验方法处理。" i  p6 A5 @/ G7 l

/ ~9 J+ b$ d1 `( H  P8 O# at 检验中的注意事项
$ D0 ?3 c  @0 q! a1 [/ T# K
" |0 F* l3 Y* K8 p6 Y8 g1. 假设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。" f, J# y/ Y, ]2 [+ S  [: q% l
! w; O  S- q8 |% J& G6 W5 L
2. 检验方法的选用及其适用条件,应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。 t 检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。1 \- O( N. i. s' q' v, b) U
0 m4 T5 E, r: N5 c
3. 双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的t值计算过程相同,只是t界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。2 }$ _# c. R# _: Q
8 j+ `0 u8 H) I% [
4. 假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,最好列出概率 P 的确切数值或给出P值的范围,如写成0.02<P<0.05,同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较。当 P接近临界值时,下结论应慎重。
8 f/ k7 U$ C/ [  g+ r5 s' o% z. r8 F; _5 ^2 C. @
5.正确理解P值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝H0。因此,只能说明统计学意义的“显著” 。
: W: e& e- |2 B. V- V4 s
# |/ ]5 t) m5 h- [8 u$ f1 K) r6.假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所在的范围,两者既有联系又有区别。
& B6 F: g/ k. `/ H) d
5 D3 Z0 E+ Q" t' o; o# Y, k( P, E9 {) m3 W9 y. w% N
T检验属于均值分析,它是用来检验两类母体均值是否相等。均值分析是来考察不同样本之间是否存在差异,而方差分析则是评估不同样本之间的差异是否由某个因素起主要作用。
3 y4 T9 R3 Z% W$ |9 Y( i7 Y
5 ]2 s! ~) e3 ^, E/ A! c- h7 ~0 a6 @+ q) m( t. |& U8 A7 J* P
t检验:是假设检验的一种常用方法,当方差未知时,可以用来检验一个正态总体或两个正态总体的均值检验假设问题,也可以用来检验成对数据的均值假设问题。具体内容可以参考《概率论与数理统计》。可以用来判断两组数倨差异是否有显著意义,也就是结果有没有统计学意义。- d- y9 K, N* R) d' B* U
  i: E* I0 _- X- v. D
% `  b& t# B6 Y4 `

' H) }: t# s0 b: O# c* l( k2 S9 f7 V8 B: M- J; N
方差分析:它是处理实验研究资料时重要的分析方法之一,代表数据是否具有统计意义,7 H( n7 \) Q; B7 |0 y# A* H
+ G! F5 g. k! ~% z% q# t* ~

5 r2 s7 x4 u2 \; E% G: S) r6 F一般一组数据代表某个条件或因素,方差分析可以判断你选取的这个因素是否有意义,是不是影响因素
. b  x; l" z0 U+ d: O
* u# q+ b6 E; n! n+ J
7 @* j0 E9 T, ]% ]如果你做统计为了找到事物相关性,而方差结果显示数据无统计学差异,很可能代表实验失败或设计有问题; n; t  M5 {6 Z- e& ?2 X* k  V* b
, i9 E2 ?% `, d2 U$ v# f
在对均值进行假设检验时,一般有两种参数检验方法,即t检验与方差分析。t检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k水平设计(k≥3)和多因素设计的定量资料的均值检验场合。应当进一步说明的是,方差分析有十几种,不同的方差分析取决于不同的设计类型。很多人习惯于用t检验取代一切方差分析。
% g3 F+ G! P* @
/ e) @  N- p( R" L0 |# N不能用t检验取代方差分析的情况8 I9 M+ w# U& E
- F; G. l! E* X1 ~
①单因素k(k≥3)水平设计时的情形。为了便于理解,举例说明。
! @* p5 r- _. T7 l" n& e! ~4 T! |. n# o0 S
[实例]研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随机均分为4组,每组10只,雌雄各半,用药15d后测定E-玫瑰结成率(%),结果如下,试比较各组总体均值之

TOP

间的差别有无显著性意义?' n% K" b% O3 g. k0 u5 m8 P3 Q
对照组: 14 10 12 16 13 14 12 10 13 9
/ \3 }! e8 X+ {7 m9 ^党参组: 21 24 18 17 22 19 18 23 20 18
0 T' h6 E7 f, {1 u% L. Y& X& u1 p黄芪组: 24 20 22 18 17 21 18 22 19 23) C( I$ B9 P3 H
淫羊藿组: 35 27 23 29 31 40 35 30 28 366 h8 y2 e7 Y" |
处理本例资料,通常人们错误的做法是,重复运用成组设计资料的t检验对4个组的均值进行6次两两比较;而正确的做法是,先进行单因素4水平设计资料的方差分析,若4个总体均值之间的差别有显著性意义,再用q检验等方法进行多个均值之间的两两比较。下面将从多个方面来说明上述两种分析方法之间的差异(表1)。
" [+ T& ~  T; ~
, X* U4 j" D" m4 L. D: S! G' D表1 用t检验与方差分析处理[实例]资料的区别5 C/ ^1 M" [- t) `% Z$ j& |7 H6 z

4 y8 j/ X4 m+ D: |比较的内容 资料的利用率 对原实验设计的影响 犯假阳性错误的概率结论的可靠性
% T/ i/ g- a" `: ]7 _
# t& L( w$ y. b9 q/ s5 K, N3 Ut检验 低: 每次仅用两组 残:割裂了整体设计 大:1-(1-0.05)6 = 0.265 低:统计量的自.由度小(υ=18)
& B4 x0 D: E+ _) r. N6 J  s" e# g: l" T* `
方差分析加q检验 高:每次要用全部数据 全:与原实验设计相呼应 小:0.05(假定α=0.05)高:统计量的自.由度大(υ=36)7 M- Q" e4 _1 k" ?

& z$ b6 f# k% w% X) a" J1 O注:自.由度大,所对应的统计量的可靠性就高,它相当于“权重”,也类似于产生“代表”的基数,基数越大,所选出的“代表”就越具有权威性。
( y  A  i9 Z' e# j% m: S
7 q  D  T5 z# o) a6 F; Q/ S+ e0 i7 m& c
②多因素设计时的情形。为了便于理解,仍举例说明(表2)。
" F5 C- t1 E, V1 k7 F- h: W( D5 U; R
表2 注射氯化锂或烟碱后不同时间大鼠体温的下降值$ _, K1 j2 k) j& m4 e

7 T# c" ~7 }. D; r$ E/ V; B使用氯化锂与否 使用烟碱与否 第二次注射后不同时间体温下降值(摄氏度). j, {; _  m  I3 {, n$ _& f

2 }, B; q8 u" _( z% J: i# |* Z2 h0.7 1.5 3 5% K; j0 ~$ o4 e# ?+ b. B9 |8 Q

& q: b5 o' X& P# V+ |- Q$ c—- —- 0.0±0.4 0.2±0.5 0.1±0.4 0.3±0.5
3 r  |; R# P) N' j' p$ B# ]
" o* ^6 M0 `" K0 B5 _( B& r# `8 L+ —- 0.7±0.5 0.1±0.5 0.1±0.6 0.2±0.5' C4 x; Z. ~$ V" L! e" B. ?8 s

$ G6 o# z9 F: e; l8 C+ h$ C—- + 1.2±0.8 0.1±0.6 0.4±0.5 0.4±0.32 `9 ~. Q7 q& k! j$ x. e
1 a5 z, [2 B9 [
+ + 1.7±0.6 0.7±0.6 0.3±0.6 0.1±0.5

TOP

显然,表2中涉及到的3个实验因素(即”使用氯化锂与否”、“使用烟碱与否”、“药物在体内作用时间”)。这些因素之间一般都存在不同程度的交互作用,应当选用与设计类型(本例为具有一个重复测量的三因素设计)相对应的方差分析方法。然而,对于处置复杂的实验设计问题,人们常犯的错误是在;其一,将多因素各水平的不同组合(本例中* *共有16种不同的组合,相当于16种不同的实验条件)、简单地看作单因素的多个水平(即视为单因素16水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t检验进行两两比较。误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。
8 [. u& ~& a" P# e$ n" U
+ m( e  o7 m: e
5 A- L/ L: F, ^' H" ^$ K2 {! Z) a
答:t检验适用于两个变量均数间的差异检验,多于两个变量间的均数比较要用方差分析。用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。  若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。  值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。  t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。
! x8 z. k* E# R7 m" h1 L
9 [) ~6 ~, H0 k7 d# d
) D  {5 U0 ~' I( v' [- d$ G1 p) r8 v! P$ D. e  e8 u0 d" R
, f2 _) o) Z$ R4 Z7 R( E/ v
/ z- `, N( M- _1 d7 ]/ j" Q% p
u检验
  ], l8 x+ K1 X  }2 V5 N
* @6 A! d$ ]& P1 c3 \; E! G) C(u test)以服从u分布的统计量检验统计假设的方法。①均值μ的检验。 一个正态总体: 当σ0:μ=μ0 2-σ2已知时,用检验统计量:其中,μ0、σ02为已知正态总体的均值与方差,X为样本平均数,n为样本含量。当总体分布未知但样本含量较大时,用检验统计量: 两个正态总体: H0:μ1=μ 2 当两个总体方差σ12、 σ22已知时,用检验统计量:当总体分布未知但样本含量较大时,用检验统计量: ②总体率π的检验(适用于大样本)。 一个总体:H0 : π = π0用检验统计量:两个总体:H0:π1=π2用检验统计量:其中,为两样本率的加权平均数,m1、m2分别为两样本中某事件出现的频数。 u检验的判断结论:对给定的显著性水平α,查正态分布表,当α=0.05、0.01时,临界值分别为1.96、2.58。当|u|<1.96时,P>0.05,不拒绝H0,差异不具显著性;当1.96≤|u|≤2.58时,P≤0.05,拒绝H0,差异具显著性;当| u | ≥2. 58时,P≤0.01,拒绝H0,差异具高度显著性。只要u检验的条件满足,如正态总体σ02已知或是大样本,都可使用该方法,如某一运动队通过一段时间的训练后成绩是否有所提高,可以进行u检验。
/ d. L; `8 m$ x. b5 g1 ]" w4 V$ b# `2 N
! ?7 K- T' E8 P! t+ E6 O2 r2 r5 {: l' l# C. X
5 C0 }/ l, v% o# `
皮尔逊x2检验和卡方检验一样吗?/ A8 K5 W# ?2 X, {) \

, W4 Z7 [, ?, S, J& g3 K" y& t  \皮尔逊x2检验是检验实际频数和理论频数是否较为接近,统计学家卡尔?皮尔逊1900年提出了如下检验统计量:X^2=∑{【(实际频数-理论频数的)^2】/理论频数}
7 D( O5 r" l/ Q" c( h. ^0 L它近似服从自.由度为V =组格数-估计参数个数-1 的 分布。式中, n 是样本量,理论频数是由样本量乘以由理论分布确定的组格概率计算的。求和项数为组格数目。
5 V3 d5 f  _, j5 A皮尔逊 统计量的直观意义十分显然: 是各组格的实际观测频数与理论期望频数
9 u8 c8 |* _9 E, T3 i/ {& B. V的相对平方偏差的总和,若 值充分大,则应认为样本提供了理论分布与统计分布不同的& P7 b5 ]' h8 M" g* b9 U% V$ w+ `
显著证据,即假设的总体分布与总体的实际分布不符,从而应否定所假定的理论分布。所以,
# R2 y- F. k% W+ C8 w应当在 分布密度曲线图的右尾部建立拒绝域。
9 [) Z- M0 i' J! T4 c卡方检验有很多种,跟他们叫卡方检验是因为构造的统计量服从或近似服从卡方分布,然后再根据卡方分布建立检验规则,比如检验正态总体方差的是否为某定值的卡方检验构造的统计量是那样的~~这个统计量服从n-1的卡方分布,,所以这个检验也叫卡方检验。+ e2 x8 m% O5 W" Y9 J7 C) U: p
T检验- R9 z3 _9 X4 |" w5 G; [* h

- i: n9 ~. s* x0 R' Y, M6 c4 W! P7 r- |8 M) T
" B9 W! ^/ F" f* `9 O# T
0 |* A8 C2 O" v3 S" x
(T Test)- U+ P: w1 h+ ^7 B

9 I% z4 h. Y+ L# R什么是T检验

TOP

 14 12
发新话题