充分统计量
内容来源
数理统计学导论(原书第7版) 机械工业出版社
贝叶斯统计(第二版)中国统计出版社
充分统计量
统计量
统计量是数据简化的一种形式 Y = u ( X 1 , X 2 , ⋯ , X n ) Y=u(X_1,X_2,\cdots,X_n) Y=u(X1,X2,⋯,Xn)
例如为了阐述方便,不列出所有个体观测值 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn ,仅给出样本均值 X ‾ \overline{X} X 或样本方差 S 2 S^2 S2
分割样本空间
假定 x ‾ = 8.32 \overline{x}=8.32 x=8.32 ,样本空间中许多点都具有一样的均值 8.32 8.32 8.32 ,它们构成超平面
x 1 + x 2 + ⋯ + x n = 8.32 n x_1+x_2+\cdots+x_n=8.32n x1+x2+⋯+xn=8.32n
这个超平面是一个集合。而且, X ‾ \overline{X} X 可取的值非常多,因而存在众多这类集合。
在这个意义上,任何统计量 Y = u ( X 1 , X 2 , ⋯ , X n ) Y=u(X_1,X_2,\cdots,X_n) Y=u(X1,X2,⋯,Xn) 均把样本空间分成集合族
定义
设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 表示来自分布函数 f ( x ; θ ) f(x;\theta) f(x;θ) 的样本量为 n n n 的随机样本
设 Y 1 = u 1 ( X 1 , X 2 , ⋯ , X n ) Y_1=u_1(X_1,X_2,\cdots,X_n) Y1=u1(X1,X2,⋯,Xn) 是一个统计量,它的分布函数为 f Y 1 ( y 1 ; θ ) f_{Y_1}(y_1;\theta) fY1(y1;θ)
Y 1 Y_1 Y1 是 θ \theta θ 的充分统计量的充要条件为
f ( x 1 , x 2 , ⋯ , x n ; θ ) f Y 1 [ u 1 ( x 1 , x 2 , ⋯ , x n ) ; θ ] = H ( x 1 , x 2 , ⋯ , x n ) \frac{f(x_1,x_2,\cdots,x_n;\theta)} {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]} =H(x_1,x_2,\cdots,x_n) fY1[u1(x1,x2,⋯,xn);θ]f(x1,x2,⋯,xn;θ)=H(x1,x2,⋯,xn)
就是统计量确定时,样本的条件分布与 θ \theta θ 无关
在某种意义上,充分统计量用尽了样本中关于参数的信息
例
设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 表示来自下述分布的一个随机样本
f ( x ; θ ) = { θ x ( 1 − θ ) 1 − x , x = 0 , 1 ; 0 < θ < 1 0 , 其他 f(x;\theta)= \begin{cases} \theta^x(1-\theta)^{1-x}&,x=0,1;0<\theta<1\\ 0&,其他 \end{cases} f(x;θ)={θx(1−θ)1−x0,x=0,1;0<θ<1,其他
统计量 Y 1 = ( X 1 + X 2 + ⋯ + X n ) Y_1=(X_1+X_2+\cdots+X_n) Y1=(X1+X2+⋯+Xn) 的 p m f pmf pmf
f Y 1 ( y 1 ; θ ) = { ( n y 1 ) θ y 1 ( 1 − θ ) n − y 1 , y 1 = 0 , 1 , ⋯ , n 0 , 其他 f_{Y_1}(y_1;\theta)= \begin{cases} \left(\begin{matrix} n\\y_1 \end{matrix}\right) \theta^{y_1}(1-\theta)^{n-y_1}&,y_1=0,1,\cdots,n\\ 0&,其他 \end{cases} fY1(y1;θ)=⎩ ⎨ ⎧(ny1)θy1(1−θ)n−y10,y1=0,1,⋯,n,其他
对应的条件分布为
θ x 1 ( 1 − θ ) 1 − x 1 θ x 2 ( 1 − θ ) 1 − x 2 ⋯ θ x n ( 1 − θ ) 1 − x n ( n y 1 ) θ y 1 ( 1 − θ ) n − y 1 \frac{\theta^{x_1}(1-\theta)^{1-{x_1}}\theta^{x_2}(1-\theta)^{1-{x_2}}\cdots \theta^{x_n}(1-\theta)^{1-{x_n}}} {\left(\begin{matrix} n\\y_1 \end{matrix}\right) \theta^{y_1}(1-\theta)^{n-y_1}} (ny1)θy1(1−θ)n−y1θx1(1−θ)1−x1θx2(1−θ)1−x2⋯θxn(1−θ)1−xn
θ ∑ x i ( 1 − θ ) n − ∑ x i ( n ∑ x i ) θ ∑ x i ( 1 − θ ) n − ∑ x i \frac{\theta^{\sum x_i}(1-\theta)^{n-{\sum x_i}}} { \left(\begin{matrix} n\\\sum x_i \end{matrix}\right) \theta^{\sum x_i}(1-\theta)^{n-\sum x_i} } (n∑xi)θ∑xi(1−θ)n−∑xiθ∑xi(1−θ)n−∑xi
1 ( n ∑ x i ) \frac{1}{\left(\begin{matrix} n\\\sum x_i \end{matrix}\right)} (n∑xi)1
由于 y 1 y_1 y1 等于 n n n 次独立实验中 1 1 1 的个数,所以这是选择 y 1 y_1 y1 个 1 1 1 与 n − y 1 n-y_1 n−y1 个 0 0 0 的一个特殊排列的条件概率,此条件概率不依赖 θ \theta θ 的值