Швидка відповідь
Причина полягає в тому, що, якщо припустити, що дані iid і Хi∼ N( μ , σ2) , і визначають
Х¯S2==∑NХiN∑N( X¯- Xi)2N- 1
при формуванні довірчих інтервалів розподіл вибірки, пов'язаний з дисперсією вибірки (
S2, пам'ятайте, випадкова величина!) - розподіл chi-квадрата (
S2( N- 1 ) / σ2∼ χ2n - 1) так само, як розподіл вибірки, пов'язаний із середньою вибіркою, є стандартним нормальним розподілом (
( X¯- μ ) n--√/ σ∼ Z( 0 , 1 )), коли ви знаєте дисперсію, а з t-студентом, коли ви цього не робите (
(X¯- мк )n−−√/S∼Tn - 1 ).
Довга відповідь
Перш за все, ми доведемо, що слідує за розподілом chi-квадрата з N - 1 ступенем свободи. Після цього ми побачимо, наскільки цей доказ корисний при виведенні довірчих інтервалів для дисперсії та як з'являється розподіл chi-квадрата (і чому він такий корисний!). Давайте почнемо.S2( N- 1 ) / σ2N- 1
Доказ
Для цього, можливо, ви повинні звикнути до розподілу хі-квадратів у цій статті Вікіпедії . Цей розподіл має лише один параметр: ступеня свободи, , і, мабуть, має функцію, що генерує момент (MGF), задану:
m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 .
Якщо ми можемо показати, що розподіл S 2 ( N - 1 ) / σ 2 має функцію породження моменту, як ця, але при ν =ν
mχ2ν(t)=(1−2t)−ν/2.
S2(N−1)/σ2 , то ми показали, що
S 2 ( N - 1 ) / σ 2 слідує за розподілом chi-квадрата з
N - 1 ступенями свободи. Для того, щоб показати це, зверніть увагу на два факти:
ν=N−1S2(N−1)/σ2N−1
Якщо визначимо,
деZi∼N(0,1), тобто стандартних нормальних випадкових величин, функція генерації моментуYзадається
m Y (t)
Y=∑(Xi−X¯)2σ2=∑Z2i,
Zi∼ N( 0 , 1 )Y
MGFZ2задається
m Z 2 ( t )mY(t)===E[etY]E[etZ21]×E[etZ22]×...E[etZ2N]mZ2i(t)×mZ22(t)×...mZ2N(t).
Z2
де використовували PDF стандартного нормального,F(г)=е- г 2 / 2/√mZ2(t)==∫∞−∞f(z)exp(tz2)dz(1−2t)−1/2,
і, отже,
mY(t)=(1-2t) - N / 2 , з
чоговипливає, щоYслідує за розподілом чі-квадрата зNступенями свободи.f(z)=e−z2/2/2π−−√mY(t)=(1−2t)−N/2,
YN
Y1Y2ν1ν2W=Y1+Y2ν1+ν2W
N−1
( N- 1 ) S2= - n ( X¯- μ ) + ∑ ( Xi- мк )2,
σ2( N- 1 ) S2σ2+ ( X¯- мк )2σ2/ Н=∑(Xi−μ)2σ2.
NS2(N−1)/σ2N−1
Розрахунок інтервалу довіри для дисперсії.
L1L2
P(L1≤σ2≤L2)=1−α.
S2(N−1)L1S2(N−1)≤σ2S2(N−1)≤L2S2(N−1).
S2(N−1)/σ2N−1L1S2(N−1)≤σ2S2(N−1)σ2S2(N−1)≤L2S2(N−1)⇒⇒S2(N−1)σ2≤S2(N−1)L1,S2(N−1)L2≤S2(N−1)σ2,
P(S2(N−1)L2≤S2(N−1)σ2≤S2(N−1)L1)=1−α.
S2(N−1)/σ2∼χ2(N−1)∫N−1S2(N−1)L2pχ2(x)dx∫S2(N−1)L1N−1pχ2(x)dx==(1−α)/2 ,(1−α)/2
N−1N−1N−1∫S2(N−1)L20pχ2(x)dx=α/2,∫∞S2(N−1)L1pχ2(x)dx=α/2.
Calling
χ2α/2=S2(N−1)L2 and
χ21−α/2=S2(N−1)L1, where the values
χ2α/2 and
χ21−α/2 can be found in chi-square tables (in computers mainly!) and solving for
L1 and
L2,
L1L2==S2(N−1)χ21−α/2,S2(N−1)χ2α/2.
Hence, your confidence interval for the variance is
C.I.=(S2(N−1)χ21−α/2,S2(N−1)χ2α/2).