Ви не кажете, що таке інша книга статистики, але я б припустив, що це книга (або розділ) про кінцевий вибірки населення .
Коли ви відбираєте вибіркові випадкові величини, тобто коли ви вважаєте множину
з n випадкових величин, ви знаєте, що якщо вони незалежні, f ( x 1 , … , x n ) = f ( x 1 ) ⋯ f ( x n ) і однаково розподілені , зокрема E ( X i ) = μ та Var ( X i )X1,…,Xnnf(x1,…,xn)=f(x1)⋯f(xn)Е( Xi) = μ для всіх i , то:
¯ X = ∑ i X iВар ( Xi) = σ2i
деσ2- другий центральний момент.
Х¯¯¯¯= ∑iХiн,Е( X¯¯¯¯) = μ ,Вар ( X¯¯¯¯) = σ2н
σ2
Вибірка кінцевої сукупності дещо відрізняється. Якщо популяція має розмір , у вибірці без заміни є ( NN можливі зразкиsiрозміруnі вони є однозначними:
p(si)=1( Nн)сin
Наприклад, якщоN=5іn=3, простір вибірки дорівнює{s1,…,s10},
а можливі вибірки:
s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4
p(si)=1(Nn)∀i=1,…,(Nn)
N=5n=3{s1,…,s10}
Якщо порахувати кількість випадків у кожної людини, ви можете бачити, що їх шість, тобто кожна людина має рівний ланцюг вибору (6/10). Отже, кожне
siє випадковою вибіркою згідно з другим визначенням. Приблизно, це не iid випадкова вибірка, оскільки індивіди не є випадковими змінними: ви можете послідовно оцінювати
E[X]за середньою вибіркою, але ніколи не дізнаєтесь його точне значення, але ви
можетезнати точну середню сукупність, якщо
n=N(нехай повторюю: приблизно.)
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
siE[X]n=N1
μn<Nμ
y¯¯¯s=∑i=1nyi,E(y¯¯¯s)=μ
Var(y¯¯¯s)=σ~2n(1−nN)
σ~2∑Ni=1(yi−y¯¯¯)2N−1.
Factor
(1−n/N) is usally called "
finite population correction factor".
This is a quick example of how a (random variable) i.i.d. random sample and a
(finite population) random sample may differ. Statistical
inference is mainly about
random variable sampling, sampling
theory is about finite
population sampling.
1 Say you are manufacturing light bulbs and wish to know their average life
span. Your "population" is just a theoretical or virtual one, at least if you
keep manufacturing light bulbs. So you have to model a data generation
process and intepret a set of light bulbs as a (random variable) sample. Say
now that you find a box of 1000 light bulbs and wish to know their average
life span. You can select a small set of light bulbs (a finite population
sample), but you could select all of them. If you select a small sample, this
doesn't transform light bulbs into random variables: the random variable is
generated by you, as the choice between "all" and "a small set" is up to
you. However, when a finite population is very large (say your country
population), when choosing "all" is not viable, the second situation is better
handled as the first one.