Це історія про ступінь свободи та статистичні параметри і чому приємно, що вони мають прямий простий зв'язок.
Історично склалося, що терміни " " з'явилися в дослідженнях функції Бета Ейлера. Він використовував цю параметризацію до 1763 року, так само і Адрієн-Марі Легендр: їх використання встановило наступну математичну конвенцію. Ця робота анулює всі відомі статистичні програми.−1
Сучасна математична теорія дає достатньо свідчень, завдяки багатству застосувань в аналізі, теорії чисел та геометрії, що терміни " " насправді мають певне значення. Деякі з цих причин я промальовував у коментарях до цього питання.−1
Більш цікавим є те, якою повинна бути "правильна" статистична параметризація. Це не так однозначно, і це не повинно бути таким же, як математичне умовлення. Існує величезна мережа поширених, добре відомих, взаємопов'язаних сімей розподілу ймовірностей. Таким чином, конвенції, які використовуються для імені (тобто параметризації) однієї сім'ї, зазвичай мають на увазі споріднені конвенції для імені споріднених сімей. Змініть одну параметризацію, і ви захочете змінити їх усі. Тому ми можемо розглянути ці стосунки для підказки.
Мало хто погодився б із тим, що найважливіші сім'ї розподілу походять із сім'ї Нормальних. Нагадаємо, що випадкова величина як кажуть, "нормально розподілена", коли має щільність ймовірності пропорційну . Коли і , як кажуть, має стандартне нормальне розподіл.( Х - μ ) / σ е ( х ) ехр ( - х 2 / 2 ) σ = 1 μ = 0 ХX(X−μ)/σf(x)exp(−x2/2)σ=1μ=0X
Багато наборів даних вивчаються за допомогою відносно простої статистики, що включає раціональні комбінації даних та низькі потужності (зазвичай квадрати). Коли ці дані моделюються як випадкові вибірки з нормального розподілу - так що кожен розглядається як реалізація нормальної змінної , всі мають спільний розподіл і є незалежними - розподіли цих статистичних даних визначаються що нормальне розподіл. Ті, що найчастіше виникають на практиці, цеx i X i X ix1,x2,…,xnxiXiXi
t ν = n - 1 t = ˉ Xtν , Студентське розподілt з "ступенів свободи" . Це розподіл статистики ім'я де моделює середнє значення даних і - це стандартна похибка середнього значення. Ділення на показує, що повинно бути або більше, звідки - ціле числоν=n−1ˉ X =(X1+X2+⋯+Xn)/nse(X)=(1/√
t=X¯se(X)
X¯=(X1+X2+⋯+Xn)/nn-1n2ν1se(X)=(1/n−−√)(X21+X22+⋯+X2n)/(n−1)−X¯2−−−−−−−−−−−−−−−−−−−−−−−−−−−−√n−1n2ν1або більше. Формула, хоча і, мабуть, трохи складна, є квадратним коренем раціональної функції даних другого ступеня: вона відносно проста.
χ 2 ν ν χ 2 1 / ν χ 2χ2ν , розподіл (chi-квадрат)χ2 з "ступенем свободи" (df). Це розподіл суми квадратів незалежних стандартних звичайних змінних. Таким чином, розподіл середнього квадрату цих змінних буде розподілом масштабованим на : я буду називати це "нормалізованим" розподілом.ννχ21/νχ2
F ( ν 1 , ν 2 ) χ 2 ν 1 ν 2Fν1,ν2 , розподіл відносини з параметрами являє собою відношення двох незалежних нормалізується розподілів з і ступенів свободи.F(ν1,ν2)χ2ν1ν2
Математичні розрахунки показують, що всі три ці розподіли мають щільність. Важливо, що щільність розподілу пропорційна інтегралу в інтегральному визначенні Ейлера функції Гамма ( ). Порівняємо їх: Γχ2νΓ
fχ2ν(2x)∝xν/2−1e−x;fΓ(ν)(x)∝xν−1e−x.
Це показує, що двічі змінна має розподіл Gamma з параметром . Коефіцієнт половини є досить набридливим, але віднімання зробить відносини набагато гіршими. Це вже дає переконливу відповідь на питання: якщо ми хочемо, щоб параметр розподілу підрахував кількість квадратних нормальних змінних, які його виробляють (до коефіцієнта ), то показник у його щільності функція повинна бути однією меншою, ніж половина від кількості. , N , / 2 1 χ 2 1 / 2χ2νν/21χ21/2
Чому коефіцієнт менш клопітний, ніж різниця ? Причина полягає в тому, що фактор залишатиметься послідовним, коли ми додаємо речі. Якщо сума квадратів незалежних стандартних норм пропорційна розподілу гамми з параметром (разів на деякий коефіцієнт), то сума квадратів незалежних стандартних норм пропорційна гамма-розподілу з параметром (в рази однаковий коефіцієнт) , звідки сума квадратів усіх змінних пропорційна розподілу Gamma з параметром (все одно разів однаковий коефіцієнт). 1 н н м м п + т т + п1/21nnmmn+mm+nТой факт, що додавання параметрів настільки тісно імітує додавання рахунків, є дуже корисним.
Якби ми, мабуть, видалили цей примхливий " " з математичних формул, ці приємні стосунки стали б складнішими. Наприклад, якщо ми змінили параметризацію гамма-розподілів на фактичну потужність у формулі, так що розподіл буде пов'язане з розподілом "Gamma " (оскільки потужність в його PDF дорівнює ), тоді суму трьох слід було б назвати розподілом "Gamma ". Коротше кажучи, тісний адитивний зв'язок між ступенями свободи та параметром у розподілах Gamma був би втрачений шляхом вилученняx χ 2 1 ( 0 ) x 1 - 1 = 0 χ 2 1 ( 2 ) - 1−1xχ21(0)x1−1=0χ21(2)−1 з формули та поглинаючи її в параметрі.
Аналогічно функція ймовірності розподілу відношення тісно пов'язана з розподілами Beta. Дійсно, коли має розподіл відношення , розподіл має Beta . Функція його щільності пропорційнаУ Р Z = ν 1 Y / ( ν 1 Y + ν 2 ) ( ν 1 / 2 , ν 2 / 2 )FYFZ=ν1Y/(ν1Y+ν2)(ν1/2,ν2/2)
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
Крім того, якщо взяти ці ідеї повним колом - квадрат розподілу Стьюдента з df має розподіл відношення з параметрами . Ще раз видно, що дотримання звичайної параметризації підтримує чітку взаємозв'язок з основними підрахунками, що сприяють рівню свободи.ν F ( 1 , ν )tνF(1,ν)
Зі статистичної точки зору, найприроднішим і найпростішим було б використовувати варіацію звичайних математичних параметризацій розподілів та Beta: ми повинні вважати за краще називати розподіл " розподіл ", а розподіл Beta слід назвати" Beta ". Насправді ми вже зробили це: саме тому ми продовжуємо використовувати назви "Chi-квадрат" та " Ratio", а не "Gamma" та "Beta". Незважаючи на це, ні в якому разі ми не хотіли б зняти "Γ ( α ) Γ ( 2 α ) ( α , β ) ( 2 α , 2 β ) FΓΓ(α)Γ(2α)(α,β)(2α,2β)F−1"терміни, які відображаються в математичних формулах для їх щільності. Якби ми це зробили, ми втратили б прямий зв'язок між параметрами в густинах і числом даних, з якими вони пов'язані: ми завжди були б відключені на одне.