Як я можу знайти значення, не вказані в (інтерполювати в) статистичні таблиці?


19

Часто люди використовують програми для отримання p-значень, але іноді - з будь-якої причини - може знадобитися отримання критичного значення з набору таблиць.

З огляду на статистичну таблицю з обмеженою кількістю рівнів значущості та обмеженою кількістю ступенів свободи, як я можу отримати приблизні критичні значення на інших рівнях значущості чи ступені свободи (наприклад, з таблицями , chi-квадрат або ) ?tF

Тобто, як я знаходжу в таблиці значення "посеред"?

Відповіді:


26

Ця відповідь складається з двох основних частин: по-перше, з використанням лінійної інтерполяції , по-друге, з використанням перетворень для більш точної інтерполяції. Розглянуті тут підходи підходять для обчислення вручну, коли у вас доступні обмежені таблиці, але якщо ви впроваджуєте комп'ютерну процедуру для створення p-значень, є набагато кращі підходи (якщо вони втомлюються, коли це робиться вручну), які слід використовувати замість цього.

Якби ви знали, що критичне значення 10% (один хвіст) для z-тесту склало 1,28, а критичне значення 20% - 0,84, груба здогадка при критичному значенні 15% була б навпіл між - (1,28 + 0,84) / 2 = 1,06 (фактичне значення 1,0364), і значення 12,5% можна було вгадати на півдорозі між цим та 10% значенням (1,28 + 1,06) / 2 = 1,17 (фактичне значення 1,15+). Це саме те, що робить лінійна інтерполяція, але замість "на півдорозі між", вона дивиться на будь-яку частку шляху між двома значеннями.

Універсальна лінійна інтерполяція

Давайте розглянемо випадок простої лінійної інтерполяції.

Отже, у нас є деяка функція (скажімо, ), яка, на нашу думку, є приблизно лінійною біля значення, яке ми намагаємося наблизити, і у нас є значення функції з будь-якої сторони значення, яке ми хочемо, наприклад, наприклад:x

xy89.316y162015.6

Дві значення чиї ми знаємо, є 12 (20-8) один від одного. Подивіться, як значення -значення (того, для якого ми хочемо приблизний -значення) ділить цю різницю на 12 в співвідношенні 8: 4 (16-8 і 20-16)? Тобто це 2/3 відстані від першого -значення до останнього. Якби зв'язок був лінійним, відповідний діапазон значень y був би в одному співвідношенні.y x y xxyxyx

лінійна інтерполяція

Отже має бути приблизно таким же, як . 16-8y169.315.69.3168208

Цеy169.315.69.3168208

перестановка:

y169.3+(15.69.3)168208=13.5

Приклад зі статистичними таблицями: якщо у нас є t-таблиця з наступними критичними значеннями для 12 df:

(2-tail)αt0.013.050.022.680.052.180.101.78

Ми хочемо критичне значення t з 12 df і двохвостою альфа 0,025. Тобто, ми інтерполюємо між рядом 0,02 та 0,05 цієї таблиці:

αt0.022.680.025?0.052.18

Значення в " " - це значення яке ми хочемо використовувати лінійну інтерполяцію для наближення. (Під я фактично маю на увазі точку зворотного cdf розподілу .)t 0,025 t 0,025 1 - 0,025 / 2 t 12?t0.025t0.02510.025/2t12

Як і раніше, ділить інтервал від до у співвідношенні до (тобто ), а невідома -значення повинна ділити діапазон на в тому ж співвідношенні; еквівалентно, що відбувається го шляху вздовж -ранжевого, тому невідоме -значення повинно відбуватися на му шляху вздовж діапазону.0,02 0,05 ( 0,025 - 0,02 ) ( 0,05 - 0,025 ) 1 : 5 т т 2,68 2,18 0,025 ( 0,025 - 0,02 ) / ( 0,05 - 0,02 ) = 1 / 6 х т 1 / 6 т0.0250.020.05(0.0250.02)(0.050.025)1:5tt2.682.180.025(0.0250.02)/(0.050.02)=1/6xt1/6t

Тобто або еквівалентноt0.0252.682.182.680.0250.020.050.02

t0.0252.68+(2.182.68)0.0250.020.050.02=2.680.5162.60

Дійсна відповідь - …, що не є особливо близьким, оскільки функція, яку ми наближаємо, не дуже близька до лінійної в цьому діапазоні (ближче це).2.56α=0.5

лінійна інтерполяція критичного значення в t-таблицях

Кращі наближення через перетворення

Ми можемо замінити лінійну інтерполяцію іншими функціональними формами; насправді ми перетворюємось на шкалу, коли лінійна інтерполяція працює краще. У цьому випадку в кінці багатьох табличних критичних значень більш майже лінійний рівня значущості. Після того як ми беремо s, ми просто застосовуємо лінійну інтерполяцію, як і раніше. Спробуємо це на наведеному вище прикладі:loglog

αlog(α)t0.023.9122.680.0253.689t0.0250.052.9962.18

Тепер

t0.0252.682.182.68log(0.025)log(0.02)log(0.05)log(0.02)=3.6893.9122.9963.912

або рівнозначно

t0.0252.68+(2.182.68)3.6893.9122.9963.912=2.680.50.2432.56

Що вірно з цитованою кількістю цифр. Це тому, що - коли ми перетворюємо x-шкалу логарифмічно - зв'язок майже лінійний:

лінійна інтерполяція в альфа-журналі
Дійсно, візуально крива (сіра) лежить акуратно вгорі прямої (синя).

У деяких випадках logit рівня значущості ( ) може працювати добре в більш широкому діапазоні, але зазвичай це не потрібно (ми зазвичай піклуємося про точні критичні значення, коли досить малий, що працює досить добре).logit(α)=log(α1α)=log(11α1)αlog

Інтерполяція різних ступенів свободи

t , таблиці чі-квадрат і також мають ступінь свободи, де не кожне значення df ( -) відображається в таблиці. Критичні значення здебільшого не точно представлені лінійною інтерполяцією в df. Дійсно, часто майже так буває, що табличні значення лінійні у зворотному значенні df, .Fν1/ν

(У старих таблицях ви часто бачите рекомендації щодо роботи зі - константа на чисельнику не має ніякої різниці, але була зручнішою в дні, що працюють за попереднім калькулятором, оскільки 120 має багато факторів, тому часто є цілим числом, що робить обчислення трохи простішим.)120/ν120/ν

Ось як працює зворотна інтерполяція на 5% критичних значень між і . Тобто, лише лише кінцеві точки беруть участь в інтерполяції в . Наприклад, для обчислення критичного значення для беремо (і зауважимо, що тут являє собою зворотну частину cdf):F4,νν=601201/νν=80F

F4,80,.95F4,60,.95+1/801/601/1201/60(F4,120,.95F4,60,.95)

зворотний інтерп в df

(Порівняйте з діаграмою тут )


Здебільшого, але не завжди. Ось приклад, коли лінійна інтерполяція в df краще, і пояснення, як сказати з таблиці, що лінійна інтерполяція буде точною.

Ось шматок таблиці з чі-квадратом

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

Уявіть, що ми хочемо знайти 5-відсоткове критичне значення (95-й відсоток) для 57 градусів свободи.

Придивляючись уважно, ми бачимо, що 5% критичних значень у таблиці прогресують тут майже лінійно:

введіть тут опис зображення

(зелена лінія приєднується до значень для 50 і 60 df; ви можете бачити, що вона торкається крапок для 40 і 70)

Тож лінійна інтерполяція зробить дуже добре. Але ми, звичайно, не встигаємо намалювати графік; як вирішити, коли використовувати лінійну інтерполяцію і коли спробувати щось складніше?

Окрім значень будь-якої сторони тієї, яку ми шукаємо, візьміть наступне найближче значення (70 у цьому випадку). Якщо середнє табличне значення (значення для df = 60) близьке до лінійного між кінцевими значеннями (50 і 70), то лінійною інтерполяцією буде придатним. У цьому випадку значення зрівняються, тому це особливо легко: чи близький до ?(x50,0.95+x70,0.95)/2x60,0.95

Ми знаходимо, що , що в порівнянні з фактичним значенням для 60 df, 79.082, ми можемо бачити точні майже до трьох повних цифр, що, як правило, досить добре для інтерполяції, тому в цьому випадку, ви будете дотримуватися лінійної інтерполяції; маючи більш точний крок для потрібного нам значення, ми зараз очікували б мати 3-точну точність фігури.(67.505+90.531)/2=79.018

Таким чином ми отримуємо: абоx67.50579.08267.50557506050

x67.505+(79.08267.505)5750605075.61 .

Дійсне значення - 75,62375, тому ми дійсно отримали 3 цифри точності та були лише 1 на четвертому малюнку.

Більш точну інтерполяцію все-таки можливо, використовуючи методи кінцевих відмінностей (зокрема, за допомогою розділених різниць), але це, мабуть, перевищення більшості проблем тестування гіпотез.

Якщо ваші ступені свободи виходять за межі столу, це питання обговорює цю проблему.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.