Ця відповідь складається з двох основних частин: по-перше, з використанням лінійної інтерполяції , по-друге, з використанням перетворень для більш точної інтерполяції. Розглянуті тут підходи підходять для обчислення вручну, коли у вас доступні обмежені таблиці, але якщо ви впроваджуєте комп'ютерну процедуру для створення p-значень, є набагато кращі підходи (якщо вони втомлюються, коли це робиться вручну), які слід використовувати замість цього.
Якби ви знали, що критичне значення 10% (один хвіст) для z-тесту склало 1,28, а критичне значення 20% - 0,84, груба здогадка при критичному значенні 15% була б навпіл між - (1,28 + 0,84) / 2 = 1,06 (фактичне значення 1,0364), і значення 12,5% можна було вгадати на півдорозі між цим та 10% значенням (1,28 + 1,06) / 2 = 1,17 (фактичне значення 1,15+). Це саме те, що робить лінійна інтерполяція, але замість "на півдорозі між", вона дивиться на будь-яку частку шляху між двома значеннями.
Універсальна лінійна інтерполяція
Давайте розглянемо випадок простої лінійної інтерполяції.
Отже, у нас є деяка функція (скажімо, ), яка, на нашу думку, є приблизно лінійною біля значення, яке ми намагаємося наблизити, і у нас є значення функції з будь-якої сторони значення, яке ми хочемо, наприклад, наприклад:x
х81620у9.3у1615.6
Дві значення чиї ми знаємо, є 12 (20-8) один від одного. Подивіться, як значення -значення (того, для якого ми хочемо приблизний -значення) ділить цю різницю на 12 в співвідношенні 8: 4 (16-8 і 20-16)? Тобто це 2/3 відстані від першого -значення до останнього. Якби зв'язок був лінійним, відповідний діапазон значень y був би в одному співвідношенні.y x y xхухух
Отже має бути приблизно таким же, як . 16-8у16- 9.315,6 - 9,316 - 820 - 8
Цеу16- 9.315,6 - 9,3≈ 16 - 820 - 8
перестановка:
у16≈ 9,3 + ( 15,6 - 9,3 ) 16 - 820 - 8= 13,5
Приклад зі статистичними таблицями: якщо у нас є t-таблиця з наступними критичними значеннями для 12 df:
( 2- розд. )α0,010,020,050.10т3.052.682.181,78
Ми хочемо критичне значення t з 12 df і двохвостою альфа 0,025. Тобто, ми інтерполюємо між рядом 0,02 та 0,05 цієї таблиці:
α0,020,0250,05т2.68?2.18
Значення в " " - це значення яке ми хочемо використовувати лінійну інтерполяцію для наближення. (Під я фактично маю на увазі точку зворотного cdf розподілу .)t 0,025 t 0,025 1 - 0,025 / 2 t 12?т0,025т0,0251 - 0,025 / 2т12
Як і раніше, ділить інтервал від до у співвідношенні до (тобто ), а невідома -значення повинна ділити діапазон на в тому ж співвідношенні; еквівалентно, що відбувається го шляху вздовж -ранжевого, тому невідоме -значення повинно відбуватися на му шляху вздовж діапазону.0,02 0,05 ( 0,025 - 0,02 ) ( 0,05 - 0,025 ) 1 : 5 т т 2,68 2,18 0,025 ( 0,025 - 0,02 ) / ( 0,05 - 0,02 ) = 1 / 6 х т 1 / 6 т0,0250,020,05( 0,025 - 0,02 )( 0,05 - 0,025 )1 : 5тт2.682.180,025( 0,025 - 0,02 ) / ( 0,05 - 0,02 ) = 1 / 6хт1 / 6т
Тобто або еквівалентнот0,025- 2,682,18 - 2,68≈ 0,025 - 0,020,05 - 0,02
т0,025≈ 2,68 + ( 2,18 - 2,68 ) 0,025 - 0,020,05 - 0,02= 2,68 - 0,5 16≈ 2,60
Дійсна відповідь - …, що не є особливо близьким, оскільки функція, яку ми наближаємо, не дуже близька до лінійної в цьому діапазоні (ближче це).2,56α = 0,5
Кращі наближення через перетворення
Ми можемо замінити лінійну інтерполяцію іншими функціональними формами; насправді ми перетворюємось на шкалу, коли лінійна інтерполяція працює краще. У цьому випадку в кінці багатьох табличних критичних значень більш майже лінійний рівня значущості. Після того як ми беремо s, ми просто застосовуємо лінійну інтерполяцію, як і раніше. Спробуємо це на наведеному вище прикладі:журналжурнал
α0.020.0250.05log(α)−3.912−3.689−2.996t2.68t0.0252.18
Тепер
t0.025−2.682.18−2.68≈=log(0.025)−log(0.02)log(0.05)−log(0.02)−3.689−−3.912−2.996−−3.912
або рівнозначно
t0.025≈=2.68+(2.18−2.68)−3.689−−3.912−2.996−−3.9122.68−0.5⋅0.243≈2.56
Що вірно з цитованою кількістю цифр. Це тому, що - коли ми перетворюємо x-шкалу логарифмічно - зв'язок майже лінійний:
Дійсно, візуально крива (сіра) лежить акуратно вгорі прямої (синя).
У деяких випадках logit рівня значущості ( ) може працювати добре в більш широкому діапазоні, але зазвичай це не потрібно (ми зазвичай піклуємося про точні критичні значення, коли досить малий, що працює досить добре).logit(α)=log(α1−α)=log(11−α−1)αlog
Інтерполяція різних ступенів свободи
t , таблиці чі-квадрат і також мають ступінь свободи, де не кожне значення df ( -) відображається в таблиці. Критичні значення здебільшого не точно представлені лінійною інтерполяцією в df. Дійсно, часто майже так буває, що табличні значення лінійні у зворотному значенні df, .Fν†1/ν
(У старих таблицях ви часто бачите рекомендації щодо роботи зі - константа на чисельнику не має ніякої різниці, але була зручнішою в дні, що працюють за попереднім калькулятором, оскільки 120 має багато факторів, тому часто є цілим числом, що робить обчислення трохи простішим.)120/ν120/ν
Ось як працює зворотна інтерполяція на 5% критичних значень між і . Тобто, лише лише кінцеві точки беруть участь в інтерполяції в . Наприклад, для обчислення критичного значення для беремо (і зауважимо, що тут являє собою зворотну частину cdf):F4,νν=601201/νν=80F
F4,80,.95≈F4,60,.95+1/80−1/601/120−1/60⋅(F4,120,.95−F4,60,.95)
(Порівняйте з діаграмою тут )
† Здебільшого, але не завжди. Ось приклад, коли лінійна інтерполяція в df краще, і пояснення, як сказати з таблиці, що лінійна інтерполяція буде точною.
Ось шматок таблиці з чі-квадратом
Probability less than the critical value
df 0.90 0.95 0.975 0.99 0.999
______ __________________________________________________
40 51.805 55.758 59.342 63.691 73.402
50 63.167 67.505 71.420 76.154 86.661
60 74.397 79.082 83.298 88.379 99.607
70 85.527 90.531 95.023 100.425 112.317
Уявіть, що ми хочемо знайти 5-відсоткове критичне значення (95-й відсоток) для 57 градусів свободи.
Придивляючись уважно, ми бачимо, що 5% критичних значень у таблиці прогресують тут майже лінійно:
(зелена лінія приєднується до значень для 50 і 60 df; ви можете бачити, що вона торкається крапок для 40 і 70)
Тож лінійна інтерполяція зробить дуже добре. Але ми, звичайно, не встигаємо намалювати графік; як вирішити, коли використовувати лінійну інтерполяцію і коли спробувати щось складніше?
Окрім значень будь-якої сторони тієї, яку ми шукаємо, візьміть наступне найближче значення (70 у цьому випадку). Якщо середнє табличне значення (значення для df = 60) близьке до лінійного між кінцевими значеннями (50 і 70), то лінійною інтерполяцією буде придатним. У цьому випадку значення зрівняються, тому це особливо легко: чи близький до ?(x50,0.95+x70,0.95)/2x60,0.95
Ми знаходимо, що , що в порівнянні з фактичним значенням для 60 df, 79.082, ми можемо бачити точні майже до трьох повних цифр, що, як правило, досить добре для інтерполяції, тому в цьому випадку, ви будете дотримуватися лінійної інтерполяції; маючи більш точний крок для потрібного нам значення, ми зараз очікували б мати 3-точну точність фігури.(67.505+90.531)/2=79.018
Таким чином ми отримуємо: абоx−67.50579.082−67.505≈57−5060−50
x≈67.505+(79.082−67.505)⋅57−5060−50≈75.61 .
Дійсне значення - 75,62375, тому ми дійсно отримали 3 цифри точності та були лише 1 на четвертому малюнку.
Більш точну інтерполяцію все-таки можливо, використовуючи методи кінцевих відмінностей (зокрема, за допомогою розділених різниць), але це, мабуть, перевищення більшості проблем тестування гіпотез.
Якщо ваші ступені свободи виходять за межі столу, це питання обговорює цю проблему.