Це дещо мистецтво, але є деякі стандартні, прості речі, які завжди можна спробувати.
Перше, що потрібно зробити, це повторно виразити залежну змінну ( ), щоб зробити залишки нормальними. Це не реально застосовано в цьому прикладі, коли точки, схоже, падають по плавній нелінійній кривій з дуже невеликим розсіюванням. Тож переходимо до наступного кроку.у
Наступне - повторно виразити незалежну змінну ( ) для лінеаризації відносин. Існує простий, простий спосіб зробити це. Виберіть три репрезентативні точки уздовж кривої, бажано на обох кінцях та посередині. З першої цифри я зачитував упорядковані пари ( r , y ) = ( 10 , 7 ) , ( 90 , 0 ) і ( 180 , - 2 ) . Без будь-якої іншої інформації, окрім того, що r завжди виявляється позитивним, хорошим вибором є вивчення перетворень Box-Coxr( г , у)( 10 , 7 )( 90 , 0 )( 180 , - 2 )r для різних ступенях р ,правиловибираютьщоб бути кратні 1 / 2 або 1 / 3 і зазвичай між - 1 і 1 . (Обмежувальне значення знаближенням p дорівнює 0 - log ( r ) .) Це перетворення створить приблизну лінійну залежність за умови, що нахил між першими двома точками дорівнює нахилу між другою парою.r → ( rp- 1 ) / сp1 / 21 / 3- 11p0журнал( r )
Наприклад, нахили неперетворених даних складають = - 0,088 і ( - 2 - 0 ) / ( 180 - 90 ) = - 0,022 . Вони зовсім інші: один приблизно в чотири рази більше іншого. Спроба р = - 1 / 2 дає нахили ( 0 - 7 ) / ( 90 - 1 /( 0 - 7 ) / (90-10)0,088( - 2 - 0 ) / (180-90)- 0,022p = - 1 / 2,т.д., які працюють поза до-16,6і-32,4: тепер один з них тількидва рази більша за іншу, що є удосконаленням. Продовжуючи таким чином (електронна таблиця зручна), я вважаю, щоp≈0працює добре: схили зараз-7,3та-6,6, майже однакове значення. Отже, слід спробувати модель виглядуy=α+βlog(r). Потім повторіть: встановіть рядок, вивчіть залишки, визначте перетворенняу( 0 - 7 ) / ( 90- 1 / 2- 1- 1 / 2- 10- 1 / 2- 1-1 / 2)- 16.6- 32.4p ≈ 0- 7,3- 6.6у= α + βжурнал( r )у зробити їх приблизно симетричними та ітераційними.
Джон Тукі надає деталі та багато прикладів у своїй класичній книзі « Розвідувальний аналіз даних» (Аддісон-Уеслі, 1977). Він наводить подібні (але дещо більш задіяні) процедури для виявлення дисперсій-стабілізуючих перетворень . Один набір даних зразків, який він надає в якості вправ, стосується давніх даних про тиску пари ртуті, виміряні при різних температурах. Дотримуючись цієї процедури, можна повторно розкрити співвідношення Клаус і Клапейрон ; залишки до остаточного пристосування можна інтерпретувати через квантово-механічні ефекти, що виникають на атомних відстанях!у