багаторазова регресія та множинні порівняння


10

Скажіть, я підходить до кратної регресії p пояснювальних змінних. T-тест дозволить мені перевірити, чи є якийсь один із них значущим ( ). Я можу зробити частковий F-тест , щоб перевірити , якщо деяка підмножина з них є значущим ( H 0 : β я = β J = . . . = Β до = 0 ).H0:βi=0H0:βi=βj=...=βk=0

Я часто бачу, що хтось отримує 5 р-значень з 5-тестових тестів (якщо припустити, що вони мали 5 коваріатів) і зберігає лише ті, які мають значення р <0,05. Це здається трохи невірним, оскільки насправді має бути перевірка декількох порівнянь ні? Чи справді справедливо сказати щось на зразок і β 2 , але це важливо, але β 3 , β 4 і β 5 ні?β1β2β3β4β5

У відповідній записці скажіть, що я веду 2 регресії на 2 окремих моделях (різний результат). Чи потрібно проводити багаторазову перевірку порівняння значущих параметрів між двома результатами?

Редагувати: Для відмежування від подібного питання, чи існує інша інтерпретація p-значень, окрім: "B_i є (не) значущим, коли коригується для всіх інших коваріатів"? Не здається, що ця інтерпретація дозволяє мені переглядати кожен B_i та опускати їх менше 0,5 (що схоже на інший пост).

Мені здається, що надійним способом перевірити, чи мають стосунки B_i і Y, було б отримати коефіцієнт кореляції р-значення для кожного коваріату, а потім зробити мультикомплект (хоча це, безумовно, втратить сигнал).

Нарешті, скажімо, я обчислив співвідношення між B1 / Y1, B2 / Y1 та B3 / Y1 (таким чином, три p-значення). Незалежно я також робив кореляцію між T1 / Y2, T2 / Y2, T3 / Y2. Я припускаю, що правильне коригування Бонферроні було б 6 для всіх 6 тестів разом (а не 3 для першої групи і 3 для другої групи - і, таким чином, отримувати 2 "напів" -кориговані p-значення).


1
Це виглядає як дублікат (це питання) [ stats.stackexchange.com/questions/3200/…, якщо це не скажіть, чому б ні.
Пітер Флом

Привіт, це схоже, але не зовсім точно. Можливо, кращим питанням буде те, що коли ви отримуєте список p-значень, є єдиною можливою інтерпретацією таке: "Контролюючи всі інші параметри, ця змінна є в / значущою". Як би ви хоч дивилися на них усіх.
користувач1357015

Якщо ви хочете відредагувати своє питання, це добре, але, мабуть, краще це зробити в самому запитанні, щоб люди його бачили першими. Але я не відсуджую, що означає "як би ти подумав на всі вони".
Пітер Флом

Відповіді:


10

t

α=.051(1α)pp=5.23

Ft-tests, але видалить усі фіктивні коди і замість цього зробить тест вкладеної моделі.

Інша можлива стратегія - використовувати процедуру коригування альфа, як-от корекція Бонферроні. Ви повинні усвідомити, що це зменшить вашу потужність, а також зменшить рівень помилок вашої родинної групи I. Чи вартий цей компроміс - це заклик до судження. (FWIW, я зазвичай не використовую виправлення альфа в декількох регресіях.)

p

b1x1+b2x2b1x1+b2x2+b3x3

Що стосується питання, як обробляти аналізи з різними залежними змінними, чи хочете ви використовувати якесь коригування, ґрунтується на тому, як ви бачите аналізи один щодо одного. Традиційна ідея полягає в тому, щоб визначити, чи вони значимо вважаються "сім'єю". Про це йдеться тут: Що може бути чітким, практичним визначенням для "сім'ї гіпотез"? Ви також можете прочитати цю тему: Методи прогнозування декількох залежних змінних .


Дякую за це. Це саме те, що мені було потрібно. Щодо Вашого коментаря щодо едогенності. Це має сенс, але здається, що якщо я роблю консервативну корекцію Бонферроні на кореляційних p-значеннях, навіть якщо є ендегонічність, корекція бонферроні повинна враховувати це ні?
user1357015

Корекція Бонферроні не пов'язана з ендогенністю. Якщо ваші коваріати взагалі співвідносяться між собою, одноваріантні кореляції XY будуть упередженими оцінками взаємозв'язку. Ви повинні відповідати тій моделі, яку ви планували помістити і зупинити там. Взагалі, реально не потрібно йти далі. Якщо вам потрібно скласти справжню модель прогнозування, вам слід скористатися перехресною валідацією або іншими прийомами, відповідними для цього.
gung - Відновіть Моніку

0

На практичному рівні, я думаю, потрібно також враховувати, чи відображаються бета-версії рівнів категоричних змінних (тобто манекенів). У цих умовах доцільно цікавитись, чи відрізняється дана бета-версія порівняно з (змістовною) референткою Beta. Але перш ніж навіть робити парні порівняння, потрібно знати, чи важливі загалом рівні категоріальної змінної (використовуючи спільний тест F або тест на коефіцієнт ймовірності). Це робить перевагу використання менше df

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.