Мені здається само собою зрозумілим, що
якщо . Отже, мені менш зрозуміло, яка може бути плутанина. Що я можу сказати, це те, що ліва сторона (LHS) знаку (не) дорівнює - шанси недоїдання, тоді як РЗС - це ймовірність недоїдання. Якщо досліджувати самостійно, - це коефіцієнт шансів , тобто мультиплікативний коефіцієнт, який дозволяє переходити від шансів ( ) до шансів ( ).
досвід( β0+ β1x ) ≠ exp( β0+ β1х )1 + експ( β0+ β1х )
exp ( β 1 ) x x + 1досвід( β0+ β1х ) = 0досвід( β1)хх + 1
Повідомте мене, якщо вам потрібна додаткова / інша інформація.
Оновлення:
Я думаю, що це, головним чином, питання незнайомих імовірностей та шансів, а також того, як вони стосуються один одного. Ніщо з цього не є дуже інтуїтивно зрозумілим, вам потрібно посидіти і попрацювати з ним деякий час і навчитися думати в цих термінах; це природно нікому не приходить.
Проблема полягає в тому, що абсолютні числа дуже важко інтерпретувати самостійно. Скажімо, я розповідав вам про час, коли у мене була монета, і я цікавився, чи справедливо це. Тому я перевернув його і отримав 6 голів. Що це означає? Це 6, мало, приблизно так? Це жахливо важко сказати. Для вирішення цього питання ми хочемо дати числу деякий контекст. У такому випадку є два очевидних варіанти, як забезпечити необхідний контекст: я міг би дати загальну кількість обертів, або я міг дати кількість хвостів. У будь-якому випадку у вас є достатня інформація, щоб мати сенс на 6 голів, і ви можете обчислити інше значення, якби той, про який я вам сказав, був не той, кого ви віддаєте перевагу. Ймовірність - це кількість голів, поділене на загальну кількість подій. Коефіцієнт - відношення кількості голів до кількостінеголові (інтуїтивно ми хочемо сказати кількість хвостів, що працює в цьому випадку, але не, якщо є більше 2 можливостей). З коефіцієнтами можна дати обидва числа, наприклад, 4 до 5. Це означає, що в кінцевому рахунку щось відбуватиметься 4 рази на кожні 5 разів, що не відбувається. Коли шанси представлені таким чином, вони називаються " шанси в Лас-Вегасі ". Однак у статистиці ми, як правило, розбиваємося і кажемо, що шанси натомість дорівнює .8 (тобто 4/5 = .8) для цілей стандартизації. Ми також можемо конвертувати між шансами та ймовірностями:
exp(β)
ймовірність = шанси1 + шанси шанси = ймовірність1 - ймовірність
(За допомогою цих формул може бути важко визнати, що шанси є LHS вгорі, а ймовірність - RHS, але пам’ятайте, що це знак
не рівний посередині.)
Коефіцієнт шансів - це лише шанс чогось поділити на шанси чогось іншого; в контексті логістичної регресії кожен - відношення шансів на послідовні значення асоційованого коваріату, коли всі інші дорівнюють рівним.
досвід( β)
Що важливо визнати з усіх цих рівнянь, це те, що коефіцієнти ймовірностей, коефіцієнтів та коефіцієнтів не співпадають прямо; тільки тому, що ймовірність збільшується на .04, не означає, що коефіцієнт шансів чи шансів повинен бути чимось подібним до .04! Більше того, ймовірності коливаються від , тоді як шанси ln (вихід із сировинного логістичного рівняння регресії) можуть коливатися від , а коефіцієнти шансів і шансів можуть коливатися від . Ця остання частина життєво важлива: Через обмежений діапазон ймовірностей ймовірності нелінійні , але шанси ln можуть бути лінійними. Тобто як (наприклад)[ 0 , 1 ]( - ∞ , + ∞ )( 0 , + ∞ )wealth
зростає постійними приростами, ймовірність недоїдання зростатиме різними сумами, але шанси на ln збільшуватимуться на постійну суму, а шанси збільшуватимуться на постійний мультиплікативний коефіцієнт. Для будь-якого заданого набору значень у вашій моделі логістичної регресії може бути деякий момент, коли
для деяких заданих та , але це буде неоднаково скрізь ще. xx′
досвід( β0+ β1х ) - експ( β0+ β1х') = Досвід( β0+ β1х )1 + експ( β0+ β1х )- експ( β0+ β1х')1 + експ( β0+ β1х')
хх'
(Хоча це було написано в контексті іншого запитання, моя відповідь тут містить багато інформації про логістичну регресію, яка може бути корисною для розуміння LR та пов'язаних з цим питань.)