Інтерпретація пропорцій, що дорівнюють одиниці як незалежні змінні в лінійній регресії


13

Мені знайоме поняття категоричних змінних та відповідне кодування фіктивних змінних, що дозволяє нам підходити до одного рівня як базового рівня, щоб уникнути колінеарності. Мені також знайоме, як інтерпретувати оцінки параметрів з таких моделей: Передбачувана зміна результату для заданого відповідного рівня категоричного прогноктора стосовно базової категорії.

Я не впевнений у тому, як інтерпретувати набір незалежних змінних, пропорційність яких дорівнює одиниці . У нас знову є колінеарність, якщо ми відповідаємо всім пропорціям моделі, тому, мабуть, нам доведеться залишити одну категорію як базову. Я також припускаю, що я би розглядав тип III SS для загального випробування значущості цієї змінної. Однак, як ми інтерпретуємо оцінки параметрів для тих рівнів, які відповідають моделі, порівняно з тими, які вважаються базовими?

Приклад : На рівні поштового індексу незалежною змінною є частка метаморфних, магматичних та осадових порід. Як ви знаєте, це три основні типи гірських порід, і всі породи класифікуються як один із них. Таким чином, пропорції в усіх трьох сумах до 1. Результатом є середній рівень радону у відповідному поштовому індексі.

Якби я підходив, скажімо, метаморфічні та магматичні пропорції як прогнози в моделі, залишаючи осадовий в якості базової лінії, загальний тип III SS F- тест з двох пристосованих рівнів означав би, чи важливий тип породи в цілому провісник результату (середній рівень радону). Тоді я міг би переглянути окремі p-значення (на основі розподілу t ), щоб визначити, чи один чи обидва типи гірських порід суттєво відрізняються від базових.

Однак, якщо мова йде про оцінку параметрів, мій мозок продовжує хотіти інтерпретувати їх як передбачувана зміна результату між групами (типи порід), і я не розумію, як включити той факт, що вони підходять як пропорції .

β

У когось є джерело, яке надає інтерпретацію такої моделі, чи ви можете надати тут короткий приклад, якщо ні?


2
(π1,π2,,πk)
πi=exp(λi)exp(λ1)++exp(λk)

1
Ні, але я здогадуюсь, що це буде проблематично, тим більше, що багато "пропорцій" насправді вийшли як 0 і 1, або значення, близькі до 0 і 1, і, таким чином, по суті діють як бінарні. Таким чином, швидше за все, ми створимо з них фактичні групи (і усунемо пропорції), але це все ж викликало у мене інтерес щодо того, якою буде правильна інтерпретація, гіпотетично.
Мег

Досить справедливо - це гарне питання.
whuber

2
λiπ
log(πi/πj)=λiλj.
πiλiλjkk1λiπi=0πi=1

2
λi=log(πi)
log(πi/πj)=λiλj
exp(λi)exp(λ1)++exp(λk)=πiπ1+π2++πk=π11=πi

Відповіді:


8

Як подальший досвід, і як я вважаю, що це правильна відповідь (мені здається розумною): я поставив це запитання на listAserAA Connect і отримав таку відповідь від Thomas Sexton у Stony Brook:

"Ваша орієнтовна модель лінійної регресії виглядає так:

ln (Radon) = (лінійний вираз в інших змінних) + 0,43M + 0,92I

де M і I представляють відсотки метаморфних та магматичних порід відповідно у поштовому індексі. Вас обмежує:

M + I + S = 100

де S представляє відсотки осадової породи в індексі.

Інтерпретація 0,43 полягає в тому, що збільшення на один відсотковий пункт M пов'язане зі збільшенням на 0,43 в ln (Radon), утримуючи всі інші змінні в моделі фіксованими . Таким чином, значення I не може змінитися, і єдиний спосіб збільшити M на один відсотковий пункт при задоволенні обмеження - це зменшення на S на один відсотковий пункт, опущена категорія.

Звичайно, ця зміна не може відбутися у поштових індексах, у яких S = 0, але зменшення M та відповідне збільшення S можливо в таких поштових індексах. "

Ось посилання на потік ASA: http://community.amstat.org/communities/community-home/digestviewer/viewthread?GroupId=2653&MID=29924&tab=digestviewer&UserKey=5adc7e8b-ae4f-43f9-b561-4427b5k5f5b5f5bdbdbdddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddfdddddddddddddddddddddddddddddddddddddddddddddddddddddddd є опис перекладу - це посилання на потік ASA:

Я публікую це як прийняту правильну відповідь, але я все ще відкритий для подальшого обговорення, якщо хтось має щось додати.


Одним із порад було б перейти до теми ASA, оскільки тут є певна дискусія, яка ставить під сумнів відповідь, надану тут.
Максим.К

@ Maxim.K: Ви маєте на увазі мою власну нитку ASA, яку я пов’язував вище? Якщо так, так, було багато застережень без відповіді, і я все ще не повністю впевнений у "правильній" відповіді (якщо така навіть існує). Ось чому я додав класифікатор: "Я публікую це як прийняту правильну відповідь, але я все ще відкритий для подальшого обговорення, якщо хтось має щось додати".
Мег
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.