Аддитивна помилка або мультиплікативна помилка?


13

Я порівняно новачок у статистиці і буду вдячний допомогти зрозуміти це краще.

У моєму полі є поширена модель форми:

Pt=Po(Vt)α

Коли люди підходять моделі до даних, вони зазвичай лінеаризують її та відповідають наступному

log(Pt)=log(Po)+αlog(Vt)+ϵ

Чи це добре? Я десь читав, що через шум у сигналі має бути фактична модель

Pt=Po(Vt)α+ϵ

і це не може бути лінеаризовано, як зазначено вище. Це правда? Якщо так, чи знає хтось із посилання, я можу прочитати та дізнатися більше про нього і, ймовірно, цитую у звіті?


Я відформатував ваші рівняння. Перевірте, чи вміст все ще є тим, що ви планували (особливо щодо підписок).
Енді

Ви позначили своє запитання "помилкою вимірювання", і + e в 3-му рівнянні, здавалося б, пояснюється додатковою помилкою вимірювання на додаток до мультиплікативних стохастичних / випадкових змін у відповіді, щось на зразок P * (V ^ alpha) * exp (e). Це правильно? Моделі помилок вимірювання (відомі також як "помилка в змінних") часто вимагають певного двоступеневого процесу, який у вашому випадку може вимагати окремих даних перевірки для характеристики помилки добавки через "шум", і в цьому випадку може бути не потрібно лінеаризувати рівняння.
N Brouwer

Відповіді:


14

Яка модель підходить, залежить від того, наскільки варіація навколо середнього входить у спостереження. Це може входити мультиплікативно чи адитивно ... або якимось іншим способом.

Існує навіть декілька джерел цього варіанту, деякі з яких можуть входити мультипликативно, а інші - адитивно, а деякі способами, які насправді не можуть бути охарактеризовані як.

Іноді існує чітка теорія, щоб встановити, яка підходить. Іноді розмірковування над основними джерелами розбіжності щодо середнього виявить відповідний вибір. Часто люди не мають чіткого уявлення про те, що їх використовувати, або якщо для адекватного опису процесу може знадобитися кілька джерел різного роду.

За допомогою лінійної журнальної моделі, де використовується лінійна регресія:

log(Pt)=log(Po)+αlog(Vt)+ϵ

модель регресії OLS передбачає постійну дисперсію в масштабі журналу, і якщо це так, то вихідні дані показуватимуть все більший розкид про середнє значення зі збільшенням середнього.

З іншого боку, така модель:

Pt=Po(Vt)α+ϵ

зазвичай встановлюється нелінійними найменшими квадратами, і знову ж таки, якщо встановлено постійну дисперсію (за замовчуванням для NLS), розкид про середнє значення повинен бути постійним.

введіть тут опис зображення

[У вас може виникнути візуальне враження, що розкид зменшується зі збільшенням середнього значення на останньому зображенні; це насправді ілюзія, спричинена зростаючим нахилом - ми, як правило, судимо ортогональному розвороті до кривої, а не по вертикалі, тому ми створюємо спотворене враження.]

Якщо у вас майже постійний розкид або в оригінальній, або в масштабі журналу, це може підказати, яка з двох моделей підходить, не тому, що це доводить, що вона є адитивною або мультиплікативною, а тому, що це призводить до відповідного опису поширення, а також маю на увазі.

Звичайно, також може бути можливість додаткової помилки, яка мала непостійну дисперсію.

Однак існують інші моделі, в яких можуть бути встановлені такі функціональні зв'язки, які мають різні співвідношення між середнім та дисперсійним (наприклад, пуассонський або квазі-пуассонський GLM, який поширився пропорційно квадратному кореню середнього).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.