Який розподіл похибки навколо даних логістичного зростання?


10

В екології ми часто використовуємо логістичне рівняння зростання:

Nt=KN0ertK+N0ert1

або

Nt=KN0N0+(KN0)ert

де K - вантажопідйомність (досягнута максимальна щільність), N0 - початкова щільність, r - темп зростання, t час від початкового.

Значення Nt має м’яку верхню межу (K) і нижня межа (N0), з сильною нижньою межею в 0.

Крім того, в моєму конкретному контексті вимірювання Nt здійснюються за допомогою оптичної щільності або флуоресценції, обидві мають теоретичні максимуми, і, отже, сильну верхню межу.

Помилка навколо Nt тому, ймовірно, найкраще описується обмеженим розподілом.

При малих значеннях Nt, розподіл, ймовірно, має сильне позитивне перекос, хоча і при значеннях Ntнаближаючись до K, розподіл, ймовірно, має сильний негативний перекіс. Таким чином, розподіл, ймовірно, має параметр форми, з яким можна пов'язатиNt.

Дисперсія також може зростати з Nt.

Ось графічний приклад

введіть тут опис зображення

з

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

які можуть бути вироблені в р с

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • Яким би був теоретичний розподіл помилок навколо Nt (з урахуванням як моделі, так і емпіричної інформації)?

  • Як параметри цього розподілу відносяться до значення Nt або час (якщо з використанням параметрів був режим, який не можна безпосередньо пов'язати з) Ntнапр. logis нормальний)?

  • Чи має цей розподіл функцію щільності, реалізовану в R?

Досі вивчені напрямки:

  • Припускаючи нормальність навколо Nt (призводить до перевищення оцінок K)
  • Логітуйте нормальний розподіл навколо Nt/max, але труднощі з пристосуванням параметрів форми альфа та бета-версія
  • Нормальний розподіл навколо логіки Nt/max

1
Зосередивши увагу на розподілі помилок це питання відображає складне мислення про модель, але майте в виду , що розподіл помилок для функціональної форми не обов'язково мати ніякого відношення до самої форми. Інгредієнти дійсної відповіді замість того, щоб знайти інформацію про те, як відбувається зростання, про природні зміни вK і r з часом (який обов'язково буде поглиблений помилкою), про можливі неправильні специфікації моделі та як Ntt) вимірюються.
whuber

@whuber, я нещодавно намагався звернутися до деяких ваших коментарів.
Етьєн Низький Декарі

1
5 думаю, що якщо ви можете охарактеризувати властивості розподілу шуму так, як у вас є, ви можете вибрати параметричну форму з цими властивостями. Я думаю, підводячи підсумки, сім'я повинна 1. визначатися з обмеженим інтервалом, 2. допускати лівий косий, правий косий і симетрійний. і 3. має дисперсію, яка збільшується зі збільшенням Nt. Бета-розподіл відповідає рахункам на 1 і 2. Фіксований інтервал становить [0, 1]. Отже, щоб дозволити збільшенню дисперсії, ми могли б додати параметр c, який поширює розподіл на intervsl [0, c].
Майкл Р. Черник

Відповіді:


3

Як зазначав Майкл Черник, масштабний бета-розподіл має найкращий сенс для цього. Однак для всіх практичних цілей і сподіваючись, що НІКОЛИщоб отримати модель абсолютно правильно, вам краще просто моделювати середнє за допомогою нелінійної регресії згідно з вашим логістичним рівнянням зростання і обгортати це стандартними помилками, які є надійними для гетерокедастичності. Якщо поставити це в контекст максимальної ймовірності, то створиться помилкове відчуття великої точності. Якщо екологічна теорія виробить розподіл, ви повинні відповідати цьому розподілу. Якщо ваша теорія дає лише передбачення в середньому, вам слід дотримуватися цієї інтерпретації і не намагатися придумати нічого іншого, як повне розповсюдження. (Система кривих Пірсона, безумовно, була фантазійна 100 років тому, але випадкові процеси не слідують за диференціальними рівняннями для отримання кривих щільності, що було його мотивацією з цими кривими щільності - скоріше,Ntсам - я маю на увазі розподіл Пуассона як приклад - і я не зовсім впевнений, що цей ефект буде зафіксований масштабним бета-розподілом; навпаки, воно стиснеться, коли ви потягнете середину до її теоретичної верхньої межі, що, можливо, доведеться робити. Якщо ваш вимірювальний пристрій має верхню межу вимірювань, це не означає, що ваш фактичний процесповинна мати верхню межу; Я скоріше скажу, що помилка вимірювання, введена вашими пристроями, стає критичною, оскільки процес досягає цієї верхньої межі, коли вимірюється досить точно. Якщо ви плутаєте вимірювання з основним процесом, ви повинні це чітко визнати, але я думаю, що у вас є більший інтерес до процесу, ніж у описі того, як працює ваш пристрій. (Процес буде існувати через 10 років; нові вимірювальні прилади можуть стати доступними, тож ваша робота застаріє.)


Дякую купу! Я згоден, що розділення процесу та міри цікаве. Однак я б припустив, що більшість методів вимірювання мають цю сильну верхню межу, але це може бути важливо виділити. Якщо я де використовувати масштабовану бета-версію, незважаючи на ваше попередження про впевненість у встановленні MLE, будь-які пропозиції щодо того, як пов’язати параметри форми з цією системою для моделювання змінних, щоб дозволити MLE?
Етьєн Лоу-Декарі

Якщо ви впевнені, що ваші межі дійсно важливі у вашій програмі, ви можете просто дотримуватися цієї масштабованої бета-версії. Все, що я говорю, це те, що я не переконаний. Існують моделі для усічених даних, де все, що ви знаєте, - це те, що фактичне значення перевищує максимум, який ви можете виміряти; їх іноді використовують разом із кодуванням доходів за версією, тоді як з міркувань конфіденційності доходи, що перевищують, наприклад, 100 000 доларів США на рік, скорочуються до 100 000 доларів США на рік.
Стаск

1

@whuber правильний, що немає необхідного зв’язку структурної частини цієї моделі з розподілом термінів помилки. Тож відповіді на ваше запитання щодо теоретичного розподілу помилок немає.

Це не означає, що це не гарне запитання - лише те, що відповідь має бути значною мірою емпіричною.

Ви, здається, припускаєте, що випадковість є адитивною. Я не бачу причин (крім обчислювальної зручності) для цього. Чи є альтернативою, що в моделі є десь інший випадковий елемент? Наприклад, див. Наступне, де випадковість вводиться як нормально розподілена із середнім значенням 1, дисперсія - єдине, що можна оцінити. У мене немає підстав вважати, що це правильна справа, крім того, що вона дає правдоподібні результати, які, здається, відповідають тому, що ви хочете бачити. Чи було б практичним використовувати щось подібне як основу для оцінки моделі, я не знаю.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

введіть тут опис зображення


У цьому випадку у вас можуть бути значення Nt нижче нуля і вище жорсткої верхньої межі. Крім того, очікується шум у всіх параметрах (не обов'язково у добутку параметра з часом), отже, шум на змінній відгуку. Мені все одно було б цікаво, щоб максимально вірогідне тлумачення Вашого підходу.
Етьєн Низький Декарі

Це не дозволяє обмежувати розподіл для кожної Nt і не дозволяє перекручувати компонент шуму. Я не знаю, чи моє уявлення про масштабований бета-розподіл було використано в літературі, але воно добре відповідає обмеженням. Я не пробував цього, але, можливо, можна спробувати максимальну ймовірність. Я не впевнений, але, можливо, виникне проблема, якщо c буде включено до оцінки ймовірності. Можливо, c можна було б оцінити окремо, виходячи лише з Nt, і тоді решта моделі могла б відповідати за максимальною ймовірністю для кожного фіксованого Nt.
Майкл Р. Черник

Я просто думаю вголос. Хтось вважає, що ця проблема може бути перетворена на хороший дослідницький документ?
Майкл Р. Черник

Документ з 1966 р. Трохи заглядав у це, проте я не бачив жодної недавньої. Я, можливо, з того часу змінилися? jstor.org/discover/10.2307/…
Етьєн Низький Декарі

Будь ласка, повідомте мене, якщо ви вирішили пройти цей маршрут.
Етьєн Лоу-Декарі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.