Як оцінити корисність відповідності певної нелінійної моделі? [зачинено]


10

У мене є нелінійна модель , де Φ cdf стандартного нормального розподілу, а f - нелінійна (див. Нижче). Я хочу перевірити придатність цієї моделі з параметром a до моїх даних ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n )y=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn), використовуючи максимальну оцінку ймовірності, щоб знайти . Що було б відповідним тестом? Я хотів би використати цей тест, щоб позначити поганий приклад як поганий і визначити, чи потрібно збирати більше даних.a

Я розглядав використання відхилення, яке порівнює цю модель з насиченою моделлю, з відповідним її тестом на придатність придатності за допомогою розподілу . Це було б доречно? Більшість того, що я читав про відхилення, стосується цього і для GLM, а це не те, що у мене є. Якщо тест на відхилення є відповідним, які припущення потрібно виконати, щоб зробити тест дійсним?χn12

Оновлення: дляx>1,a>0,якщо це допомагає.f=x1ax2+1x>1,a>0


1
Відповідь залежить від мети аналізу та від основної моделі ймовірності, яку ви використовували; немає єдиної чи найкращої математичної відповіді. Наприклад, ми б виміряли корисність придатності для моделі форми ніж для однієї з форм y = Φ ( f ( x , a ) ) + ε (при iid помилки ε ). y=Φ(f(x,a)+ε)y=Φ(f(x,a))+εε
whuber

Дякую. Я уточнив своє запитання. Я усвідомлюю, що найкращої відповіді немає, однак я все ж хотів би знати, чи відхилення підходить для тестування на придатність тут, і якщо ні, то ще один тест, який би підходив для позначення придатності як дуже погано і говорити, що потрібно зібрати більше даних (якщо припустити, що модель правильна) або сказати, що модель не описує дані.
spadequack

1
Чи є ваша цільова змінна чи вона суцільна? Якщо перша, то ви могли б образити модель як p ( y = 1 ) = Φ ( f ( x , a ) ) замість додавання помилки додавання і порівняти передбачуване з фактичним y = 0 та y = 1, щоб отримати істинні та хибні позитивні показники, або порівняти з базовою моделлю, де p ( y = 1 ) = ˉ yy0,1p(y=1)=Φ(f(x,a))y=0y=1p(y=1)=y¯або відхилення, або кілька інших альтернатив. Якщо останнє, який розподіл ви припускаєте для залишку?
jbowman

1
Голосування про закриття, оскільки запит на роз'яснення не залишився без відповіді.
whuber

Відповіді:


1

Використовуйте пакет "npcmstest" у бібліотеці "NP", якщо ви використовуєте платформу R. Попередження: Функція може зайняти кілька хвилин для оцінки вашої моделі.

Можна також розглянути інформаційно-теоретичне порівняння розподілу відповідей та прогнозного розподілу (тобто дивергенція KL, крос-ентропія тощо)


Здається, що метод вимагає моделі з lmабо glm. Як би це працювало для нелінійної моделі? (Так, я використовую Р.) Я додав, що означає " до свого питання, якщо це допомагає. f
spadequack

@ ви використовуєте gamчи подібне ( mgcvпакет)? Якщо ні, то слід це перевірити.
suncoolsu

1

Ось як я це зробив, в основному тест на коефіцієнт ймовірності. Але пам’ятайте, що вони "ключові" для розуміння корисності тесту на придатність, це розуміння класу альтернатив, проти яких ви тестуєтесь. Тепер у нас є ймовірність для кожної окремої точки даних:

p(yi|xi,a,I)=g(ϵi)=g(yifi)

g(ϵ)fi=xi1axi2+1xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyia


1
O(n)

0

У контексті лінійної регресії корисність тестування на придатність часто проводиться проти більш складної альтернативи. У вас лінійна регресія - киньте кілька поліномних термінів, щоб перевірити, чи достатньо лінійної форми. Оскільки у вас вже є нелінійна функціональна форма, то складною альтернативою, яку вам потрібно було б врахувати, має бути непараметрична регресія . Я не намагатимусь ознайомитись із темою, оскільки це вимагає власного мислення, і варто окремого правильного вступу. Для перевірки параметричних та непараметричних регресій, Вулдрідж (1992) або Хардл і Маммен (1993) , вони роблять дуже подібні речі. Хардле також написав чудову книгу на цю тему.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.