Запитання з тегом «model-selection»

Вибір моделі - це проблема визначити, яка модель з якогось набору працює найкраще. Популярні методи включають критерії , AIC та BIC, тестові набори та перехресну перевірку. В якійсь мірі вибір функції є підпроблемою вибору моделі. R2

3
Коли доцільно вибирати моделі, мінімізуючи AIC?
Принаймні встановлено, принаймні серед статистиків деякого вищого калібру, що моделі зі значеннями статистики AIC у межах певного порогового значення мінімального значення слід вважати відповідними як модель мінімізації статистики AIC. Наприклад, у [1, с.221] знаходимо Тоді найкращими будуть вважатися моделі з невеликим GCV або AIC. Звичайно, не слід просто сліпо мінімізувати …

1
Вибір байесівської моделі в PyMC3
Я використовую PyMC3 для запуску моделей Bayesian на моїх даних. Я новачок у байєсівському моделюванні, але, згідно з повідомленнями в деяких блогах , Вікіпедії та QA з цього сайту, здається, що це правильний підхід до використання коефіцієнта Байєса та критерію BIC, щоб можна було вибрати, яка модель найкраще представляє мої …

1
Як вибрати найкраще відповідність без переналежних даних? Моделювання бімодального розподілу з N нормальних функцій тощо
У мене очевидно бімодальний розподіл значень, до якого я прагну відповідати. Дані можуть добре відповідати або з 2 нормальними функціями (бімодальними), або з 3 нормальними функціями. Крім того, існує правдоподібна фізична причина для відповідності даних 3. Чим більше параметрів буде введено, тим досконалішим буде прилягання, оскільки при достатній кількості констант …

1
Вибір моделі в режимі офлайн та онлайн-навчання
Останнім часом я намагаюся дізнатися більше про онлайн-навчання (це абсолютно захоплююче!), І одна тема, яку мені не вдалося зрозуміти, - як думати про вибір моделі в офлайні та в Інтернеті. В Зокрема, припустимо , що ми тренуємо класифікатор в автономному режимі, на основі деякого фіксованого набору даних . Скажімо, його …

1
Що робити, коли значення AIC низькі та приблизно рівні?
Кріс Чатфілд, чиї багато якісних книг і паперів мені подобалось читати, в (1) дає такі поради: Наприклад, вибір між моделями часового ряду ARIMA з низькими та приблизно рівними значеннями AIC повинен бути, мабуть, зроблений, не за тим, що відбувається, щоб дати мінімальний показник AIC, а за тим, який дає найкращі …

5
Що робити з колінеарними змінними
Відмова: Це для домашнього завдання. Я намагаюся придумати найкращу модель для ціни на алмази, залежно від кількох змінних, і, здається, поки що у мене досить гарна модель. Однак я зіткнувся з двома змінними, які, очевидно, колінеарні: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 Depth -0.41035485 1.00000000 …

1
Вибір моделі ABC
Було показано , що вибір моделі ABC з використанням Байеса чинників не рекомендується з - за наявності помилки , що надходить з використання зведеної статистики. Висновок у цій роботі спирається на вивчення поведінки популярного методу апроксимації фактора Байєса (Алгоритм 2). Добре відомо, що фактори Байєса - не єдиний спосіб проведення …

2
Узагальнений тест коефіцієнта ймовірності журналу для моделей, які не вкладені
Я розумію, що якщо у мене дві моделі A і B і A вкладено в B, то, зважаючи на деякі дані, я можу підігнати параметри A і B за допомогою MLE і застосувати узагальнений тест коефіцієнта ймовірності журналу. Зокрема, розподіл тесту повинно бути з ступенями свободи , де є різниця …

2
Перевага LASSO над вибором / усуненням вперед в плані похибки прогнозування перехресної перевірки моделі
Я отримав три зменшених моделі від оригінальної повної моделі за допомогою прямий вибір зворотне усунення Техніка пеналізації L1 (LASSO) Для моделей, отриманих за допомогою вибору вперед / усунення вперед, я отримав перехресну перевірену оцінку помилки прогнозування за допомогою CVlmпакету, DAAGдоступного в R. Для моделі, обраної через LASSO, я використовував cv.glm. …

1
У чому полягає принципова відмінність цих двох регресійних моделей?
Припустимо, у мене є біваріантні відповіді зі значною кореляцією. Я намагаюся порівняти два способи моделювання цих результатів. Один із способів полягає в моделюванні різниці між двома результатами: Іншим способом є використання або моделювання їх: (yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) Ось foo приклад: #create foo data frame require(mvtnorm) require(reshape) set.seed(123456) sigma <- matrix(c(4,2,2,3), ncol=2) y …

3
Порівняння вкладених моделей бінарної логістичної регресії, коли велике
Щоб краще задати своє запитання, я надав деякі результати як з 16 змінної моделі ( fit), так і з 17 змінною моделлю ( fit2) нижче (всі змінні прогнозувальника в цих моделях є безперервними, де єдиною відмінністю між цими моделями є те, fitщо не містять змінну 17 (var17)): fit Model Likelihood …

1
Порівняння розподілів продуктивності узагальнення
Скажіть, що у мене є два методи навчання проблеми класифікації , і , і я оцінюю їх узагальнюючу ефективність чимось на зразок повторної перехресної перевірки або завантаження. З цього процесу я отримую розподіл балів та для кожного методу через ці повтори (наприклад, розподіл значень AUC ROC для кожної моделі).Б П …

1
Фактори Байєса з неправильними пріорами
У мене є питання щодо порівняння моделі за допомогою факторів Байєса. У багатьох випадках статистики зацікавлені в застосуванні байєсівського підходу з невідповідними пріорами (наприклад, деякими приорами Джеффріса та рефератами). Моє запитання: у тих випадках, коли задній розподіл параметрів моделі чітко визначений, чи справедливо порівнювати моделі з використанням факторів Байєса при …

1
Запитання щодо визначення лінійних змішаних моделей у R для даних повторних вимірювань з додатковою структурою вкладення
Структура даних > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 6.9 8.9 …

2
Стабільність моделі в перехресній валідації регресійних моделей
З огляду на множину перехресних перевірок логістичної регресії та отримані множинні оцінки кожного коефіцієнта регресії, як слід вимірювати, чи є прогноктор (чи набір предикторів) стійким та значущим на основі коефіцієнтів (ів) регресії ? Чи відрізняється це від лінійної регресії?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.