Запитання з тегом «model-selection»

Вибір моделі - це проблема визначити, яка модель з якогось набору працює найкраще. Популярні методи включають критерії , AIC та BIC, тестові набори та перехресну перевірку. В якійсь мірі вибір функції є підпроблемою вибору моделі. R2

1
Відповідні залишкові ступені свободи після випадання умов з моделі
Я розмірковую над дискусією навколо цього питання і, зокрема, зауваженням Френка Харрелла про те, що для оцінки дисперсії у зменшеній моделі (тобто такої, з якої було випробувано та відхилено ряд пояснювальних змінних), слід використовувати Узагальнені ступені свободи . Професор Гаррелл зазначає, що це буде набагато ближче до залишкових ступенів свободи …

3
Чи може AIC порівнювати різні моделі?
Я використовую AIC (інформаційний критерій Akaike) для порівняння нелінійних моделей у Р. Чи справедливо порівняти АПК різних типів моделі? Зокрема, я порівнюю модель, встановлену glm, порівняно з моделлю з терміном випадкового ефекту, встановленим glmer (lme4). Якщо ні, чи існує таке порівняння? Або ідея повністю недійсна?

4
Як виміряти / класифікувати "змінну важливість" при використанні CART? (зокрема, використовуючи {rpart} з R)
Створюючи модель CART (конкретно дерево класифікації) за допомогою rpart (в R), часто цікаво знати, яке значення мають різні змінні, що вводяться в модель. Отже, моє запитання таке: які спільні заходи існують для ранжирування / вимірювання значущості важливості змінних, що беруть участь у моделі CART? І як це можна обчислити за …

3
Передумови порівняння моделі AIC
Які саме передумови необхідно виконати для порівняння моделі AIC з роботою? Я щойно зіткнувся з цим питанням, коли робив порівняння так: > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] 14277.29 Таким чином я виправдав logперетворення змінної usili. Але я …

4
Вирішення невизначеності моделі
Мені було цікаво, як байєси в спільноті CrossValided розглядають проблему невизначеності моделі та як вони вважають за краще вирішувати її? Я спробую поставити своє запитання у двох частинах: Наскільки важливо (на ваш досвід / думку) стосується невизначеності моделі? Я не знайшов жодного документу, який би займався цим питанням, у спільноті …

5
У чому полягає перевага розгляду фактора як випадкового в змішаній моделі?
У мене є проблема з перевагами позначення фактора моделі як випадкового з кількох причин. Мені здається, що майже у всіх випадках оптимальним рішенням є трактування всіх факторів як фіксованих. По-перше, відмінність фіксованого проти випадкового є досить довільною. Стандартне пояснення полягає в тому, що якщо хтось зацікавлений у конкретних експериментальних одиницях …

4
Чи є у вас глобальне бачення цих методів аналізу?
Зараз я працюю над проектом, де мені в основному потрібно, як і ми, щоб зрозуміти, як результат пов'язаний з введенням x . Особливість тут полягає в тому, що дані ( y , x ) надаються мені по одному фрагменту, тому я хочу оновлювати свій аналіз кожен раз, коли я отримую …

2
Стабільність теми в моделях тем
Я працюю над проектом, де хочу отримати деяку інформацію про зміст серії відкритих нарисів. У цьому конкретному проекті 148 осіб написали нариси про гіпотетичну студентську організацію як частину більшого експерименту. Хоча в моїй галузі (соціальна психологія) типовим способом аналізу цих даних було б кодування есе вручну, я б хотів це …

3
AIC проти перехресної перевірки у часових рядах: невеликий зразок зразка
Мене цікавить вибір моделі в налаштуваннях часових рядів. Для конкретності, припустимо, я хочу вибрати модель ARMA з пулу моделей ARMA з різними порядками відставання. Кінцевим наміром є прогнозування . Вибір моделі може здійснити компанія перехресне підтвердження, використання інформаційних критеріїв (AIC, BIC), серед інших методів. Роб Дж. Хайндман пропонує спосіб зробити …

2
Чому доказ Вілкса 1938 р. Не працює для неправильно визначених моделей?
У відомому документі 1938 р. (" Великий вибірковий розподіл коефіцієнта ймовірності для тестування складених гіпотез ", "Анали математичної статистики", 9: 60-62) Семюел Вілкс отримав асимптотичний розподіл у (коефіцієнт вірогідності журналу) для вкладених гіпотез, при припущенні, що більша гіпотеза правильно вказана. Обмежуючим розподілом є (chi-квадрат) з ступенями свободи, де - кількість …

4
Коли застосовні результати Шао щодо перехресної перевірки відпустки один раз?
У своїй роботі " Вибір лінійної моделі шляхом перехресної валідації" Джун Шао показує, що для задачі вибору змінної при багатоваріантній лінійній регресії метод перехресної валідації "відхід один-один" (LOOCV) є "асимптотично несуперечливим". Простий англійською мовою, як правило, вибирають моделі із занадто великою кількістю змінних. У симуляційному дослідженні Шао показує, що навіть …

1
Вибір серед правильних правил скорингу
Більшість ресурсів на правильних правилах балів згадує низку різних правил скорингу, такі як втрата журналу, оцінка Brier або сферичне оцінювання. Однак вони часто не дають великих рекомендацій щодо відмінностей між ними. (Виставка А: Вікіпедія .) Вибір моделі, яка максимально збільшує логарифмічну оцінку, відповідає вибору моделі максимальної ймовірності, що здається хорошим …

3
Стабільність моделі при вирішенні великої , малої проблеми
Вступ: У мене є набір даних із класичною "великою р, малою російською проблемою". Кількість доступних вибірок n = 150, тоді як кількість можливих предикторів p = 400. Результатом є суцільна змінна. Я хочу знайти найважливіші дескриптори, тобто ті, які є найкращими кандидатами для пояснення результату та допомоги в побудові теорії. …

2
Кращий підхід для вибору моделі байесівської або перехресної перевірки?
Коли я намагаюся вибрати серед різних моделей або кількість функцій, які слід включити, скажімо, передбачення, я можу придумати два підходи. Розподіліть дані на навчальні та тестові набори. Ще краще, використовуйте завантажувальну чи перехресну перевірку k-кратну кількість разів. Тренуйтеся на навчальному наборі щоразу і обчислюйте помилку над тестовим набором. Помилка тесту …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.