Запитання з тегом «model-selection»

Вибір моделі - це проблема визначити, яка модель з якогось набору працює найкраще. Популярні методи включають критерії , AIC та BIC, тестові набори та перехресну перевірку. В якійсь мірі вибір функції є підпроблемою вибору моделі. R2

1
Чи залишаються автокорельовані залишкові візерунки навіть у моделях з відповідними структурами кореляції, і як вибрати найкращі моделі?
Контекст Це питання використовує R, але стосується загальних статистичних питань. Я аналізую вплив факторів смертності (% смертності від хвороб та паразитизму) на швидкість зростання популяції молі протягом часу, де популяції личинок відбирали з 12 місць раз на рік протягом 8 років. Дані про темпи приросту населення показують чітку, але нерегулярну …

1
Як побудувати остаточну модель та налаштувати поріг ймовірності після вкладеної перехресної перевірки?
По-перше, вибачення за розміщення питання, про яке вже обговорювались тут , тут , тут , тут , тутта для повторного розігрівання старої теми. Я знаю, що @DikranMarsupial досить довго писав про цю тему у публікаціях та журнальних статтях, але я все ще плутаюся, і, судячи з кількості подібних публікацій тут, …

2
Чи правильно використовувати кореляційну матрицю для вибору предикторів регресії?
Кілька днів тому мій психолог-дослідник розповів мені про свій метод вибору змінних до лінійної регресійної моделі. Я думаю, що це не добре, але мені потрібно попросити когось іншого, щоб переконатися. Метод: Подивіться на кореляційну матрицю між усіма змінними (включаючи залежну змінну Y) і виберіть ті предиктори Xs, які найбільше співвідносяться …

1
Чому інформаційний критерій Akaike більше не використовується в машинному навчанні?
Я щойно натрапив на "критерій інформації Akaike", і я помітив цю велику кількість літератури щодо вибору моделі (також такі речі, як BIC, здається, існують). Чому сучасні методи машинного навчання не скористаються цими критеріями вибору моделі BIC та AIC?

1
Чи є приватний лідер Kaggle хорошим прогнозувачем ефективності виграшної моделі поза зразком?
Хоча результати приватного тестового набору не можуть бути використані для подальшого вдосконалення моделі, чи не є вибір моделі з величезної кількості моделей на основі результатів приватного тестового набору? Чи не вдалося б ви, лише через цей процес, прилаштуватись до приватного тестового набору? Відповідно до "Псевдоматематики та фінансового шарлатанізму: Вплив перенапруження …

1
Проблема з визначенням порядку ARIMA
Це довгий пост, тому я сподіваюся, що ви можете перенести зі мною, і, будь ласка, виправте мене там, де я помиляюся. Моя мета - складати щоденний прогноз на основі 3 або 4 тижнів історичних даних. Дані - це 15-хвилинні дані локального навантаження однієї з трансформаторних ліній. У мене виникають проблеми …

7
Що таке визначення "найкращий", як використовується у терміні "найкраще" та перехресне підтвердження?
Якщо ви встановите нелінійну функцію до набору точок (якщо вважати, що для кожної абсциси є лише одна ордината), результат може бути: дуже складна функція з невеликими залишками дуже проста функція з великими залишками Перехресне підтвердження зазвичай використовується для пошуку "найкращого" компромісу між цими двома крайнощами. Але що означає "найкраще"? Це …

1
Який багаторазовий метод порівняння використовувати для lmer-моделі: lsmeans або glht?
Я аналізую набір даних, використовуючи модель змішаних ефектів з одним фіксованим ефектом (умовою) та двома випадковими ефектами (учасник, обумовлений в рамках проекту та пари). Модель була згенерована з lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Далі я провів перевірку коефіцієнта ймовірності цієї моделі проти моделі без фіксованого ефекту (умови) і маю суттєву різницю. У моєму …

5
Чи можна ігнорувати коефіцієнти для несуттєвих рівнів факторів у лінійній моделі?
Після пошуку роз’яснень щодо коефіцієнтів лінійної моделі тут у мене з’являється додаткове запитання щодо не-значущого (високого значення p) для коефіцієнтів рівнів факторів. Приклад: Якщо моя лінійна модель включає коефіцієнт з 10 рівнями, і лише 3 з цих рівнів мають значні значення p, пов'язані з ними, при використанні моделі для прогнозування …

2
LASSO / LARS проти загального до конкретного (GETS) методу
Мене цікавить, чому методи вибору моделі LASSO та LARS настільки популярні, хоча вони в основному є лише варіаціями поетапного вибору вперед (і, отже, страждають від залежності від шляху)? Аналогічно, чому загальновиробничі (GETS) методи вибору моделі здебільшого ігноруються, хоча вони й краще, ніж LARS / LASSO, оскільки вони не страждають від …

4
Порівнюючи моделі змішаного ефекту з однаковою кількістю ступенів свободи
У мене є експеримент, який я спробую тут абстрагувати. Уявіть, що я кидаю три білі камені перед вами і прошу вас зробити судження про їхню позицію. Я фіксую різноманітні властивості каменів і вашу відповідь. Я роблю це над низкою предметів. Я генерую дві моделі. Одне полягає в тому, що найближчий …

3
Вибір оптимального K для КНН
Я здійснив 5-кратне резюме, щоб вибрати оптимальний K для KNN. І здається, що чим більший K отримує, тим менша помилка ... Вибачте, у мене не було легенди, але різні кольори представляють різні випробування. Всього їх 5, і, здається, між ними мало варіацій. Помилка завжди здається зменшуватися, коли K стає більше. …

1
Як інтерпретувати матрицю коваріації з кривої?
Я не надто великий у статистиці, тому вибачте, якщо це спрощене питання. Я підгонка кривого деяких даних, і іноді мої дані найкраще підходить негативний експоненту у вигляді * е ( - Ь * х ) + з , а іноді підходить ближче до з * е ( - Ь * …

4
Оптимальний вибір штрафу для ласо
Чи існують які - небудь результати аналізів або експериментальні роботи в відношенні оптимального вибору коефіцієнта терміну симуляції. Під оптимальним розумію параметр, який максимально збільшує ймовірність вибору найкращої моделі або мінімізує очікувані втрати. Я запитую, оскільки часто недоцільно обирати параметр шляхом перехресної перевірки або завантажувальної програми, або через велику кількість випадків …

1
Як порівняти моделі на основі AIC?
У нас є дві моделі, які використовують один і той же метод для обчислення ймовірності журналу, і AIC для однієї нижче, ніж для іншої. Однак той із нижчим АПК інтерпретувати набагато складніше. У нас виникають проблеми вирішити, чи варто ввести труднощі, і ми оцінили це, використовуючи відсоткову різницю в АПК. …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.