Запитання з тегом «model-selection»

Вибір моделі - це проблема визначити, яка модель з якогось набору працює найкраще. Популярні методи включають критерії , AIC та BIC, тестові набори та перехресну перевірку. В якійсь мірі вибір функції є підпроблемою вибору моделі. R2

11
Як вибрати кількість прихованих шарів та вузлів у нейромережі подачі?
Чи існує стандартний і прийнятий метод вибору кількості шарів та кількості вузлів у кожному шарі в нейронній мережі, що передається? Мене цікавлять автоматизовані способи побудови нейронних мереж.

11
Чи є якась причина віддавати перевагу AIC або BIC перед іншими?
AIC і BIC - це обидва методи оцінки відповідності моделі, що штрафується за кількістю оцінюваних параметрів. Наскільки я розумію, BIC карає моделі більше за вільні параметри, ніж AIC. Крім переваг, що ґрунтуються на строгості критеріїв, чи є інші причини віддати перевагу AIC перед BIC або навпаки?

3
Як дізнатися, що проблема з машинним навчанням безперспективна?
Уявіть стандартний сценарій машинного навчання: Ви стикаєтесь з великим багатофакторним набором даних і маєте досить розмите розуміння цього. Що вам потрібно зробити, це зробити передбачення щодо якоїсь змінної на основі того, що у вас є. Як завжди, ви очищаєте дані, переглядаєте описову статистику, запускаєте деякі моделі, перехресне підтверджуєте їх тощо, …

8
Алгоритми автоматичного вибору моделі
Я хотів би реалізувати алгоритм автоматичного вибору моделі. Я думаю про поступову регресію, але все, що буде робити (він повинен базуватися на лінійних регресіях). Моя проблема полягає в тому, що я не в змозі знайти методологію чи реалізацію з відкритим кодом (я прокидаюся в Java). Я маю на увазі методологію: …

6
Як вибрати модель прогнозування після перехресної перевірки k-кратної?
Мені цікаво, як вибрати передбачувану модель після того, як зробить перехресну перевірку K-кратну кількість. Це може бути незручно сформульовано, тому дозвольте мені пояснити більш докладно: щоразу, коли я запускаю перехресну перевірку K-кратну кількість, я використовую K підмножини даних тренувань і закінчую K різними моделями. Мені хотілося б знати, як вибрати …

5
Навчання з повним набором даних після перехресної перевірки?
Чи завжди хороша ідея тренуватися з повним набором даних після перехресної перевірки ? Інакше кажучи, чи нормально тренуватися з усіма зразками в моєму наборі даних і не можете перевірити, чи відповідає саме цей примір ? Деякі відомості про проблему: Скажіть, у мене є сімейство моделей, параметризованих . Скажіть також, що …

2
Скільки ми знаємо про p-хакерство «в дикій природі»?
Словосполучення р- хакінг (також: " дноуглублення даних" , "сунуння" або "риболовля") відноситься до різних видів статистичних зловживань, результати яких стають штучно статистично значущими. Існує багато способів досягти "більш значущого" результату, включаючи, але жодним чином не обмежуючись: тільки аналіз «цікаве» підмножина даних , в яких був знайдений зразок; невміння правильно налаштувати …

3
Вкладена перехресна перевірка для вибору моделі
Як можна використовувати вкладені перехресні перевірки для вибору моделі ? З того, що я читаю в Інтернеті, вкладене резюме працює наступним чином: Існує внутрішній цикл резюме, де ми можемо провести пошук по сітці (наприклад, запустивши K-кратно для кожної доступної моделі, наприклад, комбінація гіперпараметрів / функцій) Є зовнішня петля CV, де …

14
Чому надійні (і стійкі) статистичні дані не замінили класичні методи?
При вирішенні бізнес-проблем із використанням даних прийнято вважати, що принаймні одне ключове припущення про те, що класична статистика недостатку не є дійсною. Більшість часу ніхто не намагається перевірити ці припущення, щоб ви насправді ніколи не знали. Наприклад, що так багато загальних веб-метрик є "довгохвостими" (відносно звичайного розповсюдження), на сьогоднішній день …

5
Які сучасні, легко використовувані альтернативи ступінчастій регресії?
У мене є набір даних з близько 30 незалежних змінних і я б хотів побудувати узагальнену лінійну модель (GLM) для дослідження взаємозв'язку між ними та залежною змінною. Я усвідомлюю, що метод, якого я вчив для цієї ситуації, поетапна регресія, зараз вважається статистичним гріхом . Які сучасні методи вибору моделі слід …

6
Варіабельний вибір для прогнозного моделювання дійсно потрібен у 2016 році?
Це питання було задано в CV кілька років тому, але, здається, варто зробити репост з огляду на 1) на порядок кращу обчислювальну технологію (наприклад, паралельні обчислення, HPC тощо) та 2) новіші методи, наприклад [3]. По-перше, якийсь контекст. Припустимо, мета - не тестування гіпотез, не оцінка ефекту, а прогнозування на невидимому …

2
Чому лише три перегородки? (навчання, валідація, тест)
Коли ви намагаєтесь пристосувати моделі до великого набору даних, загальною порадою є розподіл даних на три частини: навчальний, валідаційний та тестовий набір даних. Це пояснюється тим, що моделі зазвичай мають три "рівні" параметрів: перший "параметр" - клас моделі (наприклад, SVM, нейронна мережа, випадковий ліс), другий набір параметрів - параметри "регуляризації" …

2
Більш чітке обговорення варіабельного вибору
Фон Я займаюся клінічними дослідженнями в медицині і пройшов кілька курсів статистики. Я ніколи не публікував папір з використанням лінійної / логістичної регресії і хотів би зробити вибір змінної правильно. Інтерпретабельність є важливою, тому немає фантазійних методик машинного навчання. Я узагальнив своє розуміння варіабельного вибору - чи хтось буде проти …

3
AIC, BIC, CIC, DIC, EIC, FIC, GIC, HIC, IIC - Чи можу я їх використовувати взаємозамінно?
На с. 34 свого PRNN Брайан Ріплі зауважує, що "AIC був названий Akaike (1974)" інформаційним критерієм ", хоча, як видається, вважається, що A означає Akaike". Дійсно, вводячи статистику AIC, Akaike (1974, с.719) пояснює це "IC stands for information criterion and A is added so that similar statistics, BIC, DIC etc …

3
Лінійна модель з перетвореною на логарифмічну реакцію проти узагальненої лінійної моделі з логічним зв'язком
У цій статті під назвою "ВИБОРИ УЗАГАЛЬНЕНИХ ЛІНІЙНИХ МОДЕЛІВ, ЗАСТОСОВАНИХ ДО МЕДИЧНИХ ДАНИХ", автори пишуть: У узагальненій лінійній моделі середнє перетворюється функцією зв’язку замість самої реакції. Два способи трансформації можуть призвести до зовсім різних результатів; наприклад, середнє значення log-трансформованих відповідей не те саме, що логарифм середньої відповіді . Взагалі, колишнього …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.