Запитання з тегом «overfitting»

Помилка моделювання (особливо помилка вибірки) замість повторюваних та інформативних зв’язків між змінними покращує статистику придатності моделі, але зменшує парситивність та погіршує пояснювальну та прогнозовану достовірність.

2
Чи можна (теоретично) тренувати нейронну мережу з меншою кількістю зразків тренувань, ніж ваги?
Перш за все: я знаю, немає загальної кількості розміру вибірки, необхідної для тренування нейронної мережі. Це залежить від занадто багато факторів, таких як складність завдання, шум у даних тощо. І чим більше навчальних зразків у мене буде, тим краще буде моя мережа. Але мені було цікаво: чи теоретично можливо тренувати …

1
Точний тест Фішера та гіпергеометричне поширення
Я хотів краще зрозуміти точний тест Фішера, тому я розробив наступний іграшковий приклад, де f і m відповідає чоловічому та жіночому, а n і y відповідає такому "споживання соди", як це: > soda_gender f m n 0 5 y 5 0 Очевидно, це різке спрощення, але я не хотів, щоб …

1
Як вибрати найкраще відповідність без переналежних даних? Моделювання бімодального розподілу з N нормальних функцій тощо
У мене очевидно бімодальний розподіл значень, до якого я прагну відповідати. Дані можуть добре відповідати або з 2 нормальними функціями (бімодальними), або з 3 нормальними функціями. Крім того, існує правдоподібна фізична причина для відповідності даних 3. Чим більше параметрів буде введено, тим досконалішим буде прилягання, оскільки при достатній кількості констант …

4
Переобладнання лінійних класифікаторів
Сьогодні наш професор на уроці заявив, що "переобладнати лінійними класифікаторами неможливо". Я вважаю, що це неправильно, оскільки навіть лінійні класифікатори можуть бути чутливими до людей, що перебувають у навчальному наборі - візьмімо, наприклад, жорсткий запас підтримки Vector Machine: Один єдиний шумний точок даних може змінити, який гіперплан буде використовуватися для …

1
Чи потребує моделювання з випадковими лісами перехресне підтвердження?
Наскільки я бачив, думки щодо цього зазвичай відрізняються. Найкраща практика, безумовно, диктує використання перехресної перевірки (особливо якщо порівнювати радіочастотні сигнали з іншими алгоритмами на тому ж наборі даних). З іншого боку, першоджерело зазначає, що обчислюється похибка OOB під час навчання моделі є достатньою для показника продуктивності тестового набору. Навіть Тревор …


2
Легке пояснення "чисельної стійкості інверсії матриці" в регресії хребта та його ролі у зниженні надлишків
Я розумію, що ми можемо використовувати регуляризацію в регресії як мінімум квадратів w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2 \right] і що ця проблема має рішення закритої форми як: w^=(XTX+λI)−1XTy.w^=(XTX+λI)−1XTy.\hat{\boldsymbol{w}} = (\boldsymbol{X}^T\boldsymbol{X}+\lambda\boldsymbol{I})^{-1}\boldsymbol{X}^T\boldsymbol{y}. Ми бачимо, що у другому рівнянні регуляризація просто додає λλ\lambda до діагоналі XTXXTX\boldsymbol{X}^T\boldsymbol{X} , що робиться для …

1
Чи насичена модель є особливим випадком переоснащеної моделі?
Я намагаюся зрозуміти, що таке насичена модель. AFAIK - це коли ти маєш стільки ж особливостей, скільки спостережень. Чи можна сказати, що насичена модель - це особливий випадок надзвичайно приталеної моделі?

1
Чому усунення відсталого виправдано при багаторазовій регресії?
Чи це не призводить до надмірної підгонки? Чи були б мої результати більш надійними, якби я додав процедуру підключення ножа або завантажувальну машину до складу аналізу?

2
Зворотне тестування або перехресне підтвердження, коли процес побудови моделі був інтерактивним
У мене є кілька прогнозних моделей, продуктивність яких я хотів би зробити тест зворотним (тобто взяти мій набір даних, "перемотати" його до попереднього моменту часу і побачити, як модель могла б працювати в перспективі). Проблема полягає в тому, що деякі мої моделі були побудовані за допомогою інтерактивного процесу. Наприклад, слідуючи …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.