Запитання з тегом «bias»

Різниця між очікуваним значенням оцінки параметра та справжнім значенням параметра. НЕ використовуйте цей тег для позначення [упередженого терміна] / [перемикання-вузол] (тобто [перехоплення]).

3
Рідкісні похибки логістичної регресії: як імітувати занижені р з мінімальним прикладом?
У CrossValidated є кілька запитань щодо того, коли і як застосувати виправлення зміщення рідкісних подій Кінгом і Дзенгом (2001) . Я шукаю щось інше: мінімальна демонстрація на основі симуляції того, що упередженість існує. Зокрема, Кінг і Дзенг "... у даних про рідкісні події ухили до ймовірностей можуть мати істотне значення …

1
Коли слово «ухил» був придуманий для середнього
Коли слово "упередженість" було введено у значення ?E[θ^−θ]E[θ^−θ]\mathbb{E}[\hat{\theta}-\theta] Причина, чому я зараз думаю про це зараз, полягає в тому, що, здається, я згадую Джейнеса в його тексті теорії ймовірності , критикуючи вживання слова "упередженість", яке використовується для опису цієї формули, і пропоную альтернативу. З теорії ймовірності Джейнеса , розділ 17.2 …

7
Об'єктивні дані в машинному навчанні
Я працюю над проектом машинного навчання з даними, які вже (сильно) упереджені підбором даних. Припустимо, у вас є набір жорстко закодованих правил. Як ви будуєте модель машинного навчання для її заміни, коли всі дані, які вона може використовувати, - це дані, які вже відфільтровані за цими правилами? Щоб зрозуміти, я …

2
Чи є графічне зображення компромісу дисперсії зміщення в лінійній регресії?
Я страждаю від затемнення. Мені було подано наступне зображення, щоб продемонструвати компроміс-відхилення в контексті лінійної регресії: Я можу бачити, що жодна з двох моделей не підходить. "Прості" не оцінюють складність XY-відношення, а "комплекс" - це просто надмірно, в основному вивчаючи дані тренувань напам'ять. Однак я цілком не бачу упередженості та …

6
Чи є приклад, коли MLE виробляє упереджену оцінку середнього?
Чи можете ви навести приклад оцінки MLE середнього значення, яке є упередженим? Я не шукаю прикладу, який загалом порушує оцінювачі MLE, порушуючи умови регулярності. Усі приклади, які я бачу в Інтернеті, відносяться до дисперсії, і я не можу знайти щось, що стосується середнього. EDIT @MichaelHardy подав приклад, коли ми отримуємо …

1
Опущені змінні зміщення в логістичній регресії порівняно з опущеними змінними зміщеннями в звичайній регресії найменших квадратів
У мене є питання про опущені змінні зміщення в логістичній та лінійній регресії. Скажімо, я опускаю деякі змінні з лінійної регресійної моделі. Прикиньте, що ці опущені змінні не співвідносяться зі змінними, які я включив у свою модель. Ці опущені змінні не зміщують коефіцієнтів у моїй моделі. Але в рамках логістичної …

2
Питання про відхилення відхилення відхилення
Я намагаюся зрозуміти компромісію зміщення зміщення, співвідношення між зміщенням оцінювача та зміщенням моделі та співвідношення між дисперсією оцінювача та дисперсією моделі. Я прийшов до таких висновків: Ми схильні перевищувати дані, коли ми нехтуємо зміщенням оцінювача, тобто тоді, коли ми прагнемо лише мінімізувати зміщення моделі, нехтуючи дисперсією моделі (іншими словами, ми …

1
Мінімізація упередженості в пояснювальному моделюванні, чому? (Галіта Шмулі «Пояснити або передбачити»)
Це питання посилається на статтю Галіта Шмулі "Пояснити чи передбачити" . Зокрема, у розділі 1.5 "Пояснення та передбачення різні" професор Шмуелі пише: У роз'яснювальному моделюванні основна увага приділяється мінімізації зміщення для отримання найбільш точного подання основної теорії. Це спантеличувало мене кожного разу, коли я читав статтю. У якому сенсі мінімізація …

4
Чому дерево рішень має низький ухил та велику дисперсію?
Запитання Це залежить від того, чи є дерево дрібним чи глибоким? Або ми можемо сказати це незалежно від глибини / рівнів дерева? Чому ухил низький і дисперсія висока? Будь-ласка, поясніть інтуїтивно та математично

3
Чи насправді потрібно включати "всіх відповідних прогнозів?"
Основним припущенням використання регресійних моделей для висновку є те, що "всі відповідні предиктори" були включені в рівняння прогнозування. Обґрунтування полягає в тому, що невключення важливого фактору реального світу призводить до упереджених коефіцієнтів і, отже, неточних висновків (тобто пропущених змінних зміщень). Але в дослідницькій практиці я ніколи не бачив нікого, включаючи …

2
Висока дисперсія перехресної валідації "відхилення"
Я знов і знов читав, що перехресне підтвердження "Вихід-один-вихід" має велику дисперсію через велике перекриття тренувальних складок. Однак я не розумію, чому це так: чи не повинно виконання крос-валідації бути дуже стабільним (низька дисперсія) саме тому, що навчальні набори майже однакові? Або я взагалі неправильно розумію поняття "дисперсія"? Я також …

1
Випадкова проблема параметрів
Я завжди борюся за те, щоб отримати справжню суть проблеми випадкових параметрів. Я кілька разів читав, що оцінювачі фіксованих ефектів нелінійних моделей даних на панелі можуть бути сильно упередженими через "добре відому" проблему випадкових параметрів. Коли я прошу чіткого пояснення цієї проблеми, типовою відповіддю є: Припустимо, що дані панелі мають …

2
Для яких моделей зміщення MLE падає швидше, ніж дисперсія?
& Thetasθ^\hat\theta ; & thetas*θ∗\theta^*пnn‖ˆθ−θ∗‖∥θ^−θ∗∥\lVert\hat\theta-\theta^*\rVertO(1/√n)O(1/n−−√)O(1/\sqrt n)‖Eˆθ−θ∗‖∥Eθ^−θ∗∥\lVert \mathbb E\hat\theta - \theta^*\rVert‖Eˆθ−ˆθ‖∥Eθ^−θ^∥\lVert \mathbb E\hat\theta - \hat\theta\rVertO(1/√n)O(1/n−−√)O(1/\sqrt{n}) Мене цікавлять моделі, які мають ухил, який скорочується швидше, ніж , але де помилка не зменшується з такою швидкістю, оскільки відхилення все ще скорочується як . Зокрема, я хотів би знати достатні умови, щоб ухил моделі …

4
Упередженість у виборі журі?
Друг представляє клієнта в апеляційному порядку після кримінального судового розгляду, в якому виявляється, що вибір присяжних був расовим упередженням. Публічний склад журі складався з 30 осіб у 4 расових групах. Обвинувачення застосувало необов'язкові виклики, щоб усунути 10 людей із пулу. Кількість людей та кількість актуальних проблем у кожній расовій групі …

2
Чи поступова регресія забезпечує упереджену оцінку r-квадрата населення?
У психології та інших сферах часто застосовується форма ступінчастої регресії, яка передбачає наступне: Подивіться на провідники, що залишилися (спочатку їх у моделі немає) та визначте предиктор, що призводить до найбільшої зміни r-квадрата; Якщо p-значення зміни r-квадрата менше альфа (зазвичай .05), тоді включіть цей предиктор і поверніться до кроку 1, інакше …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.