Запитання з тегом «regression-strategies»

Стратегії моделювання регресії

8
Коли в лінійній регресії доцільно використовувати журнал незалежної змінної замість фактичних значень?
Я шукаю кращого розподілу для незалежної змінної, про яку йдеться, або для зменшення ефекту людей, що переживають люди, або чогось іншого?

7
Яка користь від розриву суцільної змінної предиктора?
Мені цікаво, яке значення має взяття суцільної змінної предиктора та розбиття його (наприклад, на квінтили), перш ніж використовувати його в моделі. Мені здається, що, поширюючи змінну, ми втрачаємо інформацію. Це просто так, щоб ми могли моделювати нелінійні ефекти? Якби ми зберігали змінну безперервною, і це насправді не було прямим лінійним …

3
Чи може бути використаний випадковий ліс для вибору ознак при множинній лінійній регресії?
Оскільки РФ може обробляти нелінійність, але не може надати коефіцієнтів, чи було б розумно використовувати випадковий ліс для збору найважливіших характеристик, а потім підключити ці функції до множинної лінійної регресійної моделі для отримання їх коефіцієнтів?

5
Перевищення логістичної регресійної моделі
Чи можливо перевиконати модель логістичної регресії? Я побачив відео, яке говорить про те, що якщо моя площа під кривою ROC вище 95%, то, швидше за все, це буде надмірно встановленим, але чи можна переоцінити логістичну регресійну модель?

1
Відповідні залишкові ступені свободи після випадання умов з моделі
Я розмірковую над дискусією навколо цього питання і, зокрема, зауваженням Френка Харрелла про те, що для оцінки дисперсії у зменшеній моделі (тобто такої, з якої було випробувано та відхилено ряд пояснювальних змінних), слід використовувати Узагальнені ступені свободи . Професор Гаррелл зазначає, що це буде набагато ближче до залишкових ступенів свободи …

3
Оцінка логістичної регресії та інтерпретації Хосмера-Лемешоу Goodness of Fit
Як ми всі знаємо, існує 2 методи оцінки логістичної регресійної моделі, і вони тестують дуже різні речі Прогнозова сила: Отримайте статистику, яка вимірює, наскільки добре ви можете передбачити залежну змінну на основі незалежних змінних. Добре відомі псевдо R ^ 2 - Макфадден (1974) і Кокс і Снелл (1989). Статистика придатності …

2
Чи слід навчати остаточну модель, готову до виробництва, за повними даними чи просто на навчальному наборі?
Припустимо, я тренував кілька моделей на навчальному наборі, вибирав найкращу, використовуючи набір перехресних перевірок і вимірював продуктивність на тестовому наборі. Тож тепер у мене є одна остаточна найкраща модель. Чи повинен я перекваліфікувати його на всіх своїх наявних даних або на суднових рішеннях, що навчаються лише на навчальному наборі? Якщо …

5
Коли квантильна регресія гірша за OLS?
Окрім деяких унікальних обставин, коли ми абсолютно повинні розуміти умовно-середній взаємозв'язок, які існують ситуації, коли дослідник повинен обрати OLS над квантильною регресією? Я не хочу, щоб відповідь була "якщо немає користі в розумінні хвостових відносин", оскільки ми могли просто використовувати середню регресію в якості замінника OLS.

2
Байесівські думки про переодягнення
Я багато часу приділяв розробці методів та програмного забезпечення для перевірки прогнозних моделей у традиційній періодичній статистиці. Втілюючи в життя більше ідей Баєса, я бачу деякі ключові відмінності. По-перше, байєсівське прогностичне моделювання просить аналітика подумати над попередніми розподілами, які можуть бути налаштовані під особливості кандидата, і ці пріори підтягнуть модель …

2
Чи страждає LASSO від тих самих проблем поетапна регресія?
Покрокові алгоритмічні методи вибору змінних мають тенденцію вибирати для моделей, які зміщують більш-менш кожну оцінку в регресійних моделях ( s та їх SE, p -значення, F- статистика тощо), і приблизно так само ймовірно виключають справжні прогнози, як включають помилкові прогнози відповідно до досить зрілої імітаційної літератури.ββ\beta Чи страждає LASSO тими …

1
Що означає зробити розмір вибірки випадковою змінною?
Френк Харрелл запустив блог ( статистичне мислення) . У своєму прем'єрському посту він перераховує деякі ключові риси його статистичної філософії. Серед інших предметів він включає: Зробіть розмір вибірки випадковою змінною, коли це можливо Що означає "зробити розмір вибірки випадковою змінною"? Які переваги цього робити? Чому це може бути кращим?

3
Побудова та вибір моделей за допомогою Hosmer et al. 2013. Прикладна логістична регресія в R
Це моє перше повідомлення в StackExchange, але я використовую його як ресурс досить довгий час, я зроблю все можливе, щоб використовувати відповідний формат і внести відповідні зміни. Також це багатозначне питання. Я не був впевнений, чи варто розділити це питання на кілька різних постів або лише на одну. Оскільки всі …

5
Чи можна ігнорувати коефіцієнти для несуттєвих рівнів факторів у лінійній моделі?
Після пошуку роз’яснень щодо коефіцієнтів лінійної моделі тут у мене з’являється додаткове запитання щодо не-значущого (високого значення p) для коефіцієнтів рівнів факторів. Приклад: Якщо моя лінійна модель включає коефіцієнт з 10 рівнями, і лише 3 з цих рівнів мають значні значення p, пов'язані з ними, при використанні моделі для прогнозування …

4
Які змінні пояснюють, які компоненти PCA, і навпаки?
Використовуючи ці дані: head(USArrests) nrow(USArrests) Я можу зробити PCA так: plot(USArrests) otherPCA <- princomp(USArrests) Я можу отримати нові компоненти otherPCA$scores і частка дисперсії, поясненої компонентами з summary(otherPCA) Але що робити, якщо я хочу знати, які змінні в основному пояснюються основними компонентами? І навпаки: пояснюється, наприклад, PC1 або PC2 murder? Як …

2
Чи можемо ми використовувати категоричну незалежну змінну в дискримінантному аналізі?
У дискримінантному аналізі залежна змінна є категоричною, але чи можу я використовувати категоричну змінну (наприклад, житловий стан: сільський, міський) разом з якоюсь іншою суцільною змінною як незалежну змінну в лінійному дискримінантному аналізі?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.