Сирі залишки порівняно з стандартизованими залишками проти залишків, що вивчаються студентами - що використовувати коли?

Це схоже на подібне запитання і не отримало багато відповідей.

Пропускаючи тести, такі як Кук Д, і просто дивлячись на залишки як на групу, мене цікавить, як інші використовують залишки під час оцінки придатності. Я використовую залишки сировини:

у QQ-графіку для оцінки нормальності
у розсіюванні відносно залишків, для перевірки очним яблуком (a) гетерооскедастичності та (b) серійної автокореляції. $y$

Для побудови графіку проти залишків для вивчення значень де можуть виникати залишки , я вважаю за краще використовувати студизовані залишки . Причина мого уподобання полягає в тому, що вона дозволяє легко переглядати, які залишки, при яких є проблематичними, хоча стандартизовані залишки дають надзвичайно подібний результат. Моя теорія, за якою використовується, полягає в тому, що це залежить від того, в який університет пішов. $y$ $y$ $y$

Це схоже на те, як інші використовують залишки? Чи інші використовують цю кількість графіків у поєднанні з підсумковою статистикою?

goodness-of-fit residuals

— Мішель
джерело

Вивчені залишки, безумовно, кращі при виявленні інших людей, і, можливо, трохи кращі при обстеженні гетероседастичності. Для інших цілей для мене немає ніякої різниці, які залишки використовувати.

— ttnphns

Щоб привернути увагу до питання, Мішель, або попросити змінити його статус (наприклад, CW), перейдіть за посиланням "прапор" під питанням. Про це автоматично повідомлять усі модератори. Вставлення запитів у запитання, коментарі чи відповіді - це хіт-пропуск, оскільки він покладається на сподівання, що модератор (або інший користувач з високою реплікацією) насправді прочитає його протягом розумного часу!

— whuber

@whuber Ах, дивіться, я думав, що хтось із вас його зрештою прочитає. :) Дякую за пораду щодо використання прапорів.

— Мішель

Привіт @ttnphns Чому б їм було краще? Зокрема, чому студентизовані будуть краще, ніж стандартизовані? (Я ніколи не знав відповіді тут)

— Пітер Флом - Відновіть Моніку

@ Петер, Студенізовані залишки менш «спотворені» OLS, що підходить, і ближче до теоретичного поняття «помилки» . Їх можна безпосередньо порівняти в різних областях підходящої лінії, і тоді краще прийняти рішення, якщо крапка не відповідає.

— ttnphns

Відповіді:

Це не стільки відповідь, скільки уточнення термінології. Ваше запитання задає питання щодо залишків сировини, стандартизації та студійності. Однак це не термінологія, якою користується більшість статистиків, хоча зауважу, ваші записки класу стверджують, що це так.

Сире: те саме, що у вас є.

Стандартизовано: це фактично залишки сировини, поділені на справжнє стандартне відхилення залишків. Оскільки справжнє стандартне відхилення відомо рідко, стандартизований залишок майже ніколи не використовується.

Внутрішньо вивчений: оскільки справжнє стандартне відхилення залишків зазвичай не відомо, замість цього використовується оціночне стандартне відхилення. Це залишковий штампований залишок, і це те, що ви назвали стандартизованим.

Зовнішньо досліджений: такий самий, як і внутрішньо ступінований залишок, за винятком того, що оцінка стандартного відхилення залишків обчислюється за допомогою регресії, що не виключає спостереження.

Пірсон: сирий залишок, поділений на стандартне відхилення змінної реакції (змінної y), а не залишків. У вас немає цього в списку.

"залишити один": Не має формальної назви, але це те саме, що і нотатки класу.

стандартизований "залишити один": також не має формальної назви, але це не те, що нотатки класу називають студійними.

Джерела:

те саме посилання на вікі, яке ви маєте щодо студенізованих залишків ("студентизований залишок - це коефіцієнт, що виникає в результаті поділу залишку за оцінкою його стандартного відхилення")
документація на залишковий розрахунок в SAS

— Майкл Куні
джерело

+1 Звичайно, деякі статистики використовували терміни у питанні про ОП (і не завжди цілком відповідали іншим, використовуючи ті самі слова). Я думаю, що терміни, які ви використовуєте, стають все більш поширеними, але я не впевнений, за якою ознакою ми могли б здогадатися про їх відносно всесвітнє використання серед статистиків - наприклад, документи не обов'язково допомагають, оскільки середній статистик не буде активно видавнича справа. Ви можете мати рацію - але як би ми знали? [Якщо ви повторно редагуєте, можливо, ви захочете замінити "стандартизований" майже в кінці на "стандартизований".]

— Glen_b -Встановити Моніку

Re: сюжети,

Існує таке поняття, як переобладнання, але перезволоження насправді не може принести великої шкоди, особливо на етапі діагностики. Стандартизований графік нормальної ймовірності не може зашкодити поруч із вашим QQ-графіком. Мені краще оцінити середину розподілу.

Re: залишки,

Я запускаю як стандартизовані, так і студизовані залишки на етапі проектування, і зазвичай закінчую кодування стандартизованих. Я не знаю, чим насправді керують інші люди, оскільки діагностика дійсно закодована в матеріалі реплікації, який я знаходжу в Інтернеті.

Re: діагностика,

vifhettest $R^2$

— О.
джерело