Яка різниця між стандартизацією та студентизацією?


21

Хіба що в стандартизації відома дисперсія, в той час як в студентизацію вона не відома і тому оцінена? Дякую.


2
Ви можете уточнити контекст свого питання. Що це за стандартизація, яка студентизація? Для чого використовуються ці значення?
russellpierce

3
Якщо ви запитуєте про залишки , термінологія не є (гм) стандартизованою . Різні автори використовують різні імена для однієї і тієї ж речі, а іноді - і, на жаль, найбільш заплутано, однакову назву для різних речей. Є то , що я називаю (я) масштабується невязки ( (yy^i)/s , звані стандартизовані залишки деяких автори); (ii) внутрішні студентизовані залишки (називаються стандартизованими одними авторами / пакетами, студентизовані іншими); (iii) видалені ззовні студенти / студентизалишки
Glen_b -Встановіть Моніку

Відповіді:


20

Короткий підсумок. Дано модель y=Xβ+ε , деX являє,і, де- "матриця капелюхів". Залишковими є Дисперсія сукупностіневідома і може бути оцінена за, середньоквадратичною помилкою.β = ( Х ' х ) - 1 х ' у у = Х β = Х ( Х ' х ) - 1 х ' у = Н у Н = Х ( Х ' х ) - 1 х ' е = у - у = у - Н у =n×pβ^=(XX)1Xyy^=Xβ^=X(XX)1Xy=HyH=X(XX)1Xσ 2 M S E

e=yy^=yHy=(IH)y
σ2MSE

Напівдосвідчені залишки визначаються як , оскільки, оскільки дисперсія залишків залежить від та , їх розрахункова дисперсія становить: де - й діагональний елемент матриці капелюхів. сг2ХV(ея)=МЗЕ(1-чяя)чяяя

ei=eiMSE
σ2X
V^(ei)=MSE(1hii)
hiii

Стандартизованими залишками, які також називаються внутрішньо студизованими залишками , є:

ri=eiMSE(1hii)

Однак одиничні та не є незалежними, тому не може мати розподілу. Тоді процедура полягає в тому, щоб видалити е спостереження, привласнити функцію регресії до решти спостережень і отримати нові 's, які можна позначити через . Різниця: називається видаленою залишковою . Еквівалентним виразом, який не потребує перерахунку, є: Позначення нових та через та М З Е Г я т I п - 1 у у я ( я ) d я = у я - у я ( я ) d я = е яeiMSEritin1y^y^i(i)

di=yiy^i(i)
XMSEX(i)MSE(i)iti=di
di=ei1hii
XMSEX(i)MSE(i) , оскільки вони не залежать від го спостереження, отримуємо: В «и називаються стьюдентізірованной (вилучено) залишки , або зовні студизовані залишки .iti
ti=diMSE(i)1hii=eiMSE(i)(1hii)tnp1
ti

Див. Кутнер та ін., Прикладні лінійні статистичні моделі , глава 10.

Редагувати: Треба сказати, що відповідь rpierce ідеальна. Я вважав, що ОП стосується стандартизованих та студизованих залишків (і поділ на стандартне відхилення населення для отримання стандартизованих залишків мені, звичайно, виглядало дивним), але я помилявся. Я сподіваюся, що моя відповідь може комусь допомогти, навіть якщо ОТ.


2
... і ця відповідь правильна при визначенні студизованих залишків з рівняння регресії. Немає визначення відповідного стандартизованого залишку. Здається, рамка регресії не застосовується до заданого питання. Але це все-таки цінний внесок; +1
russellpierce

2
@rpierce, ти маєш рацію: як тільки я прочитав "студентизацію", я також прочитав "залишки", але вони були тільки в моїй думці ;-) Вибачте. Я помітив свій недогляд лише після останнього клацання.
Серхіо

9

У соціальних науках зазвичай говорять , що Studentizated використовує оцінка / розрахунок Госсет в Стьюдента для оцінки дисперсії населення / стандартне відхилення від зразка дисперсії / стандартного відхилення ( ). Навпаки, у стандартизованих балах (іменник, певний тип статистики, оцінка Z) використовується стандартне відхилення сукупності? ( ).σsσ

Однак, схоже, існують деякі термінологічні відмінності між полями (дивіться коментарі до цієї відповіді). Тому слід робити обережно, роблячи ці розрізнення. Більше того, студизовані бали рідко називаються такими, і в типі регресії типово можна побачити «студенізовані» значення. @Sergio надає детальну інформацію про ті типи видалених залишків зі студизованими видами.


2
Вікіпедія додає: "Термін використовується також для стандартизації статистики вищого ступеня за іншою статистикою того ж ступеня: наприклад, оцінка третього центрального моменту буде стандартизована шляхом ділення на куб вибіркового стандартного відхилення. "
Нік Стаунер

2
Я думаю, було б безпечніше сказати, що студентизація - це форма стандартизації, доступна, якщо дисперсія населення невідома. Це набуває форми технічної, термінологічної точки розрізнення, а не оманливого твердження про більш загальний термін, що широко використовується.
Нік Стаунер

2
σ

2
@ Nick Це звучить як гарна резолюція, враховуючи, що різні органи влади широко використовують "стандартизацію", але жодна (AFAIK) ніколи не використовує "studentize" в такому широкому сенсі.
whuber

2
@rpierce Друга книга (Фрідман, Пісані та Первес) існувала вже близько 40 років, через п'ять (значною мірою незмінних) видань, і почала життя як текст для курсу вступної статистики UC Berkeley. Він охоплює майже всі мислимі сфери, а не лише охорону здоров'я. З іншого боку, одна з його сильних сторін полягає у тому, щоб не підкреслювати невеликі, безглузді або надмірно технічні розрізнення, тому, хоча це взагалі хороший посібник зі статистики, на нього не можна покластися для врегулювання таємничих питань.
whuber

3

Я дуже пізно відповідаю на це питання !!. Але не вдалося знайти відповідь дуже простою мовою, настільки скромна спроба відповісти на це.

Чому ми робимо стандартизацію? Уявіть, що у вас є дві моделі - одна прогнозує божевілля від часу, витраченого на вивчення статистики, а інша прогнозує журнал (божевілля) та кількість часу на статистику.

важко буде зрозуміти, що залишки обидва знаходяться в різних одиницях. Тож ми їх стандартизуємо. (Подібна теорія, як Z-оцінка)

Стандартизовані залишки: - Коли залишки діляться на оцінку стандартного відхилення. Взагалі, якщо абсолютне значення> 3, то це викликає занепокоєння.

Ми використовуємо це для дослідження інших людей у ​​моделі.

Вивчений Залишковий: Ми використовуємо це для вивчення стабільності моделі.

Процес простий. Вилучаємо окремий тестовий випадок із моделі та з’ясовуємо нове передбачуване значення. Різниця між новим значенням і початковим спостережуваним значенням може бути стандартизована діленням стандартної похибки. це значення Studentized Residual

Для отримання більш детальної інформації про виявлення статики за допомогою R - http://www.statisticshell.com/html/dsur.html


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.