Що означає Тета?


16

Я новачок у статистиці і це знайшов .

У статистиці θ - маленька грецька літера «theta» - це звичайна назва параметра (вектор) певного загального розподілу ймовірностей. Поширеною проблемою є пошук значення (-ів) тети. Зауважте, що в назви цього параметра не має жодного значення. Ми можемо також назвати це ще чим-небудь. Насправді, у багатьох дистрибутивах є параметри, які зазвичай мають інші назви. Наприклад, прийнято називати середнє значення та відхилення нормального розподілу μ (читати: 'mu') та відхилення σ ('sigma') відповідно.

Але я досі не знаю, що це означає в звичайній англійській мові?


10
θ - просто математичний символ і означає різні речі в різних контекстах. Інодіθ використовується для позначення параметра, що підлягає оцінці, але немає реального відповіді на питання "Що такеθ ?". Це як запитати "Що таке літера А?". Ваше посилання навіть на це натякає, коли воно говорить:"Зауважте, що немає ніякого сенсу в іменуванні параметра таким чином. .
Макрос

Це лише спосіб назвати статистичний параметр (який визначає розподіл кількості, пов'язаної з цим 'параметром') спеціальною літерою (крім англійських букв).
Stat-R

4
Більшість із нас вважають, що ця цитата є надзвичайно простою англійською мовою, але, щоб досягти будь-якого прогресу, ми повинні визнати, що питання не в тому, як читати англійську мову. Про що ж тоді могло йтись? Я стверджую, що він просить нас пояснити технічні терміни в цитаті: ті, з якими ми настільки знайомі, що ми більше не бачимо, наскільки вони можуть бути дивними для статистично непосвячених. Це вимагає, щоб ми вирішили значення розподілу та параметрів (розподілу, який є, а не встановленої кривої чи іншої детермінованої моделі).
whuber

Відповіді:


31

Це не умовність, але досить часто означає набір параметрів розподілу.θ

Це було для простої англійської, давайте покажемо приклади замість цього.

Приклад 1. Ви хочете вивчити кидок старомодної thumbtack (тих, що мають велике кругле дно). Ви припускаєте, що ймовірність того, що він впаде точкою вниз, є невідомим значенням, яке ви називаєте . Ви можете викликати випадкову змінну X і сказати, що X = 1, коли палець падає на точку вниз і X = 0θXX=1X=0 коли вона падає точкою вгору. Ви б написали модель

P(X=1)=θP(X=0)=1θ,

і вам було б цікаво оцінити (тут, ймовірність того, що палець впаде, знижується).θ

Приклад 2. Ви хочете вивчити дезінтеграцію радіоактивного атома. Виходячи з літератури, ви знаєте, що кількість радіоактивності зменшується експоненціально, тому ви вирішили моделювати час до розпаду з експоненціальним розподілом. Якщо - час дезінтеграції, модель єt

f(t)=θeθt.

Тут - щільність ймовірності, що означає, що ймовірність того, що атом розпадається в інтервалі часу ( t , t + d t ), є f ( t ) d t . Знову вам буде цікаво оцінити θ (тут швидкість дезінтеграції).f(t)(t,t+dt)f(t)dtθ

Приклад 3. Ви хочете вивчити точність зважування. Виходячи з літератури, ви знаєте, що вимірювання є гауссовими, тому ви вирішили моделювати зважування стандартного предмета на 1 кг як

f(x)=1σ2πexp{(xμ2σ)2}.

Тут - міра, задана шкалою, f ( x ) - щільність ймовірності, а параметри μ і σ , тому θ = ( μ , σ ) . Параметр μ - цільова вага (масштаб зміщений, якщо μ 1 ), а σ - стандартне відхилення вимірювання кожного разу, коли ви зважуєте об'єкт. Знову вам буде цікаво оцінити θ (тут, зміщення та неточність шкали).xf(x)μσθ=(μ,σ)μμ1σθ


1
+1 FWIW, я нещодавно розмістив відпрацьований приклад у тих же рядках на stats.stackexchange.com/a/34894 . Хоча було би вводити в оману трактувати це як "просту англійську мову" - це не цурається використання технічних термінів - я доклав зусиль, щоб якомога чіткіше і коротше пояснити, що відбувається, які припущення зроблені та як це працює з параметризованим сімейством розподілів для створення оцінки на основі даних. Для деяких це може бути інформативним доповненням до вашої відповіді тут.
whuber

1
Чудова відповідь! Я плутаюся, коли ви заявляєте, що масштаб є упередженим, якщо mu! = 1, хоча. Насправді, при «нормалізації», звичайний нормальний розподіл стає x ~ N (0, 1). Або по-англійськи, mu = 0 і дисперсія = 1. Див., Наприклад, en.wikipedia.org/wiki/…
Майк Вільямсон

Я просто маю на увазі, що прилад має ухил, якщо він вказує щось інше, ніж 1 кг, коли він вимірює предмет 1 кг. Можливо, слово «шкала» є заплутаним. Тут він просто позначає інструмент.
gui11aume

3

На що відноситься, залежить від того, з якою моделлю ви працюєте. Наприклад, у звичайній регресії найменших квадратів ви моделюєте залежну змінну (зазвичай її називають Y) у вигляді лінійної комбінації однієї або декількох незалежних змінних (зазвичай називають X), отримуючи щось на зразокθ

Yi=b0+b1x1+b2x2+...+bpxp

де p - кількість незалежних змінних. Тут слід оцінити параметри а θ - назва всіх β s . Але θ більш загальне може застосовуватися до будь-яких параметрів, які ми хочемо оцінити.βsθβsθ


3
Пітер, хоча ви цього не сказали точно, я боюся, що ця відповідь може створити у початківця неправильне враження, що символ завжди буде посилатися на вектор параметра і, навпаки, що це єдиний спосіб посилатися на параметр значення. Як свідчить мій коментар вище, я думаю, що відповідь - це не що інше, як " θ - математичний символ", що робить насправді не статистичним питанням. θθ
Макрос

1
@Macro Я думаю, що в цьому контексті зрозуміло, що це сенс , якого хотів Камільський. Звичайно, будь-який символ може посилатися на що завгодно. Але в цьому параграфі макрос означає вас, а не курс економіки чи частина SAS чи що. θ
Пітер Флом - Відновіть Моніку

1
гаразд, я не думаю, що аналогія насправді влучна, але я сприйму це як спробу гіперболи. У будь-якому випадку, я дійсно маю на увазі щось дуже основне, яке полягає в тому, що математичні новачки часто помиляються з позначеннями як щось, що є по суті, значимим і як щось інше, ніж те, що воно є - просто етикетка. Моя думка полягала в тому, що ця відповідь (я думаю, ненавмисно) не робить нічого, щоб розвіяти цю ідею. Як відомо, може посилатися на інші речі, з якими може зіткнутися статистик. Наприклад, кути часто позначають θ . θθ
Макрос

4
Це пояснення, хоч і є чітким і технічно правильним, але явно не передбачає жодних розподілів, і, таким чином, видається, що воно не має відношення до цитати у питанні.
whuber

1

Простий англійською мовою:

Статистичний розподіл - це математична функція яка говорить вам, яка ймовірність різних значень вашої випадкової величини X, яка має розподіл f , тобто f ( x ) видає ймовірність x . Такі функції існують різні , але поки нехай розглянемо f як якусь "загальну" функцію.f Xff(x)xf

Однак, щоб був універсальним , тобто таким, який можна застосувати до різних даних (які поділяють подібні властивості), йому потрібні параметри, які змінюють свою форму, щоб вона відповідала різним даним. Простий приклад такого параметра - μ у нормальному розподілі, який вказує, де знаходиться центр (середнє значення) цього розподілу, і він може описувати випадкові величини з різними середніми значеннями. Звичайний розподіл має інший параметр σ, а інші розподіли також мають принаймні один такий параметр. Параметри часто називають θ , де для нормального розподілу θ - це скорочення як μ, так і σfμσθθμσ(тобто вектор двох значень).

Чому важливий? Статистичні розподіли використовуються для апроксимації емпіричного розподілу даних. Скажімо, у вас є набір даних про групу людей, і в середньому їм 50 років, і ви хочете наблизити розподіл їх віку, використовуючи звичайний розподіл. Якщо нормальний розподіл не передбачав різних значень μ (наприклад, мав фіксоване значення цього параметра, скажімо μ = 0 ), то для цих даних було б марно. Однак, оскільки μ не є фіксованим, нормальний розподіл може використовувати різні значення μ , μ = 50 є одним з них. Це простий приклад, але є більш складні випадки, коли значенняθμμ=0μμμ=50Параметри θ не настільки чіткі, тому вам доведеться використовувати статистичні інструменти для оцінки (пошуку найбільш відповідних)значень θ .θθ

Таким чином, ви можете сказати, що статистика полягає у пошуку найкращих значень з урахуванням данихθ (Байєси скажуть: з урахуванням даних та пріорів).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.