Значення позначень ймовірності і


27

Яка різниця в значенні між позначеннями і які зазвичай використовуються у багатьох книгах і працях?P(z;d,w)P(z|d,w)


13
f (x; θ) - те саме, що f (x | θ), просто означає, що θ - фіксований параметр, а функція f - функція x. f (x, Θ), OTOH, є елементом сімейства (безлічі) функцій, де елементи індексуються Θ. Тонка відмінність, можливо, але важлива, особливо. коли настає час оцінити невідомий параметр θ на основі відомих даних x; в цей час θ змінюється, і x фіксується, що призводить до "функції ймовірності". Використання "|" є більш поширеним серед статистиків, ";" серед математиків.
jbowman

Так, jbowman правильно. Ми іноді називаємо це щільністю X, заданою Θ.
Майкл Р. Черник

@jbowman чому б не опублікувати це як відповідь? Єдине моє питання - чому вони використовуватимуть обидва, але я припускаю, що це має щось спільне з контекстом ("|" використовується з "P", а ";" з " "). f
Абе

Гарне мислення, Абе; це, мабуть, все. є більш загальним, я думаю. f
jbowman

Відповіді:


12

Я вважаю, що причиною цього є парадигма вірогідності (хоча я не перевіряв фактичну історичну правильність наведеного нижче, це розумний спосіб зрозуміти, яким чином був йот).

Скажімо, в налаштуваннях регресії ви мали б розподіл: p (Y | x, beta), що означає: розподіл Y, якщо ви знаєте (умовно) значення x і beta.

Якщо ви хочете оцінити бета-версію, ви хочете збільшити ймовірність: L (beta; y, x) = p (Y | x, beta) По суті, ви зараз розглядаєте вираз p (Y | x, beta) як функція бета-версії, але крім цього, різниці немає (для математично правильних виразів, які ви можете правильно вивести, це необхідність --- хоча на практиці ніхто не турбує).

Тоді в байєсівських налаштуваннях різниця між параметрами та іншими змінними незабаром згасає, тому ви почали використовувати обидва позначення змішано.

Отже, по суті: фактичної різниці немає: вони обоє вказують на умовний розподіл речі зліва, умовно - на речі (речі) справа.


23

- щільність випадкової величини X у точці x , причому θ є параметром розподілу. f ( x , θ ) - спільна щільність X і Θ в точці ( x , θ ) і має сенс лише, якщо Θ випадкова величина. f ( x | θ ) - умовний розподіл X, заданого Θ , і знову ж таки, має сенс лише якщоf(x;θ)Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘ - випадкова величина. Це стане набагато зрозумілішим, коли ви ввійдете далі в книгу і подивитесь на байєсівський аналіз.Θ


Uhhhh ... - умовний розподіл x, заданого θ, має ідеальний сенс, навіть якщо θ не є випадковою величиною. Це майже стандартне позначення в класичній статистиці, де θ не є випадковою змінною. f(x|θ)xθθθ
jbowman

Так, якщо ви інтерпретуєте це так, що P [Θ = θ] = 1 (лівий Θ - випадкова величина, правий θ - константа), я згоден. Інакше я не ... бо що тоді означатиме P [Θ = θ] у знаменнику визначення умовного розподілу?
PeterR

Знаменник? Я можу записати де f - нормальне розподіл без посилання на правило Байєса. μ і σ закріплені. Інші теж роблять, наприклад, ll.mit.edu/mission/communications/ist/publications/… . xf(x|μ,σ)fμσ
jbowman

jbowman, то яке визначення вашого f (x | μ, σ) як умовної щільності, коли μ і σ є фіксованими числами (тобто не випадковими змінними)?
PeterR

1
Слово "умовне", пов'язане з позначенням f (X | Y), визначається як "умовне на деяку випадкову подію, що відбувається". Якщо ви використовуєте це для того, щоб означати щось інше, наприклад, просто "задане", як у "f (x) заданих (конкретних значеннях) μ і σ", то тоді це позначення f (x; μ, σ) для. Оскільки ОП запитували про те, що означає нотація, ми повинні бути точними щодо позначень у відповіді.
PeterR

18

f(x;θ) - те саме, щоf(x|θ) , просто означає, щоθ - фіксований параметр, а функціяf - функціяx . f(x,Θ) , OTOH - це елемент сімейства (або безлічі) функцій, де елементи індексуютьсяΘ . Тонка відмінність, можливо, але важлива, особливо. коли настає час оцінити невідомий параметрθ на основі відомих данихx ; в цей часθ змінюється іxфіксовано, що призводить до "функції ймовірності". Вживання частіше зустрічається серед статистиків ;серед математиків.


1
Як кажуть в усній формі? Ви кажете "f of x задано θ"? f(x;θ)
stackoverflowuser2010

@ stackoverflowuser2010 - так, саме так.
jbowman

2
У деяких відеоролях Coursera я виявив, що професор Стенфорда Ендрю Нг вербалізує крапку з комою як "параметризовану". Дивіться: class.coursera.org/ml-005/lecture/34 . Отже, приклад можна говорити як "f of x, параметризований theta".
stackoverflowuser2010

5
Висловлювання "задане" або "умовне" сильно відрізняється (загалом) від "параметризованого". Я б ненавиджу, якби хтось бачив це і думав, що вони є рівнозначними. Сказати "параметризовано" доцільно лише тоді, коли величина, на яку обумовлюється, є параметром, що індексує pdf змінної у першому члені. Для двох змінних (наприклад, f (x; y)) використання цього терміна було б неправильним.
ATJ

2
@MikeWilliamson - Звичайно, виберіть позначення, де ви знаєте, що все означає, і дотримуйтесь цього! Таким чином, коли ви повертаєтесь до чогось, що ви робили раніше, як, наприклад, на 4 години раніше, на моєму досвіді, вам не доведеться розбиратися, що ви мали на увазі, коли використовували це "|". Я погоджуюся, це дратує, але через деякий час ви просто спостерігаєте за першим використанням позначень і запам'ятовуєте його для решти папери / книги; розрізнення, як правило, не є важливим.
jbowman

9

Хоча це не завжди було таким чином, в наші дні зазвичай використовується, коли d , w не є випадковими змінними (що не означає, що вони обов'язково відомі). P ( z | d , w ) вказує на кондиціонування значень d , w . Кондиціонування - це операція над випадковими змінними, і як така використовується ця позначення, коли d , w не є випадковими змінними заплутаними (і трагічно поширеними).P(z;d,w)d,wP(z|d,w)d,wd,w

Як зазначає @Nick Sabbe, є загальним позначенням розподілу вибірки спостережуваних даних y . Деякі відвідувачі будуть використовувати це позначення, але наполягають, що Θ не є випадковою змінною, що є зловживанням IMO. Але вони там не мають монополії; Я бачив, як це роблять і байєси, торкаючись фіксованих гіперпараметрів наприкінці умовних умов.p(y|X,Θ)yΘ


2
Повторюючи свій другий абзац, варто зазначити, що в типових статистичних ситуаціях (скажімо, підгонці регресійної моделі) вважається не випадковою змінною, а набором відомих констант. X
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.