Ймовірність - навіщо розмножуватися?


22

Я вивчаю оцінку максимальної ймовірності і читаю, що функція ймовірності є добутком ймовірностей кожної змінної. Чому саме продукт? Чому б не сума? Я намагався шукати в Google, але не можу знайти жодних змістовних відповідей.

https://en.wikipedia.org/wiki/Maximum_likelihood


7
Зауважимо, що це не обов'язково, і загалом максимальна ймовірність визначається з точки зору щільності стику випадкових величин. Звичайно, якщо вони незалежні, їх щільність суглобів є лише продуктом маргіналів
Мураха

Пам'ятайте, що множення є лише скороченням для додавання. Коли я кажу 2 рази 3, я кажу 2 + 2 + 2. Ми розмножуємось, бо ліниві. Хто має час зробити це важким шляхом? Ви можете додати, якщо це допоможе вам побачити, що відбувається (допомогло мені зрозуміти проблему Monty Hall), але через деякий час вам це набридне.
candied_orange

скажімо, у вас 80% ймовірність мати каштанове волосся і 75% ймовірність мати карі очі. Як ви вважаєте, чи є ймовірність бути каштановим та карим 80% + 75% = 155%? як щодо 80% * 75% = 60%?
njzk2

Відповіді:


39

Це дуже основне питання, і замість того, щоб використовувати формальну мову та математичні позначення, я спробую відповісти на нього на рівні, коли кожен, хто може зрозуміти питання, також може зрозуміти відповідь.

Уявіть, що у нас є гонка котів. Вони мають 75% ймовірність народитися білими, а 25% - ймовірними народитися сірими, інших кольорів немає. Крім того, вони мають 50% ймовірність мати зелені очі та 50% ймовірність мати блакитні очі, а колір пальто та колір очей не залежать.

Тепер давайте подивимось на послід восьми кошенят:

введіть тут опис зображення

Ви побачите, що 1 з 4, або 25%, сірий. Також 1 з 2, або 50% мають блакитні очі. Тепер питання,

скільки кошенят сіре хутро і блакитні очі?

Ви можете їх порахувати, відповідь - одна. Тобто , або 12,5% з 8 кошенят.14×12=18

Чому це відбувається? Тому що будь-яка кішка має ймовірність 1 до 4 бути сірою. Отже, виберіть чотирьох котів, і ви можете очікувати, що одна з них буде сірою. Але якщо ви вибираєте лише чотирьох котів із багатьох (і отримуєте очікувану цінність 1 сірого кота), той, який є сірим, має ймовірність 1 на 2 мати блакитні очі. Це означає, що від загальної кількості котів, яких ви вибрали, ви спочатку множите цілу суму на 25%, щоб отримати сірих котів, а потім ви помножили відібраних 25% всіх котів на 50%, щоб отримати тих із них, у яких блакитні очі. Це дає вам ймовірність отримати блакитнооких сірих котів.

Підсумовуючи їх, ви отримаєте , що робить або 6 із 8. На нашому малюнку це відповідає підсумовуванню коти, які мають блакитні очі, з кішками, які мають сіре хутро - і рахують одного сивого блакитноокого кошеня двічі! Такий розрахунок може мати своє місце, але він досить незвичний у ймовірних обчисленнях, і це точно не той, про який ви питаєте. 314+1234


1
Я знаю, що інші відповіді тут означають те саме. І все-таки я думаю, що тут потрібне візуальне представлення - якби ОП змогла сама візуалізувати концепцію, він, мабуть, уже дійшов би відповіді.
румчо

Це насправді приголомшлива відповідь, оскільки вона показує кожну незалежну змінну як незалежну вісь у котячій матриці. Це робить його дуже легко зрозуміти. Я буду використовувати цей приклад, щоб навчити своїх дітей!
dotancohen

3
Ця відповідь насправді є хибною, оскільки вона все ще суперечить спостережуваному та очікуваному значенню. Побачивши, наскільки це популярно, я спробую знайти час, щоб оновити його, пояснивши, чому такий спосіб підмноження котів дає нам максимальну оцінку ймовірності (або, вирішивши проблему збору 8 випадкових котів та з’ясування того, що вони не є ті, які я намалював на малюнку).
румчо

Чому це не може бути вся популяція таких котів? (Скажімо, у них є якесь особливе дослідницьке властивість - наприклад, їхні язики хемілюмінесцентні.) Тоді конфлікт не є шкідливим.
Ерік Тауерс

16

Незалежність між двома подіями означає, що виникнення однієї події не впливає на ймовірність настання іншої події. Отже, для будь-яких двох подій і у вибірковому просторі ми говоримо, що і є незалежними iff і Тепер більше, ніж про дві події ми говоримо, що події є незалежними iff для всіх підмножин .АБSАБП(АБ)=П(АБ)=П(А)П(Б)А1,А2,...АнП(АiiЯ)=iЯП(Аi)Я[1,2,...,н]

Ймовірно, ми припускаємо, що є вибірка з незалежних і однаково розподілених спостережень (iid), що надходять від розподілу з невідомою функцією щільності ймовірності, що означає, що ця функція щільності суглоба є .х1,х2,,хннf(х1,х2,...,хн|θ)=i=1i=нf(хi|θ)


6

За загальним припущенням незалежності, = .П(АБ)П(А)П(Б)

Таким чином, якщо ви припускаєте, що всі ваші спостереження незалежні, то ймовірність спостереження всіх значень, які ви бачили, дорівнює добутку окремих ймовірностей.


8
Я думаю, що це допоможе ОП, якщо ви також поясните, чому тут цікавий. П(АБ)
Грінпаркер

Привіт, дякую за відповідь! Чому я максимізую ймовірність (функція щільності суглоба)? Чому я не можу замість цього максимізувати суму ймовірностей усіх спостережень (або будь-якої іншої функції)? Я хотів би знайти причину вибору функції щільності суглобів. Вікіпедія починається за допомогою функції щільності суглобів. Але чи є причина, чому ми використовуємо функцію щільності суглоба? Це те, що я намагався зрозуміти.
RuiQi

@haziqRazali ідея MLE полягає у виборі оцінок для того, щоб зробити зразок, який ви, швидше за все, дали розподілу. Звідси максимальна ймовірність імені
Repmat

1
@HaziqRazali Питання на кшталт "чому збільшити ймовірність" - це нове запитання (таке, про що запитували і відповіли в іншому місці на сайті)
Glen_b -Встановити Моніку

3

Чому б не додати?

Тому що це явно не має сенсу. Припустимо, у вас є чверть і нікель, і ви хочете перевернути їх обох. Є 50% шансів, що чверть вийде головою, і 50% шансом, що нікель підійде головам. Якщо шанс обох піднятими головами був би сумою, це зробило б шанс на 100%, що, очевидно, неправильно, оскільки не залишає шансів для HT, TH та TT.

Навіщо множити?

Бо це має сенс. Коли ви помножите 50% шансу на те, що чверть вийде на голову, на 50% шансу, що нікель підійде до голови, ви отримаєте 0,5 х 0,5 = 0,25 = 25% шанс, щоб обидві монети були головами. З огляду на те, що є чотири можливі комбінації (HH, HT, TH, HT) і кожна однаково вірогідна, це ідеально підходить. Оцінюючи ймовірність виникнення двох незалежних подій, ми множимо їх індивідуальні ймовірності.


2

Я читаю ці публікації, тому що, як і в оригінальному плакаті, мені потрібно зрозуміти, чому fn " Ймовірність " є " Продуктом " щільності кожного значення вибірки - " x ". Читальна та логічна причина наведена у заголовку Принцип максимальної ймовірності Посилання: [ http://www-structmed.cimr.cam.ac.uk/Course/Likelihood/likelihood.html] Подальша цитата, математично визначена ймовірність. як ймовірність здійснення набору вимірювань (те саме посилання) Коротше кажучи, ймовірність того, що ви потрапили на зразок, який у вас є під рукою.


0

Мета методу максимальної ймовірності - знайти оцінювач, який максимізує ймовірність спостерігати певні значення змінної (ендогенна змінна). Саме тому ми мусимо помножити ймовірності виникнення.

Наприклад: уявіть, що кількість телефонних дзвінків, на які секретар може відповісти за годину, слідує за розподілом пуассона. Потім ви отримуєте 2 значення вибірки (5 телефонних дзвінків та 8 телефонних дзвінків на годину). Тепер ви повинні відповісти на це питання. Яке значення параметра, що забезпечує максимальну ймовірність одночасно спостерігати 5 та 8 телефонних дзвінків ?. Після цього спробуйте відповісти з вірогідністю дотримуватися всіх значень сам

Завдяки незалежним випадковим змінним,

f (y1 = 5 телефонних дзвінків) * f (y2 = 8 телефонних дзвінків) = ∏if (y, θ) = L (θ, y1, y2)

Нарешті, спробуйте відповісти, ймовірність спостерігати всі значення вибірки.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.