Яка інтуїція лежить за формулою умовної ймовірності?


30

Формула умовної ймовірності виникнення огляду на те, що стався , є:AB

P(A | B)=P(AB)P(B).

Мій підручник пояснює інтуїцію, що стоїть за цим, з точки зору діаграми Венна.

введіть тут опис зображення

Зважаючи на те, що стався, єдиний спосіб виникнення - це подія потрапити в перетин та .BAAB

У цьому випадку, чи не буде ймовірність просто дорівнює ймовірності перетину , оскільки це єдиний спосіб, коли подія могла статися? Що я пропускаю?P(A|B)AB


7
Чи маєте ви інтуїтивне розуміння, що таке умовна ймовірність, якщо ми на деякий час забудемо, як її обчислити?
Juho Kokkala

4
По умовному на B (в разі, якщо вже сталася), обмежити ваше простір випадків від (всій площині) до Б тільки. Ви забуваєте все, що знаходиться поза межами B. Імовірність події A потрібно вимірювати відносно B, оскільки ймовірність становить від 0 до 1.Ω
Владислав Довгалеч

1
Вам не вистачає факту, що біла частина кола події Коло вже не є частиною населення, коли ви знаєте, що відбулася подія B.
Monty Harder

4
Інтуїції не точні, не є єдиними, тому навіщо питати про (сингулярну) точну інтуїцію? Корисної інтуїції достатньо, але не всі пропозиції будуть корисні всім людям.
Джон Коулман

Відповіді:


23

Дана інтуїція, що B стався - з А без нього - яка ймовірність A? Тобто, ми зараз знаходимося у Всесвіті, в якому стався В - повне праве коло. У цьому колі ймовірність A - площа A, що перетинається B, поділена на площу кола.


5
Іншими словами - я вам скажу сталося, що означає , що ми живемо в колі. Який % подій у цьому світі є в об'єктиві ( )? B A BBBAB
MichaelChirico

18

Я б подумав про це так: я вважаю за належне, що ви розумієте інтуїцію, поки:

Зважаючи на те, що B сталося, єдиний спосіб виникнення A - це рівномірне падіння перетину A & B.

і я прокоментую друге зображення, яке ви опублікували:

  1. Уявіть, що весь білий прямокутник - ваш зразок простору .Ω

    Призначення ймовірності множині означає, що ви вимірюєте в деякому сенсі цю множину. Це так само, як якщо б ви вимірювали площу прямокутника, але ймовірність - це інший вид вимірювання, який має специфічні властивості (про це я більше нічого не скажу).

  2. Ви знаєте, що і це трактується так:P(Ω)=1

    Ω представляє всі події, які могли статися, і щось має відбутися, тому у нас є 100% ймовірність того, що щось трапиться.

  3. Аналогічно множина має ймовірність , пропорційна ймовірності простору вибірки . Графічно кажучи, ви бачите, що отже, міра (її ймовірність ) повинна бути меншою, ніж . Те ж міркування справедливо для безлічі . Цей набір можна виміряти, а його міра дорівнює .P ( A ) Ω A Ω A P ( A ) P ( Ω ) A B P ( A B )AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. Якщо зараз вам кажуть, що сталося , ви повинні думати, як ніби - ваша «нова» . Якщо ваш «новий» , то ви можете бути 100% впевнені , що все відбувається в безлічі .B Ω B Ω BBBΩBΩB

    І що це означає? Це означає, що зараз у "новому" конкурсі , і вам доведеться змінити масштаби всіх імовірнісних заходів, враховуючи, що вони повинні бути виражені через "новий" пробний простір . Це проста пропорція.BP(BB)=1B

    Ваша інтуїція майже права, коли ви говорите:

ймовірність P (A | B) просто дорівнює ймовірності A перетину B

і "майже" пояснюється тим, що тепер ваш пробний простір змінився (зараз це ), і ви хочете відповідно змінити масштаб .P ( A B )BP(AB)

  1. P ( A B ) BP(AB) Ваш в новому світі , де вибіркове простір тепер . Словами ви б сказали це так (і, будь ласка, спробуйте візуалізувати його на зображенні за допомогою наборів):P(AB)B

    У новому світі співвідношення між мірою і мірою повинно бути таким же, як відношення між мірою та міроюA B Ω A BBABΩAB

  2. Нарешті перекладіть це математичною мовою (проста пропорція):

P(B):P(AB)=P(Ω):P(AB)

а оскільки випливає, що:P(Ω)=1

P(AB)=P(AB):P(B)

5

Ви побачите, що інтуїція легко думає про наступну проблему.

Припустимо, у вас є 10 кульок: 6 чорних та 4 червоних. З чорних кульок 3 - дивовижні, а з червоних кульок - лише 1. Наскільки ймовірно, що чорний куля також чудовий?

Відповідь дуже проста: це 50%, тому що у нас є 3 приголомшливих чорних кулі із загальних 6 чорних кульок.

Ось як ви зіставляєте ймовірності нашої проблеми:

  • 3 кулі, які є чорними та дивовижними, відповідаютьP(AB)
  • 6 кульок чорного кольору відповідаютьP(B)
  • ймовірність того, що куля дивовижний, коли ми ЗНАЄМО, що це чорний:P(AB)

1
Чи не було б більше сенсу писати а не ? P ( B ) = 6n(B)=6P(B)=6
Срібна рибка

@Silverfish Було б точніше, але я в цій справі був після інтуїції
Aksakal

4

Для основної інтуїції формули умовної ймовірності мені завжди подобається використовувати двосторонню таблицю. Скажімо, в рік навчається 150 студентів, з них 80 жінок і 70 чоловіків, кожен з яких повинен вивчити рівно один мовний курс. Двостороння таблиця студентів, які відвідують різні курси:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

З огляду на те, що студент проходить курс італійської мови, яка ймовірність, що вони жінки? Ну італійський курс налічує 60 студентів, з яких 40 - жінки, які вивчають італійську мову, тому ймовірність повинна бути:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

де - це кардинальність множини , тобто кількість елементів, які вона містить. Зауважте, що нам потрібно було використовувати у чисельнику, а не просто , оскільки останній включав би всі 80 жінок, включаючи інші 40 які не вивчають італійську мову.A n ( F італійський ) n ( F )n(A)An(FItalian)n(F)

Але якщо питання було перевернуто, яка ймовірність того, що студент пройде курс італійської мови, враховуючи, що вони жінки? Потім 40 з 80 студенток проходять курс італійської мови, тому у нас є:

P(Italian|F)=n(ItalianF)n(F)=4080=12

Я сподіваюся, що це забезпечує інтуїцію, чому

P(A|B)=n(AB)n(B)

Розуміння того, чому дріб може бути записаний із ймовірністю замість кардинальності, є питанням еквівалентних дробів . Наприклад, повернемося до ймовірності того, що студентка є жінкою, враховуючи, що вона вивчає італійську мову. Всього 150 студентів, тому ймовірність того, що студент є жінкою та вивчає італійську мову - 40/150 (це "спільна" ймовірність), а ймовірність, що студент вивчає італійську мову - 60/150 (це "гранична" ймовірність ). Зауважте, що ділення спільної ймовірності на граничну ймовірність дає:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(Щоб побачити, що дроби є рівнозначними, множення чисельника та знаменника на 150 видаляє "/ 150" у кожному.)

Більш загально, якщо ваш пробний простір має кардинальність - у цьому прикладі кардинальність становила 150 - ми знаходимо цеn ( Ω )Ωn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

Я би перевернув логіку. Ймовірність того, що і і :БAB

  1. Ймовірність сталася, і це з огляду на те, що сталосяАBA
  2. Ті ж, але зворотні ролі для іБAB

Це вам дасть

p(AB)=p(B)p(AB)

Якщо ви шукаєте негатив до вашої пропозиції, це в той час як це правда ймовірність даного міститься в ймовірності продукту, простір ви прокатка кістки в менше вихідному імовірнісний просторі - ви знаєте , напевно ти "в" , отже, ти ділишся за розміром нового простору.Б ВABB


2

Діаграма Венна не представляє ймовірності, вона являє собою міру підмножини простору події. Ймовірність - це співвідношення між двома заходами; ймовірність X - це розмір "все, що становить X", поділений на розмір "усіх подій, що розглядаються". Кожен раз, коли ви обчислюєте ймовірність, вам потрібен і "простір успіху", і "простір населення". Ви не можете розраховувати ймовірність, грунтуючись лише на тому, "наскільки великий" простір успіху. Наприклад, ймовірність катання сімки з двома кістками - це кількість способів прокатки семи, поділене на загальну кількість способів прокатки двох кісток. Просто знати кількість способів катання сімки недостатньо для обчислення ймовірності. P (A | B) - відношення міри "і A, і B трапляються" простір і міра простору "В буває". Ось що "|" означає: це означає "зробити те, що відбувається після цього простору населення".


2

Я думаю, що найкращий спосіб подумати над цим - малювати крок за кроком.

Опишемо подію B як перекидання на справедливу штангу - це може бути легко показано, що вона має ймовірність . Тепер опишемо подію A як малювання туза зі стандартної колоди карт на 52 картки - це може бути легко показано, що вірогідність .14 116113

Давайте зараз проведемо експеримент, коли ми згортаємо штамп, а потім вибираємо карту. Отже, була б ймовірністю того, що ми намалюємо туз, враховуючи, що ми вже прокатали . Якщо ви подивитесь на зображення, це буде шлях (вгору), а потім шлях (знову вгору). 4 1P(A|B)4 116113

Інтуїтивно зрозуміло, що загальний простір ймовірностей - це те, що нам вже було дано: прокрутка . Ми можемо ігнорувати і до якого веде початковий шлях вниз, оскільки ми ДОВІЛИ . За законом множення наш загальний простір тоді .14 12113 4(112134(16×113)+(16×1213)

Тепер яка ймовірність, що ми намалювали туза, ПОДАЛИ, що ми прокатали ? Відповідь, використовуючи шлях, - , який нам потім потрібно розділити на загальний простір. Отже, отримуємо4(16×113)

P(A|B)=16×113(16×113)+(16×1213).

введіть тут опис зображення


2
Мені було цікаво, для чого потрібна низовина, адже дерева ймовірностей можуть бути дуже повчальними. Можливо, стурбованість полягає в тому, що використання незалежних подій для ілюстрації пропускає саму точку умовної ймовірності, яка полягає в тому, що розподіл ймовірностей може змінюватися залежно від події, що обумовлює. Використання менш поверхневої ілюстрації може допомогти.
whuber

1

Подумайте про це підрахунками. Гранична ймовірність - скільки разів А трапилася, поділена на розмір вибірки. Спільна ймовірність A і B - скільки разів A сталося разом з B, поділеним на розмір вибірки. Умовна ймовірність A задана B - скільки разів A сталося разом з B, поділене на скільки разів сталося B, тобто лише A "всередині" B.

Ви можете знайти гарну візуальну ілюстрацію в цьому блозі , яка показує це за допомогою блоків Lego.


1

На момент написання інформації існує близько 10 відповідей, які, здається, всім пропускають найважливіший момент: ви по суті маєте рацію.

У такому випадку, чи не була б ймовірність P (A | B) просто дорівнює ймовірності A перетину B, оскільки це єдиний спосіб, коли подія могла відбутися?

Це, безумовно, правда. Це пояснює, чому величина, яку ми визначимо є насправді масштаб.P(A|B)P(AB)

Що я пропускаю?

Ви пропускаєте, що ймовірність задоволення B з огляду на те, що B задоволено, повинна бути 1, оскільки це цілком певна подія, а не яка цілком може бути меншою за 1. Розділення на P ( B ) умовна ймовірність B, задана B, дорівнює 1, як очікувалося. Насправді це ще краще і робить мапу A P ( A | B ) ймовірністю - тому умовна ймовірність насправді є ймовірністю.P(BB)=P(B)P(B)AP(A|B)


0

Я вважаю, що більш інтуїтивно зрозуміло, коли ми маємо конкретні дані для оцінки ймовірностей.

Давайте використаємо mtcarsдані як приклад, дані виглядають приблизно так (ми використовуємо лише кількість циліндрів і тип передачі.)

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Ми можемо обчислити спільний розподіл за двома змінними, зробивши перехресну таблицю:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

Спільна ймовірність означає, що ми хочемо розглядати дві змінні одночасно. Наприклад, ми запитаємо, скільки автомобілів - 4 циліндрові та механічна коробка передач.

Тепер ми приходимо до умовної ймовірності. Я знайшов найбільш інтуїтивним способом пояснення умовної ймовірності є використання терміна фільтрація даних.

Припустимо, що ми хочемо отримати , зробимо наступні оцінки:P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

Це означає, що нас дбають лише про автомобілі, які мають 4 циліндри. Тому ми фільтруємо дані на цьому. Після фільтрування ми перевіряємо, скільки з них є вручну.

Ви можете порівняти це умовно із спільним, про який я згадував раніше, щоб відчути відмінності.


0

Якщо Aбули надбезліччю Bймовірності того, що Aвідбувається завжди 1 за умови , що Bсталося, то є P(A|B) = 1. Однак Bсама по собі може мати ймовірність набагато меншу, ніж 1.

Розглянемо наступний приклад:

  • задане xнатуральне число в 1..100,
  • Aє " xце парне число"
  • Bє " xділиться на 10"

Тоді у нас є:

  • P(A) становить 0,5
  • P(B) становить 0,1

Якщо ми знаємо, що xділиться на 10 (тобто xзнаходиться в B), ми знаємо, що це також парне число (тобто xє в A) так P(A|B) = 1.

З правління Байєса ми маємо:

П(А|Б)=П(АБ)П(Б)

П(АБ)xxП(АБ)=П(Б)П(А|Б)=П(Б)/П(Б)=1


Для неживого прикладу розглянемо, наприклад, Aє " xділиться на 7" і Bє " xділиться на 3". Тоді P(A|B)еквівалентно «враховуючи, що ми знаємо, що xділиться на 3, яка ймовірність того, що вона (також) ділиться на 7?». Або еквівалентно 'Яка частка чисел 3, 6, ..., 99 ділиться на 7'?


0

Я думаю, що ваше початкове твердження може бути непорозумінням.

Ви написали:

Формула умовної ймовірності того, що A станеться, коли B сталося, така:

З вашого фразування це може здатися так, ніби є дві події "Спочатку Б сталося, а потім ми хочемо обчислити ймовірність того, що А відбудеться".

Це не так. (Далі діє, було непорозуміння чи ні).

У нас всього 1 захід, який описується однією з 4 можливостей:

  1. АБ

  2. АБ

  3. БА

  4. АБ

П(А)=0,5,П(Б)=0,5,іА і В є незалежними.

П(А і В)=0,25іП(neither A nor B)=0.25.

P(AB)=0.25

BP(AB)P(B)ABP(A|B)0.50.25B


0

Ймовірність кондиціонування НЕ дорівнює ймовірності перетину. Ось інтуїтивна відповідь:

P(BA)AB

P(AB)AB

A

Починаючи з ймовірності другого, ми можемо вивести ймовірність першого.

AB

ABA

BAB

0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

ABA

P(AB)=P(A)P(BA)

Тадааа ... тепер ізолюй вірогідність кондиціонування!

btw. Я хотів би, якби хтось міг пояснити, чому сценарій 1 і 2 рівні. Ключ лежить у там imo.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.