Якщо "B більше шансів надати A", то "A швидше дається B"


9

Я намагаюся отримати більш чітку інтуїцію позаду: "Якщо робить більш імовірним, тоді робить більш імовірним", тобтоABBA

Нехай позначає розмір простору , в якому і є, тоn(S)AB

Претензія: такP(B|A)>P(B)n(AB)/n(A)>n(B)/n(S)

томуn(AB)/n(B)>n(A)/n(S)

що єP(A|B)>P(A)

Я розумію математику, але чому це має інтуїтивний сенс?


1
Я редагував питання, щоб видалити слово "зробити". Це запитання звучало дещо як ті неоднозначні запитання у Facebook, ті, де вам потрібно вирішити якусь алгебраїчну суму за допомогою картинок, і люди отримують дуже різні відповіді через різні інтерпретації питання. Ми цього не хочемо. (Альтернативою є закриття питання для неясного та змушення ОП його змінити).
Секст

Відповіді:


10

Інтуїтивно, приклади реального світу, такі як Пітер Флом, є найбільш корисними для деяких людей. Інша річ, яка зазвичай допомагає людям, - це фотографії. Отже, щоб охопити більшість основ, давайте кілька фотографій.

Діаграма умовної ймовірності, що показує незалежність Діаграма умовної ймовірності, що показує залежність

У нас є дві дуже основні діаграми, що показують ймовірності. Перший показує два незалежних предикати, які я називатиму Red та Plain. Зрозуміло, що вони незалежні, оскільки лінії вишикуються. Частка простої площі, яка є червоною, така ж, як і частка смугастої площі, яка є червоною, а також така ж, як і загальна частка червоної.

У другому зображенні ми маємо незалежні розподіли. Зокрема, ми розширили частину простої червоної зони на смугасту, не змінюючи того факту, що вона червона. Зрозуміло, що тоді, якщо червоний стає очевидним, це швидше.

Тим часом погляньте на чітку сторону цього зображення. Очевидно, що частка простої області, яка є червоною, більша за частку всього зображення, яке є червоним. Це тому, що рівнинний регіон отримав купу більшої площі, і все це червоне.

Отже, червоний колір робить більш простим ймовірний, а звичайний - більш червоним.

Що насправді відбувається тут? A є свідченням для B (тобто A робить B більш ймовірним), коли площа, що містить і A, і B, більша, ніж було б передбачено, якби вони були незалежними. Оскільки перетин між A і B є таким же, як перетин між B і A, це також означає, що B є свідченням для A.

Одне застереження: хоча аргумент, який викладений вище, здається дуже симетричним, але може бути не так, що сила доказів в обох напрямках однакова. Наприклад, розглянемо це третє зображення. Тут сталося те саме: звичайний червоний з'їв територію, що раніше належала смугастій червоній. Насправді вона повністю закінчила роботу!Діаграма умовної ймовірності, що показує надзвичайну залежність

Зауважте, що точка червоного відвертого кольору гарантує простоту, оскільки не залишилося смугастих червоних областей. Однак точка, що є простою, не гарантувала почервоніння, оскільки залишилися зелені регіони. Тим не менш, точка в полі, що є простою, збільшує ймовірність того, що вона червона, а точка, що є червоною, збільшує ймовірність того, що вона є простою. Обидва напрямки передбачають більш ймовірне, тільки не на однакову суму.


Мені подобаються зображення :) Однак, схоже, що зображення або пояснення перевернуті: In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. - ваше друге зображення отримало рівну площу, ніж перше, тому переходячи від зображення 1 до 2, ми перемістили рівну область в смугасту область.
Под

Отже, якщо у мене є діаграма Венна з деякою загальною зоною перетину A, B, і все, що я роблю, це збільшити площу перетину, я автоматично додаю більше A, B для всього простору (не збільшуючи пробіл) і змінюю / збільшую n (A ) / n (S) і n (B) / n (S) як наслідок. Правильно? Більше коментарів?
Рахул Деора

4
Червоний та зелений кольори - це проблематичне поєднання для кольорових людей.
Річард Харді

@Pod Я думаю, що ви описуєте природну мовну неоднозначність. Читайте "ми перемістили частину смугасто-червоної області на рівнину", як "ми перемістили частину ділянки, раніше відомий як смугастий червоний, і змінили його на рівнину". Я думаю, ви [неправильно] прочитали це як "ми розширили частину смугасто-червоної зони на територію, раніше відому як рівнина" .
Пітер -

21

Я думаю, що інший математичний спосіб його викладення може допомогти. Розглянемо претензію в контексті правила Байєса:

Претензія: якщо P(B|A)>P(B) тоді P(A|B)>P(A)

Правило Байєса:

P(AB)=P(BA)P(A)P(B)

припускаючи P(B)ненульовий. Таким чином

P(A|B)P(A)=P(B|A)P(B)

Якщо P(B|A)>P(B), тоді P(B|A)P(B)>1.

Тоді P(A|B)P(A)>1, і так P(A|B)>P(A).

Це доводить твердження і ще сильніший висновок - що відповідні пропорції ймовірностей повинні бути рівними.


Мені це сподобалось, тому що він показує сильнішу посилання "якщо A робить B x відсотків більш імовірним, то B робить A x відсотків більш імовірним"
ймовірністьлогічний

@probabilityislogic Фразування цього таким чином вносить неоднозначність. Якщо попередня ймовірність дорівнює 10%, а задня - 15%, чи зросла ймовірність на 5% (15% мінус 10%) або на 50% (15% поділено на 10%)?
Накопичення

Більш простий доказ: Якщо P(B|A)>P(B), то використовуючи це та Правило Байєса, ми маємо P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)
Рей

12

Ну, мені не подобається слово "робить" у питанні. Це означає, що причинність і причинність зазвичай не зворотні.

Але ти просив інтуїції. Отже, я б подумав про деякі приклади, тому що це, здається, викликає інтуїцію. Виберіть потрібну вам:

Якщо людина - жінка, швидше за все, людина проголосувала за демократа.
Якщо людина проголосувала за демократа, швидше за все, це людина.

Якщо чоловік є професійним баскетбольним центром, то більше шансів на висоту понад 2 метри.
Якщо чоловік старше 2 метрів, то більше шансів, що він є баскетбольним центром.

Якщо вона перевищує 40 градусів Цельсія, то швидше за все виникне затемнення.
Якщо сталося затемнення, більш імовірно, що воно перевищує 40 градусів.

І так далі.


4
Це не про ймовірність. Це приблизно 1 до 1 відносин.
Пітер Флом

6
@jww Уявіть вислів "якщо йде дощ, на вулиці мокра" (і припустимо, це є дійсним наслідком на даний момент, тоді як зворотне - ні). Тепер візьміть велику кількість «проб» у різні часи та місця, де ви записуєте, чи йде дощ, чи вулиця мокра. Вулиця буде мокрою у більшості зразків, де йде дощ, ніж у пробах, де її немає; але також буде дощ у більшості зразків, де вулиця мокра, ніж проби, де вулиця суха. Така ймовірність.
Hobbs

3
Обидва явища зумовлені однаковим наслідком; підтекст працює лише одним способом, але спостереження за наслідком робить більш імовірним, що ви дивитесь на зразок, де попередня правда.
Hobbs

7
@Barmar Вибачте, але це частково демонструє правильність моєї логіки. Тому що, скажімо, 36/25 000 - це набагато вище, ніж 1/150 000 000.
Пітер Флом

7
Більш імовірно, ніж хтось у віці менше 2 метрів.
Пітер Флом

9

Щоб додати відповідь від @Dasherman: Що може означати сказати, що дві події пов’язані між собою , або, можливо, пов'язані або співвідносяться ? Можливо, ми могли б для визначення порівняти спільну ймовірність (припускаючиP(A)>0,P(B)>0):

η(A,B)=P(AB)P(A)P(B)
так що якщо η більше одного, A і Bзустрічається разом частіше, ніж за незалежності. Тоді ми можемо це сказатиA і B є позитивно пов'язаними.

Але тепер, використовуючи визначення умовної ймовірності, P(AB)P(A)P(B)>1 це легкий наслідок P(BA)>P(B). АлеP(AB)P(A)P(B) є повністю симетричним в A і B (обмінюючись всіма явищами символу A з B і навпаки) залишає ті самі формули, тому також еквівалентно P(AB)>P(A). Це дає результат. Тож інтуїція, яку ви просите, такаη(A,B) симетрична в A і B.

Відповідь @gunes дав практичний приклад, і легко зробити інших таким же чином.


2

Якщо A робить B більш імовірним, це означає, що події так чи інакше пов'язані. Це відношення працює обома способами.

Якщо A робить B більш імовірним, це означає, що A і B мають тенденцію відбуватися разом. Це означає, що B також робить A більш ймовірним.


1
Це, можливо, може скористатися деяким розширенням? Без визначення спорідненого це трохи порожньо.
mdewey

2
Я намагався триматися подалі від чогось суворого, оскільки ОП попросив зрозуміти пояснення. Ви маєте рацію, що вона досить порожня, як зараз, але я не впевнений, як її розширити інтуїтивно. Я додав спробу.
Дашерман

2

Якщо A робить B більш імовірним, A має важливу інформацію, яку B може зробити про себе. Незважаючи на те, що вона не може внести ту саму суму, ця інформація не втрачається навпаки. Зрештою, у нас є дві події, які їх виникнення підтримують одна одну. Я не можу уявити собі сценарій, коли виникнення A збільшує ймовірність B, а поява B зменшує ймовірність А. Наприклад, якщо буде дощ, підлога буде мокрою з великою ймовірністю, а якщо підлога мокрий, це не означає, що пішов дощ, але це не зменшує шансів.


2

Ви можете зробити математику більш інтуїтивно зрозумілою, представивши таблицю дій на випадок.

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • Коли A і B є незалежними, тоді спільні ймовірності є добутком граничних ймовірностей

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    У такому випадку ви мали б схожі граничні та умовні ймовірності, наприклад P(A)=P(A|B) і P(B)=P(B|A).

  • Коли немає незалежності, ви можете бачити це як вихід із параметрів a,b,c,d те саме (як продукти націнки), але лише з коригуванням на ±z

    A¬A1x1xBya+zbz¬B1yczd+z

    Ви могли це побачити z як порушення рівності граничних та умовних ймовірностей або розрив відносини для спільних ймовірностей, що є продуктами граничних ймовірностей.

    Тепер, з цієї точки зору (розбиття цих рівностей) ви можете бачити, що це порушення відбувається двома способами P(A|B)P(A) і P(B|A)P(B). І нерівність буде в обох випадках> коли z є позитивним і < коли z є негативним.

Таким чином, ви могли бачити з'єднання P(A|B)>P(A) тоді P(B|A)>P(B) через спільну ймовірність P(B,A)>P(A)P(B).

Якщо A і B часто трапляються разом (спільна ймовірність вище, ніж продукт граничних ймовірностей), то спостереження за одним зробить (умовна) ймовірність іншого.


2

Припустимо, ми позначимо відношення ймовірності події до попереднього події як:

Δ(A|B)P(A|B)P(A)

Тоді альтернативним вираженням теореми Байєса (див. Цей пов'язаний пост ) є:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

Коефіцієнт імовірності від заднього до попереднього вказує нам, чи є подія аргументу більш-менш імовірною внаслідок виникнення умови події (і наскільки більш-менш вірогідна). Вищенаведена форма теореми Байєса показує, що співвідношення ймовірностей заднього до попереднього є симетричним у змінних. Наприклад, якщо спостерігати B робить Aскоріше, ніж це було апріорі , то спостереженняA робить Bскоріше, ніж це було апріорі .


Зауважте, що це правило ймовірності, і тому його не слід тлумачити причинно . Ця симетрія вірна в імовірнісному сенсі для пасивного спостереження --- однак це неправда, якщо ви втручаєтесь у систему, щоб змінитиA або B. В цьому останньому випадку вам потрібно буде використовувати причинно-наслідкові операції (наприклад,do оператор) для пошуку ефекту зміни змінної кондиціонування.


1

Вам кажуть, що Сем - жінка, а Кім - чоловік, а один з двох носить макіяж, а другий - ні. Хто з них, нагадаєте, носить макіяж?

Вам кажуть, що Сем носить макіяж, а Кім ні, і один з двох - чоловік, а один - жінка. Хто б ви здогадалися, це жінка?


Зв'язати це з початковою проблемою не так просто. Що саме таке подія A і що таке подія B? Тут це більше схоже на порівняння ймовірностей. Подія A - це «x - це жінка» (не A - це подія, «x - чоловік»). І подія B - "носить макіяж". Але тепер у нас раптом з'явилися Сем і Кім, звідки це походить, і чи слід використовувати будь-яку інформацію про суб'єктивну маскулінність або жіночність їхніх імен?
Секст

1

Здається, існує деяка плутанина між причинно-наслідковим зв’язком та кореляцією. Дійсно, запитання є помилковим для причинного зв'язку, як це можна побачити на прикладі, наприклад:

  • Якщо собака носить шарф, то це одомашнене тварина.

Невірно:

  • Побачивши одомашненого тварина, що носить шарф, означає, що це собака.
  • Побачення одомашненої собаки означає, що вона носить шарф.

Однак якщо ви думаєте про ймовірності (кореляція), то це правда:

  • Собаки, які носять шарфи, набагато частіше є одомашненими тваринами, ніж собаки, які не носять шарфи (або взагалі тварини з цього приводу)

Це справедливо:

  • Домашня тварина, яка носить шарф, швидше за все буде собакою, ніж іншою твариною.
  • Домашня собака, швидше за все, носить шарф, ніж собака, яка не є домашньою.

Якщо це не інтуїтивно, подумайте про пул тварин, включаючи мурах, собак та котів. Собаки та коти можуть бути як одомашненими, так і носити шарфи, а мурахи також не можуть.

  1. Якщо ви збільшите ймовірність одомашнених тварин у вашому басейні, це також означатиме, що ви збільшите шанс побачити тварину, яка носить шарф.
  2. Якщо ви збільшите ймовірність або котів, або собак, тоді ви також збільшите ймовірність побачити тварину, що носить шарф.

Одомашненне одомашнене є «таємним» зв’язком між твариною та носінням шарфа, і ця «таємна» ланка буде здійснювати свій вплив обома способами.

Редагувати: Надаючи приклад свого запитання в коментарях:

Уявіть собі світ, де тварини або Коти, або Собаки. Вони можуть бути або одомашненими, або ні. Вони можуть носити шарф чи ні. Уявіть, що існує 100 тварин, 50 собак і 50 кішок.

Тепер розглянемо твердження A таким чином: " Собаки, які носять шарфи, в три рази частіше можуть бути одомашненими тваринами, ніж собаки, які не носять шарфиків ".

Якщо А не відповідає дійсності, то можна уявити, що світ міг би бути зроблений з 50 собак, 25 з них одомашнені (з них 10 носять шарфи), 25 з них дикі (з них 10 носять шарфи). Аналогічна статистика для котів.

Тоді, якщо ви побачили одомашненого тварину в цьому світі, у нього буде 50% шансів стати собакою (25/50, 25 собак з 50 одомашнених тварин) і 40% шансом мати хустку (20/50, 10 собак і 10 котів з 50 одомашнених тварин).

Однак якщо А правда, то у вас є світ, де є 50 собак, 25 з них одомашнені (з них 15 носять шарфи ), 25 з них дикі (з них 5 носять шарфи ). Коти підтримують старі статистичні дані: 50 кішок, 25 з них одомашнені (з них 10 носять шарфи), 25 з них дикі (з них 10 носять шарфи).

Тоді, якби ви побачили одомашненого тварину в цьому світі, у нього були б ті самі 50% шансів стати собакою (25/50, 25 собак з 50 одомашнених тварин), але мали б 50% (25/50, 15 собак і 10 котів з 50 одомашнених тварин).

Як ви бачите, якщо ви говорите, що А - це правда, то якби ви побачили одомашнене тварина, яке носило шарф у світі, це буде швидше Собака (60% або 15/25), ніж будь-яка інша тварина (у цьому випадку Кіт, 40% або 10/25).


У цьому напрямку у мене є проблема з "одомашненою твариною, яка носить шарф, швидше за все, собакою, ніж іншою твариною". Коли ми зробили свою первісну заяву, ми не заявляли жодних претензій щодо інших тварин, які могли носити шарфи. Могло бути 100 років. Ми лише зробили заяву про собак.
Рахул Деора

Перевірте, чи допомагає моя редакція у вашій конкретній проблемі.
H4uZ

0

Тут виникає плутанина між причинним зв’язком і кореляцією. Тому я наведу вам приклад, коли відбувається навпаки.

Деякі люди багаті, деякі - бідні. Деякі бідні люди отримують пільги, що робить їх менш бідними. Але люди, які отримують пільги, все ж частіше бідні, навіть із пільгами.

Якщо вам надаються пільги, це робить більш імовірним, що ви можете дозволити собі квитки в кіно. ("Робить це більш імовірним", що означає причинність). Але якщо ви можете дозволити собі квитки в кіно, це робить меншою ймовірність того, що ви є серед людей, які бідні, щоб отримати пільги, тож якщо ви можете дозволити собі квитки в кіно, ви менше шансів отримати пільги.


5
Це не відповідь на питання. Цікава, але не відповідь. Насправді мова йде про інший сценарій; Причина, що відбувається навпаки, полягає в тому, що вона використовує дві різні показники, які названі однаково (бідні без користі проти бідні з вигодами) і як такий є зовсім іншим сценарієм.
wizzwizz4

0

Інтуїція стає зрозумілою, якщо подивитися на більш сильний вислів:

Якщо A означає B, то B робить A більш імовірним.

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

Очевидно, що A є більшою ймовірністю, якщо B також відомо, що B є істинним, тому що, якщо B був помилковим, то так би було і A. Ця ж логіка застосовується і до слабшого твердження:

Якщо A робить B більш імовірним, то B робить A більш ймовірним.

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true

Я думаю, що ви говорите в першому твердженні, що у діаграмі venn, якщо A міститься у B, тоді, якщо B є правдою n (A) / n (B), повинно бути вище n (A) / n (S) як B - менший простір, ніж S. Навіть у другому, ви кажете так само?
Рахул Деора

@RahulDeora - Так, це працює. Слабка версія набагато менш очевидна, але ви вже все-таки зробили математику. Те, про що ви просили, - це інтуїція, що стоїть за результатом, що найкраще можна спостерігати у більш сильному твердженні.
Райнер П.

Невелика проблема використання цього висловлювання для отримання інтуїції полягає в тому, що це не зовсім правда. "Вказівка ​​на В" не є достатньою умовою для ", коли B, тоді A є більш імовірним". Важлива відмінність полягає в тому, що при "означаючому B" не потрібно робити B більш імовірним. Найважливіші приклади, коли B завжди відповідає дійсності.
Секст

0

Припустимо, Аліса має більш високу швидкість вільних кидків, ніж середня. Тоді ймовірність того, що постріл буде успішним, враховуючи, що його намагається здійснити Аліса, більша, ніж вірогідність того, що постріл може бути успішним в ціломуP(successful|Alice)>P(successful). Можна також зробити висновок, що частка успішних кадрів Аліси більша, ніж загальна частка кадрів:P(Alice|successful)>P(Alice).

Або, припустимо, є школа, яка має 10% учнів у своєму шкільному окрузі, але 15% учнів прямолінійної А. Тоді чітко відсоток учнів у тій школі, які є прямими учнями A, вищий, ніж відсоток у цілому районі.

Інший спосіб дивитися на це: A швидше, якщо B, якщо P(A&B)>P(A)P(B), і це повністю симетрично стосовно A і B.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.