Яка ймовірність того, що ця людина жінка?


32

За завісою стоїть людина - я не знаю, людина це жінка чи чоловік.

Я знаю, що у людини довге волосся, і що 90% всіх людей з довгим волоссям - жінки

Я знаю, що людина має рідкісну групу крові AX3, і 80% всіх людей із цією групою крові - жінки.

Яка ймовірність того, що людина є жінкою?

ПРИМІТКА. Цю оригінальну рецептуру було розширено ще двома припущеннями: 1. Кров і довжина волосся незалежні 2. Співвідношення чоловік: жінка в цілому популяції становить 50:50

(Конкретний сценарій тут не настільки актуальний - швидше, у мене є невідкладний проект, який вимагає, щоб я зрозумів правильний підхід до відповіді на це. Моє відчуття кишки полягає в тому, що це питання простої ймовірності, з простою остаточною відповіддю, а не ніж щось із кількома дискусійними відповідями відповідно до різних статистичних теорій.)


1
Існує не багато теорій ймовірності, але, як відомо, правда, що люди мають труднощі правильно думати про ймовірності. (Хороший математик Август ДеМорган відмовився від вивчення ймовірності через свої труднощі.) Не дивіться на дебати: шукайте звернення до принципів ймовірності (наприклад, аксіоми Колмогорова). Не дозволяйте це вирішити демократичним шляхом: ваше запитання - це безліч непродуманих відповідей, які, навіть якщо деякі з них погоджуються, є лише колективно помилковими. @Michael C дає хороші вказівки; моя відповідь намагається показати вам, чому він правий.
whuber

@Whuber, якщо передбачається незалежність, чи погоджуєтесь ви, що 0,97297 є правильною відповіддю? (Я вважаю, що без цього припущення відповідь може бути десь від 0% до 100% - ваші діаграми це добре показують).
Напевно,

Незалежність від чого саме? Ви припускаєте, що жіночі та чоловічі зачіски однакові? Як ви говорите у своєму питанні, цей конкретний сценарій, що стосується статі / волосся / групи крові, може бути нерелевантним: це підказує мені, що ви прагнете зрозуміти, як вирішити подібні проблеми в цілому. Для цього вам потрібно знати, які припущення передбачають, які висновки. Таким чином, вам потрібно дуже уважно зосередитися на припущеннях, які ви готові зробити, і точно визначити, наскільки вони дозволяють зробити висновок.
whuber

3
Вид незалежності для дослідження стосується поєднання всіх трьох характеристик. Наприклад, якщо AX3 є маркером синдрому, який включає облисіння у жінок (але не у чоловіків), то будь-яка довгошерста людина з AX3 обов'язково є чоловіком, що робить ймовірність бути жінкою 0%, а не 97,3%. Я сподіваюсь, що це очевидно, що кожен, хто дасть певну відповідь на це питання, повинен робити додаткові припущення, навіть якщо явно їх не визнає. Справді корисними відповідями, ІМХО, були б ті, які безпосередньо показують, як різні припущення призводять до різних результатів.
whuber

2
Вам не вистачає ймовірності того, що у жінки немає довгих волосся. Це критична міра.
Даніель Р Хікс

Відповіді:


35

Багатьом людям вважається корисним мислити під "підгрупою", підгрупами в ньому та пропорцій (а не ймовірностей). Це піддається візуальним міркуванням.

Я детально поясню цифри, але наміром є те, що швидке порівняння двох фігур повинно негайно і переконливо вказати, як і чому конкретної відповіді на питання не можна дати. Трохи довший розгляд підкаже, яка додаткова інформація була б корисною для визначення відповіді або принаймні отримання меж відповідей.

Venn diagram

Легенда

Перехресне штрихування : жіночий / Суцільний фон : чоловічий.

Верх : довгошерстий / знизу : короткошерсті.

Праворуч (і кольоровий) : AX3 / зліва (без ) : не AX3.

Дані

Верхня поперечна штрихування - 90% верхнього прямокутника ("90% всіх людей з довгим волоссям - жінки").

Загальний штрихування прямокутного прямокутника становить 80% цього прямокутника ("80% всіх людей із цією групою крові - жінки").

Пояснення

На цій схемі схематично показано, як популяція (всіх розглянутих жінок і не жінок) може бути одночасно поділена на жінок / не-самок, AX3 / non-AX3, і довгошерстих / недовгих ("короткий"). Він використовує область, принаймні приблизно, для представлення пропорцій (є деяке перебільшення, щоб зробити зображення більш чітким).

Очевидно, що ці три бінарні класифікації створюють вісім можливих груп. Тут з’являється кожна група.

Наведена інформація зазначає, що верхній хрестоподібний прямокутник (жінки з довгими волоссями) складає 90% верхнього прямокутника (всі довгошерсті люди). Він також зазначає, що комбіновані зшиті частини кольорових прямокутників (довгошерсті самки з AX3 і короткошерсті самки з AX3) складають 80% кольорової області справа (всі люди з AX3). Нам кажуть, що хтось лежить у верхньому правому куті (стрілка): довгошерсті люди з AX3. Яка частка цього прямокутника є хрестоподібною (жіночої)?

Я також (неявно) припускав, що група крові та довжина волосся незалежні : пропорція верхнього прямокутника (довге волосся), пофарбованого (AX3), дорівнює частці нижнього прямокутника (коротке волосся), що має забарвлення (AX3). Ось що означає незалежність. Це є справедливим і природним припущенням при вирішенні таких питань, як це, але, звичайно, це потрібно зазначити.

Положення верхнього прямокутного прямокутника (довгошерсті самки) невідоме. Ми можемо уявити ковзання верхнього хрестоподібного прямокутника в бік і ковзання нижнього хрестоподібного прямокутника в бік і, можливо, зміну його ширини. Якщо ми зробимо це так, щоб 80% кольорового прямокутника залишилося перехрещеним, така зміна не змінить жодної із заявлених відомостей, але вона може змінити частку жінок у правому верхньому прямокутнику. Очевидно, що пропорція може бути від 0% до 100% і все ж відповідати наданій інформації, як на цьому зображенні:

Figure 2


Сильною стороною цього методу є те, що він встановлює наявність безлічі відповідей на питання. Можна було б перекласти все це алгебраїчно і, встановивши ймовірності, запропонувати конкретні ситуації як можливі приклади, але тоді виникає питання, чи дійсно такі приклади відповідають даним. Наприклад, якщо хтось хотів би припустити, що, можливо, 50% довгошерстих людей - це AX3, спочатку не очевидно, що це можливо навіть з огляду на всю наявну інформацію. Ці (веннові) діаграми населення та його підгруп пояснюють такі речі.


3
Вюбер, якщо припустити, що група крові та довжина волосся незалежні, то, безумовно, частка довговолосих жінок типу AX3 повинна бути такою ж, як і частина короткошерстих жінок з AX3? Тобто ви не маєте гнучкості переміщувати прямокутники у тому, як ви пропонуєте ... Якщо ми припустимо також, що чоловіки та жінки складають 50:50 у цілому населенні, це не дає нам достатньо інформації, щоб вирішити це питання за допомогою одного незаперечна відповідь?
Напевно,

@whuber +1 дуже приємно.
Майкл Р. Черник

5
ProbablyWrong, уважно подивитися на питання в вашому коментарі: тому що вона має справу з жінками , це робить додаткове припущення про незалежність Conditional за ознакою статі. Припущення про (безумовну) незалежність волосся та групи крові взагалі не згадує гендер, тому щоб зрозуміти, що це означає, стерти з фігур перехресне штрихування. Це, я сподіваюся, вказує на те, чому ми маємо гнучкість розміщувати поперечний штрихування там, де нам подобається, у верхньому та нижньому прямокутнику.
whuber

1
@whuber, мені це подобається. Однак у мене є 2 питання / уточнення: 1. Цифри, начебто, передбачають пропорцію популяції для довгого та короткого волосся (приблизно 6: 4) та ~ AX3 проти AX3 (близько 85:15), але це не згадується в початковому питанні і не обговорювали у ваших поясненнях цифр. Я підозрюю, що пропорції естради не мають значення. Я маю рацію / міг би ви пояснити це у поясненнях? 2. Я думаю, що ця ситуація в кінцевому підсумку працює з тим же явищем, що і Парадокс Сімпсона , лише обрамленим інакше (якщо йдеться про інше напрямок). Це справедлива оцінка?
gung - Відновіть Моніку

3
@gung, дякую, що ви зробили ці роз'яснення. Цифри, звичайно, повинні бути певними пропорціями, щоб взагалі працювати, але будь-які пропорції, не конкретно зафіксовані в постановці проблеми, можуть змінюватися. (Я сконструював фігуру так, що приблизно 50% населення виглядає жінкою, очікуючи подальшого редагування, в якому це передбачалося.) Ідея застосувати це графічне зображення для розуміння Парадокса Сімпсона є інтригуючою; Я думаю, що це заслуга.
whuber

13

Це питання умовної ймовірності. Ви знаєте, що людина має довге волосся та групу крові Ax3. Нехай A = { 'У людини довге волосся' } Отже, ви шукаєте P ( C | A і B ) . Ви знаєте, що P ( C | A ) = 0,9 і P ( C | B ) = 0,8 . Чи достатньо цього для обчислення P ( C | A і B ) ? Припустимо, P ( A і B і C ) = 0,7

     A={'The person has long hair'}              B={'The person has blood type Ax3'}C={'The person is female'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7. Тоді Припустимо, P ( A і B ) = 0,8 . Тоді, сказаним вище, P ( C | A і B ) = 0,875
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875. З іншого боку, якщо , тоді у нас P ( C | A і B ) = 0,78.P(A and B)=0.9P(C|A and B)

Тепер обидва можливі, коли і P ( C | B ) = 0,8 . Тож ми не можемо точно сказати, що таке P ( C | A і B ) .P(C|A)=0.9P(C|B)=0.8P(C|A and B)


Привіт Майкл, якщо я тебе правильно прочитав, ти кажеш, що на поставлене запитання не можна відповісти, правда? Або кажучи іншим способом, вам потрібно більше інформації, щоб відповісти на це запитання? 1. Припустимо, що рідкісна група крові в моєму первісному питанні не впливає на бажання чи здатність людини довго рости волосся. Чи можна відповісти на запитання зараз? 2. Чи погоджуєтесь ви з тим, що відповідь повинна бути ВЕЛИЧЕ 0,9? (Оскільки у вас є другий фрагмент незалежної інформації - група крові - що підкріплює гіпотезу про те, що людина є жінкою)
Можливо,

2
Якщо є незалежними, тоді P ( A  і  B ) = P ( A ) P ( B ), і вам потрібно буде вказати, яка частка людей має довге волосся, тобто P ( A ) і яка частка осіб мають групу крові Ax3, тобто P ( B ) . Крім того, ви не можете сказати, що відповідь повинна бути більшою за 0,9, що еквівалентно твердженню, що P ( C | A  і  B )P(A and B)P(A and B)=P(A)P(B)P(A)P(B) (я дійсно не розумію, чому). P(C|A and B)>0.9
Нестор

2
@ProbablyWrong. Так, проблема, як було зазначено спочатку, не має достатньо інформації для однозначної відповіді.
Майкл Р. Черник

@ Néstor, Micahael, я не погоджуюся з тим, що нам потрібно знати, яка частка людей має довге волосся або яка частка людей має групу крові AX3. Я думаю, що відповідь на початкове запитання вирішується однозначно, не знаючи про це (якщо припустити, що A і B є незалежними, які ми всі маємо, і припускаючи, що ми знаємо розкол чоловіків і жінок у цілому населенні - нерозумно вважати, що це приблизно 50:50 , Я думаю).
Напевно,

7
Чому Я думав, що P ( C | A B ) = P ( C ( A B ) )
P(C|A and B)=P(A and B and C)×P(A and B)??
використовуючи визначення умовної ймовірності.
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)
Діліп Сарват

4

Захоплююча дискусія! Мені цікаво, чи ми вказали також P (A) і P (B), чи діапазони P (C | A, B) не будуть набагато вужчими, ніж повний інтервал [0,1], просто через безліч обмежень ми маємо.

Дотримуючись позначення, введеного вище:

A = випадок, коли у людини довге волосся

B = випадок, коли у людини є група крові AX3

C = подія, що людина жіноча

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (тобто припустимо рівне співвідношення чоловіків і жінок у цілому популяції)

не здається можливим припустити, що події А і В умовно незалежні, задані С! Це призводить безпосередньо до суперечності: якщо P(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

потім

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

Якщо тепер припустити, що A і B також незалежні: більшість термінів скасовується, і ми закінчуємоП(АБ)=П(А)П(Б)

П(С|АБ)=П(С|А)П(С|Б)П(С)=0,90,80,5>1

Слідкуючи за чудовим геометричним поданням проблеми Ваубера: Хоча це правда, що в цілому може приймати будь-яке значення в інтервалі [ 0 , 1 ], геометричні обмеження значно звужують діапазон можливих значень для значення P ( A ) і P ( B ) , які не "занадто малі". (Хоча ми також можемо верхню межу поля: P ( A ) і P ( B ) )П(С|АБ)[0,1]П(А)П(Б)П(А)П(Б)

Обчислимо {\ bf найменше можливе значення} для при таких геометричних обмеженнях:П(С|АБ)

1. Частка верхньої площі (A ІСТИНА), охоплена верхнім прямокутником, повинна дорівнювати П(С|А)=0,9

2. Сума площ двох прямокутників повинна бути рівною П(С)=0,5

3. Сума частки площ двох кольорових прямокутників (тобто їх перекриття з подією B) повинна бути рівною П(С|Б)=0,8

4. (тривіальний) Верхній прямокутник не можна переміщувати за ліву межу і не повинен переміщуватися за межі його мінімального перекриття ліворуч.

5. (тривіальний) Нижній прямокутник не можна переміщувати за межею правої межі і не повинен переміщуватися за межі його максимального перекриття праворуч.

П(С|АБ)введіть тут опис зображення

Пробіг через діапазон можливих значень для P (A) і P (B) ( R скрипт ) генерує цей графік введіть тут опис зображення

На закінчення ми можемо знизити межу умовної ймовірності P (c | A, B) для заданих P (A), P (B)


2
Маркусе, перший параграф належить як окреме запитання, а не як відповідь. Подальший матеріал виглядає як гарне спостереження, але важко прослідкувати, не розповідаючи, щоА,Б, і Спредставляти. Будь ласка, майте на увазі, що різні користувачі бачитимуть відповіді в різних послідовностях, відповідно до своїх уподобань та коли відповіді востаннє редагували, тому кожна відповідь повинна бути читаною незалежно від інших (хоча, звичайно, ви можете посилатися на інші відповіді).
whuber

1
@whuber: дякую за корисний коментар! Я сподіваюсь, що нові зміни зробить її більш зрозумілою та зрозумілою.
Маркус Лойчер

@whuber та інші: я сподівався знову підняти дискусію, але тема, здається, вийшла з неактивного? Більше жодних коментарів немає?
Markus Loecher

1

Зробити гіпотези, що людина за шторою - жінка.

Ми надали 2 докази, а саме:

Докази 1: Ми знаємо, що людина має довге волосся (і нам кажуть, що 90% всіх людей з довгим волоссям - жінки)

Докази 2: Ми знаємо, що людина має рідкісну групу крові AX3 (і нам кажуть, що 80% всіх людей із цією групою крові жінки)

Враховуючи лише докази 1, ми можемо стверджувати, що людина, що знаходиться за завісою, має значення 0,9 ймовірності бути жінкою (якщо припустити, що 50:50 розбивається між чоловіками та жінками).

Що стосується питання, поставленого раніше в потоці, а саме "Чи погоджуєтесь ви, що відповідь має бути ВЕЛИКОМ 0,9?", Не роблячи жодної математики, я б сказав інтуїтивно, відповідь повинна бути "так" (це ВЕЛИКО 0,9). Логіка полягає в тому, що докази 2 підтримують докази (знову ж таки, якщо припустити розкол 50:50 для кількості чоловіків і жінок у світі). Якби нам сказали, що 50% всіх людей з кров’ю типу AX3 були жінками, тоді дані Докази 2 були б нейтральними і не мали стосунку. Але оскільки нам кажуть, що 80% всіх людей із цією групою крові є жінками, докази 2 підтверджують докази і, логічно, слід підштовхнути остаточну ймовірність жінки вище 0,9.

Щоб обчислити конкретну ймовірність, ми можемо застосувати правило Байєса для Доказів 1, а потім скористатися байєсівським оновленням, щоб застосувати Докази 2 до нової гіпотези.

Припустимо:

A = випадок, коли у людини довге волосся

B = випадок, коли у людини є група крові AX3

C = випадок, коли людина жінка (припустимо, 50%)

Застосування правила Байєса до Доказів 1:

P (C | A) = (P (A | C) * P (C)) / P (A)

У цьому випадку ще раз, якщо припустити, що 50:50 розбивається між чоловіками та жінками:

P (A) = (0,5 * 0,9) + (0,5 * 0,1) = 0,5

Отже, P (C | A) = (0,9 * 0,5) / 0,5 = 0,9 (Не дивно, але було б інакше, якби у нас не було 50:50 розбиття між чоловіками та жінками)

Використовуючи байєсівське оновлення для застосування доказів 2 та підключення до 0,9 як нової попередньої ймовірності, ми маємо:

P (C | A AND B) = (P (B | C) * 0,9) / P (E)

Тут P (E) - вірогідність доказів 2, враховуючи гіпотези, що людина вже має 90% шансів бути жінкою.

P (E) = (0,9 * 0,8) + (0,1 * 0,2) [це закон повної ймовірності: (P (жінка) * P (AX3 | жінка) + P (чоловік) * P (AX3 | чоловік)] Отже , P (E) = 0,74

Отже, P (C | A AND B) = (0,8 * 0,9) / 0,74 = 0,97297


1
У вашій відповіді є кілька тверджень, які не мають для мене сенсу. (1) P (C | A) = 0,9 за припущенням. Ніде не було сказано, що P (C) = 0,9. Ми припустили, що P (C) = 0,5. (2) Як ви отримали результат за P (E)? P (жінка) = P (чоловік) = 0,5 за припущенням, де ви пишете P (жінка) = 0,9.
Майкл Р. Черник

Значення P (C) передбачається 0,5, що я використовував. Значення для P (E) - це ймовірність доказів 2 після застосування доказів 1 (що призводить до нових гіпотез, що ймовірність того, що особа є жінкою, дорівнює 0,9). P (E) = (ймовірність того, що людина є жінкою (дано Evience 1) * ймовірність, що людина має AX3, якщо жінка) + (ймовірність того, що людина є чоловіком (з даними Evience 1) * ймовірність, що людина має AX3 якщо людина) = (0,9 * 0,8) + (0,1 * 0,2) = 0,74
RandomAnswer

Ваше визначення ймовірності Е трохи заплутане, і умови, які ви використовуєте для його обчислення, виглядають відмінними від того, що ви писали раніше. Це насправді не має значення. Відповідь, мабуть, правильна, грунтуючись на чудово представленій відповіді Ху.
Майкл Р. Черник

@Michael За винятком випадків, що Хуу допустив помилки.
whuber

2
Ця відповідь просто неправильна. Можуть бути й інші помилки, але ця є кричущою. Ви заявляєте остаточну відповідь на P ("Має довге волосся") (ваш P (A)), а потім використовуєте її, щоб дати остаточну остаточну відповідь. Для того, щоб визначити це, просто не вистачає інформації, навіть якщо вважати P (F) = 0,5. Здається, ваш рядок для обчислення Р (А) походить нізвідки. Ось правильна формула з використанням теорії Байєса: P (A) = P (A | F) P (F) / P (F | A), з якої, використовуючи ваші висловлені припущення, дістаємось до P (A) = P (A | Ж) * 5/9. Однак ми все ще не знаємо P (A | F), що може бути будь-чим.
Богдановіст

0

Питання Перестановка та узагальнення

А, Б, і С є бінарними невідомими, можливі значення яких є 0 і 1. ДозволяєZi стояти за пропозицією "Значення Z є i". Також нехай (Х|Y) стенд за "Ймовірність того Х, враховуючи це Y". Що (Аа|БбСcЯ), враховуючи це

  1. (Аа1|Бб1Я)=у1 і (Аа2|Сc2Я)=у2
  2. (Аа1|Бб1Я)=у1 і (Аа2|Сc2Я)=у2 і (БС|Я)=(Б|Я)(С|Я)
  3. (Аа1|Бб1Я)=у1 і (Аа2|Сc2Я)=у2 і (А0|Я)=12
  4. (Аа1|Бб1Я)=у1 і (Аа2|Сc2Я)=у2 і (А0|Я)=12 і (БС|Я)=(Б|Я)(С|Я)

і це Яне містить відповідної інформації, окрім того, що міститься в завданнях? Останній зв'язок умов 2 і 4 є скороченням заяви про незалежність

(БjСк|Я)=(Бj|Я)(Ск|Я),j=0,1к=0,1
Розглядайте по черзі кожен із чотирьох випадків.

Відповіді

Випадок 1

Треба вказати розподіл (АБС|Я). Проблема недостатньо визначена, оскільки(АБС|Я) вимагає вісім чисел, але у нас є лише три рівняння - дві задані умови та умова нормалізації.

За допомогою різних езотеричних засобів було показано, що розподіл, який слід призначити, коли інформація не визначає інакше рішення, є тим, який з усіх розподілів, що відповідають відомій інформації, має найбільшу ентропію. Будь-яке інше розповсюдження означає, що ми знаємо більше, ніж відома інформація, що, звичайно, є суперечливістю.

Тому нам потрібно лише призначити максимальний розподіл ентропії. Це простіше сказати, ніж зробити, і я не знайшов загального рішення закритої форми. Але конкретні рішення можна знайти за допомогою цифрового оптимізатора. Ми максимізуємо

-i,j,к(АiБjСк|Я)ln(АiБjСк|Я)
з урахуванням обмежень
i,j,к(АiБjСк|Я)=1
і
(Аа1|Бб1Я)=у1тобток(Аа1Бб1Ск|Я)i,к(АiБб1Ск|Я)=у1
і
(Аа2|Сc2Я)=у2тобтоj(Аа2БjСc2|Я)i,j(АiБjСc2|Я)=у2
Тепер застосуємо це до питання. Якщо у нас є

  1. "Особа жінка" А1
  2. "У людини довге волосся" Б1
  3. "У людини група крові AX3" С1

потім а=1, б=1, c=1, а1=1, б1=1, а2=1, c2=1, у1=0,9, у2=0,8, і ми виявляємо, що для рішення максимальної ентропії, (А1|Б1С1Я)0,932. Тому ймовірність того, що людина за шторою є жінкою, враховуючи, що у нього довге волосся та група крові AX3, становить 0,932.

Випадок 2

Тепер ми повторимо вправу з додатковим обмеженням, яке для даної людини, знаючи значення Б (стан волосся) не впливає на нашу оцінку вартості С(стан крові), і навпаки. Все так само, як у випадку 1, за винятком двох додаткових обмежень в оптимізації, а саме:

(Б0|СлЯ)=(Б0|Я),л=0,1
тобто
i(АiБ0Сл|Я)i,j(АiБjСл|Я)=i,к(АiБ0Ск|Я),л=0,1
Це дає (А1|Б1С1Я)0,936, тому ймовірність того, що людина за шторою є жінкою, враховуючи, що у нього довге волосся і група крові AX3, становить 0,936.

Випадок 3

Тепер ми видаляємо умову незалежності та замінюємо її попередньою умовою, що існує однаковий шанс того, що дана людина є чоловіком чи жінкою:

(А0|Я)=12тобтоj,к(А0БjСк|Я)=12
Цього разу (А1|Б1С1Я)0,973, тому ймовірність того, що людина за шторою є жінкою, враховуючи, що у нього довге волосся та група крові AX3, становить 0,973.

Випадок 4

Нарешті ми знову вводимо обмеження незалежності випадку 2 і знаходимо це (А1|Б1С1Я)0,989. Тому ймовірність того, що людина за шторою є жінкою, враховуючи, що у нього довге волосся і група крові AX3, становить 0,989.


-2

Зараз я вважаю, що якщо припустити співвідношення чоловіків і жінок у цілому серед населення, то існує одна незаперечна відповідь.

A = випадок, коли у людини довге волосся

B = випадок, коли у людини є група крові AX3

C = подія, що людина жіноча

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (тобто припустимо рівне співвідношення чоловіків і жінок у цілому популяції)

Тоді P (C | A і B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]

у цьому випадку P (C | A і B) = 0,972973


P [C | A і B) = P (A і B і C) / P (A і B) = P (A і B і C) / [P (A | B) P (B)]. Як ви зрозуміли свою формулу?
Майкл Р. Черник

Можливо, існує спосіб додати умови, щоб отримати унікальну відповідь.
Майкл Р. Черник

Якщо додати незалежність A і B, формула спрощується до P (A і B і C} / [P (A) P (B)] = P (B і C | A) / P (B).
Michael R. Черник

2
Завдання мого питання справді було для вас, щоб виправдати формулу. Я не розумію, як це було б виведено.
Майкл Р. Черник

2
Ні, відповідь, що нібито використовується Правило Байєса, невірна. Я не впевнений, чому ви плутаєтесь, формула MC вище є правильною і не може бути використана для отримання результату, саме цим пояснилися відповіді його та Вюбера на запитання!
Богдановіст

-2

Примітка. Щоб отримати остаточну відповідь, наведені нижче відповіді передбачають, що ймовірність того, що у людини, довгошерстого чоловіка та у жінок з довгими волоссями AX3 приблизно однакова. Якщо бажано більшої точності, це слід перевірити.

Ви починаєте з того, що у людини довге волосся, тож у цей момент шанси:

90:10

Примітка . Співвідношення чоловіків до жінок в цілому популяції для нас не має значення, коли ми дізнаємося, що у людини довге волосся. Наприклад, якби в загальній популяції була 1 жінка на сотню, випадково вибрана довгошерста людина все-таки була б жінкою в 90% часу. Співвідношення жінок до самця НЕ має значення! (детальніше див. оновлення нижче)

Далі ми дізнаємось, що людина має AX3. Оскільки AX3 не пов'язаний з довгим волоссям, відомо, що співвідношення чоловіків і жінок становить 50:50, і через наше припущення, що ймовірність однакова, ми можемо просто помножити кожну сторону ймовірності та нормалізувати так, щоб сума сторони ймовірності дорівнюють 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Таким чином, ймовірність того, що людина за шторою є жінкою, становить приблизно 97,297%.

ОНОВЛЕННЯ

Ось подальше вивчення проблеми:

Визначення:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

По-перше, нам відомо, що 90% довгошерстих жінок - це жінки, а 80% людей з AX3 - жінки, тому:

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Оскільки ми припускали, що ймовірність AX3 не залежить від статі та довгого волосся, наш розрахунковий pfx застосовуватиметься до жінок з довгим волоссям, а pmx застосовуватиметься до чоловіків з довгим волоссям, щоб знайти кількість тих, хто, ймовірно, має AX3:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Таким чином, вірогідне відношення кількості самок з довгим волоссям та AX3 до кількості самців з довгим волоссям та AX3 становить:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Оскільки дано, що існує однакова кількість 50:50, ви можете скасувати обидві сторони і закінчити з 36 самками для кожного самця. В іншому випадку в зазначеній підгрупі є жінки 36 * м / ф . Наприклад, якби було вдвічі більше жінок, ніж чоловіків, на кожного чоловіка з тих, хто має довге волосся та AX3, було б 72 жінки.


1
Це рішення покладається на припущення більшого, ніж зараз зазначено в проблемі: а саме, що довге волосся, AX3 та стать не залежать. В іншому випадку ви не можете виправдати "застосування" pfx для жінок з довгим волоссям тощо.
whuber

@whuber: Так, я роблю це припущення. Однак, чи не є метою ймовірності дати найкраще наближення на основі даних, які у вас є? Таким чином, оскільки ви вже знаєте, що довге волосся та AX3 не залежать від загальної популяції, ви повинні передати це припущення чоловікам і жінкам, поки ви явно не навчитесь іншому. Зрозуміло, це не є універсально правильним, але це найкращий варіант, який ви можете зробити, поки не отримаєте більше інформації. Питання: Маючи лише поточні дані, якби вам довелося давати% шансів, що це жінка за завісою, ви б справді сказали «від 0 до 100%»?
Briguy37

1
У нас важлива різниця у філософії, @Briguy. Я твердо вірю, що не робити необґрунтованих припущень. Не ясно, в якому сенсі припущення про взаємну незалежність є "найкращим": я надаю це, можливо, у певних заявках. Але загалом це мені здається небезпечним. Я вважаю за краще зрозуміти припущення, необхідні для вирішення проблеми, тому люди можуть вирішити, чи варто збирати дані для перевірки цих припущень, а не припускати речі, які математично зручні заради отримання відповіді. Це різниця між статистикою та математикою.
whuber

Щоб відповісти на ваше запитання: так, 0% - 100% - це саме та відповідь, яку я дав би. (Я дав подібні відповіді на порівнянні запитання на цьому сайті.) Цей діапазон точно відображає невизначеність. Це питання тісно пов'язане з парадоксом Еллсберга . Оригінальний документ Еллсберга добре написаний і зрозумілий: рекомендую.
whuber

@whuber: Дякую, що знайшли час для спілкування зі мною. Я бачу вашу думку про важливість продумування та перерахування зроблених припущень і відповідно оновив свою відповідь. Щодо вашої відповіді, я вважаю, що вона неповна. Причиною цього є те, що ви можете розглянути всі невідомі випадки та знайти середню ймовірність того, що всі вони зможуть дійти остаточної відповіді. EG Хоча і те й інше можливо, ймовірності вище 50% є набагато більш поширеними, ніж ймовірності нижче 50% у всіх випадках, тому нам, безумовно, краще здогадатися, що це жінка.
Briguy37

-4

98% жіноча, проста інтерполяція. Перше приміщення 90% жіночої статі, листя 10%, друге приміщення залишає лише 2% існуючих 10%, отже 98% жінок

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.