TL; DR: Якщо ви не припускаєте, що люди нерозумно погано оцінюють колір автомобіля, або що сині автомобілі є безпідставно рідкісними, велика кількість людей у вашому прикладі означає, що ймовірність того, що машина синього кольору, в основному становить 100%.
Метью Дрюрі вже дав правильну відповідь, але я просто хотів би додати до цього декілька числових прикладів, тому що ви вибрали свої цифри таким чином, що ви насправді отримуєте досить схожі відповіді для широкого спектру різних параметрів параметрів. Наприклад, припустимо, як ви сказали в одному зі своїх коментарів, що ймовірність того, що люди правильно оцінюють колір автомобіля, становить 0,9. Тобто:
а також
p ( скажіть, що він не синій | автомобіль не синій ) = 0,9 = 1 - p ( скажіть, це синій | машина не синя )
p(say it's blue|car is blue)=0.9=1−p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1−p(say it is blue|car isn't blue)
Визначившись із цим, нам залишається вирішити: яка попередня ймовірність того, що автомобіль синій? Виберемо дуже низьку ймовірність, щоб побачити, що відбувається, і скажемо, що , тобто лише 0,1% усіх автомобілів синього кольору. Тоді задню вірогідність того, що автомобіль синій, можна обчислити так:p(car is blue)=0.001
p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999
Якщо подивитися на знаменник, то цілком зрозуміло, що другий доданок у цій сумі буде незначним, оскільки відносний розмір доданків у сумі переважає відношення до , що знаходиться на порядку . І дійсно, якщо ви зробите цей розрахунок на комп’ютері (дбаючи про те, щоб уникнути числових проблем із підтоком), ви отримаєте відповідь, рівну 1 (в машинній точності). 0,1 900 10 580.99000.19001058
Причина попередніх ймовірностей насправді не має великого значення в тому, що у вас є стільки доказів для однієї можливості (автомобіль синій) проти іншої. Це можна кількісно визначити коефіцієнтом ймовірності , який ми можемо обчислити як:
p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.9100≈10763
Тож перш ніж навіть розглянути попередні ймовірності, дані свідчать про те, що один варіант є вже астрономічно більш імовірним, ніж інший, а для того, щоб змінити будь-який варіант, сині автомобілі повинні бути необґрунтовано, тупо рідкісними (настільки рідкісними, що ми могли б очікувати на знайти 0 синіх машин на землі).
Що робити, якщо ми змінимо, наскільки точні люди у своїх описах кольору автомобіля? Звичайно, ми можемо підштовхнути це до кінця і сказати, що вони це розуміють лише 50% часу, що не краще, ніж гортати монету. У цьому випадку задня ймовірність того, що автомобіль синій, просто дорівнює попередній ймовірності, тому що відповіді людей нам нічого не сказали. Але, безумовно, люди роблять принаймні трохи краще за це, і навіть якщо ми говоримо, що люди точні лише 51% часу, коефіцієнт ймовірності все-таки працює таким чином, що це приблизно в разів більше для машини бути синім.1013
Все це результат досить великої кількості, яку ви вибрали у своєму прикладі. Якби 9/10 людей сказали, що автомобіль був блакитним, це була б зовсім інша історія, хоча те саме співвідношення людей було в одному таборі проти іншого. Тому що статистичні дані не залежать від цього співвідношення, а скоріше від числової різниці між протиборчими фракціями. Насправді, у співвідношенні ймовірності (яке кількісно підтверджує докази), 100 людей, які кажуть, що автомобіль не синій, точно скасовують 100 з 900 людей, які кажуть, що це синій колір, тож це те саме, як якщо б у вас було 800 людей, всі згодні це було синє. І це, очевидно, досить чітке свідчення.
(Редагувати: Як зазначила Срібна рибка , припущення, які я висловив тут, насправді означали, що коли людина неправильно описує не блакитний автомобіль, він за замовчуванням скаже, що це синій колір. Звичайно, це нереально, тому що вони справді можуть сказати будь-який колір , і говоритимуть синім лише час від часу. Це не має жодного значення для висновків, оскільки, чим менше ймовірність людей помилитися не блакитною машиною із синьою, тим сильніші докази того, що вона синя, коли вони це говорять Таким чином, якщо що-небудь, цифри, наведені вище, насправді є лише нижньою межею про синіх доказів.)