Якщо 900 з 1000 людей кажуть, що машина синя, яка ймовірність, що вона синя?


114

Це спочатку виникло у зв’язку з деякою роботою, яку ми робимо для моделі класифікації природного тексту, але я спростив його ... Можливо, занадто багато.

У вас синій автомобіль (за якоюсь об'єктивною науковою мірою - синій).

Ви показуєте це 1000 людям.

900 кажуть, що це синій колір. 100 ні.

Ви надаєте цю інформацію тому, хто не може побачити машину. Все, що вони знають, - 900 людей сказали, що це синій колір, а 100 - ні. Ти нічого більше не знаєш про цих людей (1000).

Виходячи з цього, ви запитуєте людину: "Яка ймовірність того, що машина синя?"

Це викликало величезне розбіжність думок серед тих, кого я запитував! Яка правильна відповідь, якщо така є?


162
Цікаво, які відповіді були б, якби ти змінив машину на одяг .
користувач1717828

13
То яке питання до людей? "Автомобіль синій?" або "Якого кольору машина?"
kon psych

13
Що означає автомобіль синього кольору? Якщо деякі кажуть, що автомобіль не блакитний, то, ймовірно, це колір, який деякі називають синім, а інші називають іншою назвою. Це не означає, що вони не згодні з кольором, це означає, що вони не згодні з назвою кольору.
Бен

7
Я думаю, що питання було б значно покращено, якби ви давали різні розбіжні думки, з якими ви стикалися. Як зараз, відповіді можуть просто вивчити все поле - від теорії ймовірностей до теорії кольорів або навіть біології (дальтонізму) дико, і я не бачу, як це насправді допоможе вам.
AnoE

32
В описі проблеми щось не вистачає. 100 людей заперечують, що автомобіль синій, коли він, звичайно, синій, - це багато людей, ви не можете просто відкинути їх як випадкові помилки.
Аксакал

Відповіді:


117

TL; DR: Якщо ви не припускаєте, що люди нерозумно погано оцінюють колір автомобіля, або що сині автомобілі є безпідставно рідкісними, велика кількість людей у ​​вашому прикладі означає, що ймовірність того, що машина синього кольору, в основному становить 100%.

Метью Дрюрі вже дав правильну відповідь, але я просто хотів би додати до цього декілька числових прикладів, тому що ви вибрали свої цифри таким чином, що ви насправді отримуєте досить схожі відповіді для широкого спектру різних параметрів параметрів. Наприклад, припустимо, як ви сказали в одному зі своїх коментарів, що ймовірність того, що люди правильно оцінюють колір автомобіля, становить 0,9. Тобто: а також p ( скажіть, що він не синій | автомобіль не синій ) = 0,9 = 1 - p ( скажіть, це синій | машина не синя )

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Визначившись із цим, нам залишається вирішити: яка попередня ймовірність того, що автомобіль синій? Виберемо дуже низьку ймовірність, щоб побачити, що відбувається, і скажемо, що , тобто лише 0,1% усіх автомобілів синього кольору. Тоді задню вірогідність того, що автомобіль синій, можна обчислити так:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

Якщо подивитися на знаменник, то цілком зрозуміло, що другий доданок у цій сумі буде незначним, оскільки відносний розмір доданків у сумі переважає відношення до , що знаходиться на порядку . І дійсно, якщо ви зробите цей розрахунок на комп’ютері (дбаючи про те, щоб уникнути числових проблем із підтоком), ви отримаєте відповідь, рівну 1 (в машинній точності). 0,1 900 10 580.99000.19001058

Причина попередніх ймовірностей насправді не має великого значення в тому, що у вас є стільки доказів для однієї можливості (автомобіль синій) проти іншої. Це можна кількісно визначити коефіцієнтом ймовірності , який ми можемо обчислити як:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

Тож перш ніж навіть розглянути попередні ймовірності, дані свідчать про те, що один варіант є вже астрономічно більш імовірним, ніж інший, а для того, щоб змінити будь-який варіант, сині автомобілі повинні бути необґрунтовано, тупо рідкісними (настільки рідкісними, що ми могли б очікувати на знайти 0 синіх машин на землі).

Що робити, якщо ми змінимо, наскільки точні люди у своїх описах кольору автомобіля? Звичайно, ми можемо підштовхнути це до кінця і сказати, що вони це розуміють лише 50% часу, що не краще, ніж гортати монету. У цьому випадку задня ймовірність того, що автомобіль синій, просто дорівнює попередній ймовірності, тому що відповіді людей нам нічого не сказали. Але, безумовно, люди роблять принаймні трохи краще за це, і навіть якщо ми говоримо, що люди точні лише 51% часу, коефіцієнт ймовірності все-таки працює таким чином, що це приблизно в разів більше для машини бути синім.1013

Все це результат досить великої кількості, яку ви вибрали у своєму прикладі. Якби 9/10 людей сказали, що автомобіль був блакитним, це була б зовсім інша історія, хоча те саме співвідношення людей було в одному таборі проти іншого. Тому що статистичні дані не залежать від цього співвідношення, а скоріше від числової різниці між протиборчими фракціями. Насправді, у співвідношенні ймовірності (яке кількісно підтверджує докази), 100 людей, які кажуть, що автомобіль не синій, точно скасовують 100 з 900 людей, які кажуть, що це синій колір, тож це те саме, як якщо б у вас було 800 людей, всі згодні це було синє. І це, очевидно, досить чітке свідчення.

(Редагувати: Як зазначила Срібна рибка , припущення, які я висловив тут, насправді означали, що коли людина неправильно описує не блакитний автомобіль, він за замовчуванням скаже, що це синій колір. Звичайно, це нереально, тому що вони справді можуть сказати будь-який колір , і говоритимуть синім лише час від часу. Це не має жодного значення для висновків, оскільки, чим менше ймовірність людей помилитися не блакитною машиною із синьою, тим сильніші докази того, що вона синя, коли вони це говорять Таким чином, якщо що-небудь, цифри, наведені вище, насправді є лише нижньою межею про синіх доказів.)


11
+1. Насправді, з огляду на дані ОП, оцінка MLE про те, як часто люди є точними, становить 900/1000 = 90%.
амеба

5
Правильний колір автомобіля у 50% часу - це не те, що гортати монету. Зрештою, існує набагато більше, ніж просто два кольори. Також, може, деякі кажуть «темно-синій» чи «блакитний» замість «синього»? Насправді, люди-майни неправильно скажуть «блакитний», коли правильною відповіддю буде «якийсь фантазійний і модний запатентований колір, який майже схожий на блакитний»
Хаген фон Ейтцен

10
Я знаю, що це лише наочні цифри, але якщо "ймовірність того, що люди правильно оцінюють колір автомобіля, становить 0,9", тоді, якщо немає нічого особливого щодо синього кольору, я не вважаю, що доцільно претендувати на p (скажімо синій | автомобіль не синій) = 0,1. Якщо ми думаємо, що 90% часу люди визначають правильний колір, то p (скажімо, червоний | автомобіль червоний) = p (скажімо, білий | автомобіль білий) = p (скажімо, зелений | автомобіль зелений) = 0,9 і так на всі можливі кольори автомобіля. Але навіщо p (скажімо, синій | автомобіль червоний) = p (скажімо, синій | автомобіль білий) = p (скажімо, синій | автомобіль зелений) = 0,1? Це означає, наприклад, p (скажімо, білий | автомобіль червоний) = 0.
Срібна рибка

2
@PatMolloy: Не обов’язково. Це залежить від того, чи є ймовірність симетричною: чи однаково ймовірність, що хтось помилиться на синій для не-синього автомобіля, як це те, що хтось помиляє не-блакитний для синього автомобіля? Якщо так, то вирок у 500/500 дає рівно стільки інформації, скільки і кидання монети. Але якщо люди рідше кажуть, що синій автомобіль є блакитним, ніж вони говорять про те, що синій автомобіль не блакитний, то 500 синьомовців важче пояснити, ніж 500 не синьомовців, під не блакитна гіпотеза. Тож у такому випадку баланс доказів нахилився б до синього.
Рубен ван Берген

3
Сприйняття кольорів - справа хитра. Якщо дев'ять з десяти людей говорять, що плаття біле і золоте, яка ймовірність синього і чорного?
Glen_b

73

Правильна відповідь залежить від інформації, не вказаної в проблемі, вам доведеться зробити ще кілька припущень, щоб отримати єдину, остаточну відповідь:

  • Попередня ймовірність, що автомобіль синій, тобто ваша віра, що машина синя, якщо ви ще нікого не просили.
  • Імовірність того, хто - то говорить вам , що автомобіль синього кольору , коли він на справді є синій, і ймовірність того, що вони говорять вам автомобіль синього кольору , коли він на справді НЕ синій.
  • Ймовірність того, що автомобіль насправді синій, коли хтось каже, що він є, і ймовірність того, що машина не синя, коли хтось каже, що синій.

За допомогою цих фрагментів інформації ми можемо розбити всю справу за допомогою формули Байєса, щоб отримати задню вірогідність того, що автомобіль синій. Я зупинюсь на тому випадку, коли ми запитуємо лише одну людину, але ті ж міркування можна застосувати і до випадку, коли ви просите людей.1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

Нам потрібно продовжувати далі руйнуватися , це де до приходить в:P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

Тож два додатки за правилом Байєса потрапляють до вас. Вам потрібно буде визначити не визначені параметри на основі будь-якої інформації, яку ви маєте про конкретну ситуацію, або зробивши деякі розумні припущення.

Є деякі інші комбінації того, які припущення ви можете зробити на основі:

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

Спочатку ви нічого не знаєте про ці речі. Отже, ви повинні зробити кілька розумних припущень щодо трьох з них, а потім четверте визначається звідти.


5
Це часто буває. Тоді у вас є два варіанти, висловити свою повну відсутність знань, вважаючи, що синій та не синій є однаковою мірою. Зробіть короткий огляд поля, щось подібне може допомогти: en.wikipedia.org/wiki/Car_colour_popularity
Метью Друрі

18
@Matthew проблема з "синім, а не синім є однаковою мірою" полягає в тому, що це не узгоджується; якщо ми застосуємо одне і те ж міркування до кожного з можливих кольорів автомобіля, ми закінчимося твердженням, що всі вони одночасно мають 50% шансів (неможливо з більш ніж двома кольорами за законами ймовірності) і менше 50% шансів (коли ви дивіться на синій колір у "не білому" та "не червоному", що також призводить до суперечностей, оскільки ймовірність того, що будь-який колір не може прийняти декілька значень)
Glen_b

2
Інформація є більше, ніж ця, тому що відповідь людей не повинна бути незалежною (насправді, ми сподіваємось, що вони сильно корелюються з об'єктивним кольором, отже, далеко не незалежними). Що робити, якщо відповіді залежать "надмірно"? Скажімо, ми просто запитуємо десять випадкових пішоходів, але чи кожен з них відповів 100 разів?
Хаген фон Ейтцен

2
@HagenvonEitzen та MatthewDrury. Насправді, те, що вам також потрібно припустити, - це не незалежність, а умовна незалежність . Іншими словами . P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
Лука Сіті

15
@Glen_b: У світі є лише два кольори - синій та не-синій. Справді, обидва мають різні відтінки, особливо не блакитного.
psmears

13

Є важливе припущення, що ваші 1000 думок не поділяють систематичної упередженості. Що є обґрунтованим припущенням, але може бути важливим в інших випадках.

Прикладами можуть бути:

  • всі вони поділяють схожість кольорового сліпоти (наприклад, генетика в популяції),
  • всі вони бачили машину вночі під помаранчевим натрієвим освітленням,
  • всі вони поділяють загальну культуру, в якій синій колір є табу або магічно асоційованим (що упереджує, чи вони описують будь-який об’єкт як блакитний чи використовують культурний евфемізм чи що інше),
  • всім їм сказали (або поділяють загальну думку), що якщо вони чи не відповідатимуть певним чином, з ними станеться щось хороше / погане .....

У цьому випадку це мало ймовірно, але в інших випадках це важливе припущення. Це також не повинно бути таким крайнім - перенесіть своє запитання на якийсь інший домен, і це буде справжнім фактором.

Приклади для кожного, де на вашу відповідь може вплинути спільне зміщення:

  • запитайте, чи є у високому тонкому склянці більше, ніж насправді ідентичний короткий жирний келих, але ваші 1000 респондентів дуже маленькі діти (спільне неправильне сприйняття).
  • запитайте 1000 людей, чи небезпечно ходити під драбиною (загальна культурна думка)
  • запитайте 1000 одружених, чи люблять вони свого партнера / мали справу, за обставин, коли вони вважають, що їхній партнер дізнається про їх відповідь Контекст може бути телевізійним шоу або присутнім партнера, коли його запитують тощо (загальна думка про наслідки)

Не важко було б уявити деякі структурно однакові питання, де відповідь 900: 100 була мірою переконань та чесності чи щось інше, і не вказує на правильну відповідь. У цьому випадку мало ймовірно, але в інших випадках - так.


11

Однією з причин, коли ви отримуєте різні відповіді від різних людей, є те, що питання можна інтерпретувати по-різному, і не ясно, що ви маєте на увазі під "ймовірністю" тут. Один із способів осмислити питання - це привласнити пріори та розум, використовуючи правило Байєса, як у відповіді Метью.

Перш ніж запитати про ймовірності, ви повинні вирішити, що моделюється як випадкове, а що ні. Не загальновизнано, що невідомі, але фіксовані величини слід присвоювати пріорам. Ось подібний до вашого експеримент, який висвітлює проблему з питанням:

Припустимо, , це випадкові величини Бернуллі з імовірністю успіху (середнім) . Для інтерпретації давайте подумаємо про як про монетки. Припустимо, ви спостерігаєте (достатня статистика) . Яка ймовірність справедливості монети? i = 1 , , 1000 p = 0,5 X i 1000 i = 1 X i = 900Xii=1,,1000p=0.5Xii=11000Xi=900

З точки зору частолістістів питання є або безглуздим, або відповідь "єдиним". Якщо ви баєсіанець, можливо, ви хочете призначити попередній розподіл , і в цьому випадку питання має сенс. Принципова відмінність мого прикладу від питання полягає в тому, що невідомий у питанні, і питання маскує той факт, що фактична випадковість - це відповідь (імовірно випадковою вибіркою) людина відповідає, що автомобіль синій чи ні. Колір автомобіля не присвоєний випадковим чином, і тому нецікаво говорити про ймовірність того, що він стане синім з точки зору частолюдистів.рpp


1
Отже, якщо зняти припущення про те, що машина синя, а решта однакова, 900 людей кажуть, що синя, а 100 - ні, в такому випадку ймовірність складе 0,9?
користувач

Ні, це набагато набагато ближче до 1. Це дуже, дуже малоймовірно, що 900 з 1000 людей неправильно отримають колір.
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.це не відповідає розумінню "ймовірності", як я з ним знайомий. Це звучить трохи як "X може статися або не може відбутися, тому ймовірність повинна бути 50%". Чи можете ви зробити трохи більш зрозумілим, що ви маєте на увазі під цим реченням?
AnoE

2
@AnoE відмінність є аналогічною між параметрами та випадковими змінними. Це задано в постановці питання, що автомобіль насправді синій, його колір не є результатом випадкового експерименту. Це, по суті, частістська інтерпретація проти Байєса. Якщо ви перевернете монету 1000 разів і спостерігаєте за 900 голів, то яка ймовірність справедливості монети? Це або один, або нуль, якщо ви часто (або безглуздо); ми не присвоюємо ймовірності параметрам.
еквалл

@user Ні, я оновив відповідь, щоб зробити свою точку яснішою.
еквалл

7

Проста практична відповідь:

Імовірність може легко коливатися від 0% до 100% залежно від ваших припущень

Хоча діючі відповіді мені дуже подобаються, але на практиці це зводиться до цих двох простих сценаріїв:

Сценарій 1: Люди вважають, що вони дуже добре розпізнають блакитний, коли він синій ... 0%

У цьому випадку так багато людей заявляють, що машина не синя, що дуже малоймовірно, що машина насправді синя. Отже, ймовірність наближається до 0%.

Сценарій 2: Люди вважають, що дуже добре розпізнають не блакитний, коли він не блакитний ... 100%

У цьому випадку так багато людей заявляють, що машина синя, що дуже ймовірно, що вона справді синя. Отже, ймовірність наближається до 100%.


Звичайно, виходячи з цього математичного ракурсу, ви б почали щось загальне, як-от "припустимо, що відповідні ймовірності є ...", що є цілком безглуздим, оскільки такі речі, як правило, не відомі за випадкових обставин. Тому я закликаю дивитися на крайнощі, щоб зрозуміти, що обидва відсотки легко можна виправдати простими та реалістичними припущеннями, і тому немає єдиної змістовної відповіді.


2
Якщо "люди вважають, що дуже добре розпізнають блакитний", чому б вони вважали, що це синій колір, коли його немає в сценарії 1? Можливо, ви захочете висловити свої сценарії у вигляді помилкових позитивів та помилкових негативів.
Гайд

@hyde Переробили сценарії, щоб усунути двозначність
Денніс Джахеруддін


5

Потрібно розробити деякі рамки оцінки. Деякі запитання ви можете задати

  1. Скільки там кольорів? Ми говоримо два кольори? Або всі кольори веселки?

  2. Наскільки відмінні кольори? Ми говоримо синій і помаранчевий? Або синій, блакитний і бірюзовий?

  3. Що означає бути синім? Блакитний та / або бірюзовий синій колір? Або просто синій сам?

  4. Наскільки хороші ці люди при оцінці кольору? Вони всі графічні дизайнери? Або вони кольорові сліпі?

З чисто статистичної точки зору ми можемо зробити певні здогадки щодо останнього. По-перше, ми знаємо, що принаймні 10% людей вибирають неправильну відповідь. Якщо є лише два кольори (з першого питання), то можна сказати, що є

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

Як швидка перевірка, якщо їх додати разом, ми отримаємо 100%. Більш математичне позначення цього можна побачити у відповіді @MatthewDrury .

Як ми отримуємо 90% на третій? Скільки людей сказали сині, але помилилися, якщо це не так. Оскільки є лише два кольори, вони симетричні. Якщо б було більше двох кольорів, то шанс неправильного вибору бути синім, коли вони сказали, що щось інше буде нижчим.

У будь-якому випадку цей метод оцінки дає нам 90% синього кольору. Сюди входить 81% шансу людей сказати блакитний, коли він є, і 9% шансів людей сказати, що це не так, як є. Це, мабуть, найближче до відповіді на початкове запитання, і це вимагає від нас покладатися на дані, щоб оцінити дві різні речі. І припустити, що шанс обрати синій такий самий, як шанс синього бути правильним.

Якщо є більше двох кольорів, то логіка трохи зміниться. Перші два рядки залишаються однаковими, але ми втрачаємо симетрію в двох останніх рядках. У такому випадку нам потрібно більше інформації. Ми можемо оцінити шанс правильно сказати синій знову як 81%, але ми не маємо поняття, які шанси на те, що колір синій, коли хтось скаже, що це не так.

Ми могли б також покращити навіть дві оцінки кольорів. Враховуючи статистично значну кількість автомобілів кожного кольору, ми можемо мати статистично значну кількість людей, що їх переглядають і класифікують. Тоді ми могли б порахувати, наскільки часто люди мають рацію, коли роблять кожен вибір кольору і як часто вони підходять до кожного вибору кольору. Тоді ми могли б більш точно оцінити дані фактичного вибору людей.

Ви можете запитати, як 90% може помилятися. Поміркуйте, що станеться, якщо є три кольори: блакитний, синій та сапфіровий. Хтось може розумно вважати всі три з них синіми. Але ми хочемо більше. Ми хочемо точного відтінку. Але хто пам’ятає назви інших відтінків? Багато хто може здогадатися про синій, оскільки це єдиний відповідний їм відтінок. І все-таки помиляйтесь, коли виявляється блакитним.


Як вже згадувалося в одному з попередніх коментарів, напевно єдиними двома відповідними кольорами є «блакитний» та «не синій», тому частина про декілька кольорів не повинна бути потрібною.
Денніс Джахеруддін

4

Точне, математичне, істина / неправда ймовірність не може бути обчислена за допомогою інформації , яку ви надаєте.

Однак у реальному житті така інформація ніколи не доступна з певністю. Тому, використовуючи нашу інтуїцію (і куди б пішли всі мої гроші, якби ми зробили ставку), машина, безумовно, синього кольору. (деякі вважають, що це вже не статистика, але добре, чорно-білі погляди на науку не дуже корисні)

Міркування просте. Припустимо, машина не синя. Тоді 90% людей (!) Помилялися. Вони можуть помилятися лише через перелік питань, включаючи:

Оскільки вищезазначене явно не вплине на 90% середньої випадкової популяції (наприклад, кольорова сліпота зачіпає близько 8% чоловіків і 0,6% жінок, тобто 43 людини з 1000), це обов'язково має місце так, що автомобіль синій. (Тобто якби всі мої гроші все одно пішли).


Це здається мені інтуїтивно зрозумілим. Я думаю, що критика оригінального питання полягає в тому, що вона не дає достатньо інформації та що певні припущення мають бути зроблені .. ну хіба це не завжди так у реальному світі ???
Пат Моллой

@PatMolloy Він не дає достатньо інформації, щоб дати точну правильну / неправильну складну математичну відповідь (що, безумовно, те, що багато питань мають на меті отримати з цього сайту). Однак, враховуючи зменшену інформацію, яку ви давали, коли йдеться про гроші на ставки, це відповідь (100%) люди виберуть.
luchonacho

1
Я думаю, що вам не вдалося висвітлити деякі найбільш правдоподібні альтернативи - саме ті, які повинні змусити вас змінити свій висновок. До них належать: (а) люди не в змозі розпізнати синій колір; (b) немає спільного розуміння "синього" між запитувачем та респондентами; (c) "наукове" значення "синього" відрізняється від того, що люди зазвичай розуміють як "блакитний". Важливо, оскільки ви не можете кількісно оцінити жодну з цих альтернатив, а також більшість тих, які ви перераховуєте, як ви можете обґрунтувати кількісне визначення ймовірності відповіді? Це не статистика!
whuber

"Оскільки вищезазначене явно не вплине на 90% середньої випадкової кількості населення" Не будьте впевнені в цьому. Пам'ятайте, що ми загалом говоримо з точки зору середніх показників, коли обговорюємо людей. Так що впевнено, що лише кілька відсотків мають кольорову сліпоту (порівняно із середньою), але може бути декілька осіб, які мають чудовий зір, наприклад тетрахромати.
NPSF3000

2
Я завжди під впливом РК
Олексій

2

Я б не їв кал, виходячи з того, що мільярд мух не може помилитися. Можливо, десятки інших причин, через що 900 людей з 1000 могли б обдурити, що автомобіль вважає блакитним. Зрештою, це основа магічних хитрощів, що заманюють людей думати про щось, віддалене від реальності. Якщо 900 людей з 1000 побачать фокусника, колючого свого помічника, вони негайно відповідуть, що помічник був нарізаний ножем, наскільки неймовірне вбивство сталося на сцені. Синє світло на світловідбиваючої фарбі для автомобіля, хто?


2

Опитуваний знає занадто мало про те, як було проведено опитування, щоб точно відповісти на питання. Наскільки він стурбований, опитування може зазнати кількох проблем:

Люди, які брали участь у опитуванні, могли бути упередженими:

  1. Машина виглядала синьою через оптичну ілюзію .

  2. Колір автомобіля чомусь було важко спостерігати, і людям чомусь було показано багато синіх машин перед цим, змусивши більшість з них повірити, що і цей автомобіль був, мабуть, синім.

  3. Ви заплатили їм, щоб сказати, що машина синя.

  4. У вас хтось загіпнотизував усіх, хто вважає, що машина синя.

  5. Вони уклали пакт про брехню та саботаж опитування.

Можливо, існували кореляції серед людей, які брали опитування, через те, як вони були відібрані або через те, що вони вплинули один на одного:

  1. Ви випадково провели опитування на масових зборах для людей з однаковою кольоровою сліпотою.

  2. Ви провели опитування в дитячих садках; дівчатка не цікавились машиною, і більшість хлопців мали синій як улюблений колір, змушуючи їх уявити, що машина синя.

  3. Перша людина, якій показали машину в нетверезому стані і подумала, що вона виглядає синьою, крикнула "ЦЕ БЛАГО", впливаючи на всіх інших, думаючи, що машина синя.

Тож хоча ймовірність того, що автомобіль синій, якщо опитування було проведено повністю правильно, надзвичайно висока (як це пояснено у відповіді Рубен ван Берген), надійність опитування, можливо, була порушена, що робить шанс того, що машина не буде синьою незначний. Наскільки великий запитувач оцінює цей шанс в кінцевому підсумку, залежить від його оцінок, наскільки ймовірними є обставини, що викривились з опитуванням, і наскільки ви хороші в проведенні опитувань (і наскільки дурним він вважає вас).


2

Що таке визначення "синій"?

У різних культурах та мовах різні поняття синього кольору. IIRC, деякі культури включають зелений колір у поняття синього!

Як і будь-яке слово на природній мові, ви можете лише припустити, що існує певна культурна умова про те, коли (а коли ні) називати речі "синіми".

Загалом, колір мови є напрочуд суб'єктивним (посилання з коментарів нижче, дякую @Count Ibilis)

введіть тут опис зображення


7
У контексті питання я вважаю, що саме цей аспект є неактуальним - я вважаю, що ОП вибрало слово "синій" як дуже загальний термін, а не щось на зразок "блакитний", "торкуїз" тощо. Також автомобілі зазвичай використовують дуже обмежену палітру можливих / звичайних кольорів. Нарешті, питання не в тому, «чому 100 людей сказали не блакитним кольором», а в тому, «яка ймовірність того, що машина насправді синя».
AnoE


Точним визначенням було б "випромінює світло, що має довжину хвилі 475 нм плюсминус ~ 10-20 нм в сучасних екологічних умовах". Це загальноприйнято як синій.
rackandboneman

Так, але скільки людей ведуть за собою інструмент для вимірювання переважної довжини хвилі? Ви також забули виключити невидимі довжини хвиль.
Аноні-Мус

1
Здається, питання стосується використання групи людей невідомого калібрування статистично як метр довжини хвилі :)
rackandboneman

1

Ймовірність може залежно від більш доопрацьованих передумов мати кілька різних значень, але 99,995% - це те, що має для мене найбільш сенс.

Ми, за визначенням, знаємо, що машина синя (це на 100%), але не точно визначено, що це насправді означає (що було б дещо філософським). Я припускаю, що щось синє в сенсі, що насправді можна побачити як блакитне.

Ми також знаємо, що 90% випробовуваних повідомили про це як блакитний.

Ми не знаємо, що запитували або як проводилася оцінка, і в яких умовах освітлення знаходилась машина. Попросивши назвати колір, деякі суб'єкти, наприклад, могли сказати "зеленувато-синій" через умови освітлення, і оцінювач може не вважали це "блакитним". Ті ж самі люди могли відповісти "так", якби питання було "Чи це синій колір?". Я припускаю, що ви не мали наміру зловмисно обманювати своїх випробуваних.

Ми знаємо, що частота тританопії становить приблизно 0,005%, що означає, що якщо автомобіль насправді можна побачити як блакитний , то 99,995% досліджуваних дійсно бачили колір як блакитний. Це, однак, означає, що 9,995% випробовуваних не повідомили про синій колір, коли вони чітко побачили синій колір. Вони брехали про побачене. Це близько до того, що говорить вам і ваш життєвий досвід: люди не завжди є чесними (але, якщо немає мотиву, вони зазвичай є).

Таким чином, людина, яка не спостерігає, може з величезною впевненістю припустити, що машина синього кольору. Це було б на 100%

За винятком ... за винятком випадків, коли людина, яка не спостерігає, страждає від тританопії, і в такому випадку вона не побачила б машину як блакитну, хоча всі інші (а точніше 90% з них) так говорять. Ось воно знову стає філософським: Якщо всі чули, як дерево падає, а я ні, чи воно впало?

Я смію сказати, що найбільш розумною, практичною відповіддю буде: Якщо людина, яка не спостерігає, є тріанопою (шанс 0,005%), то перевірка того, чи передбачений колір та реальний колір однакові, однакові, призведе до помилкового. Таким чином, ймовірність становить 99,995%, а не 100%.

Далі, як бонус, оскільки ми з'ясували, що 9,995% випробовуваних - брехуни, і відомо, що всі критяни - брехуни , ми можемо зробити висновок, що ми не на Криті!


1

У вас синій автомобіль (за якоюсь об'єктивною науковою мірою - синій).

...

"Яка ймовірність того, що машина синя?"

Він на 100% синій.

Все, що вони знають, - 900 людей сказали, що це синій колір, а 100 - ні. Ти нічого більше не знаєш про цих людей (1000).

Використання цих чисел (без будь-якого контексту) є абсолютно нонсенсом. Все зводиться до особистої інтерпретації питання. Ми не повинні піти цим шляхом і використовувати Вітгенштейн: "Wovon man nicht sprechen kann, darüber muss man schweigen".


Уявіть наступне питання для порівняння:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

Це в основному та сама проблема (менш інформації), але набагато зрозуміліше, що те, що ми думаємо про колір автомобіля, є здебільшого (якщо не повністю) обставинним.


Зрештою, коли ми отримуємо кілька пов’язаних питань, ми можемо почати відгадувати відповіді на такі неповні запитання. Це те саме для алгоритму tit-for-tat, який не працює в одному випадку, але він працює в довгостроковій перспективі . У цьому ж сенсі Вітгенштейн повернувся зі своєї попередньої роботи зі своїми Основними розслідуваннями . Ми можемо відповісти на ці запитання, але нам потрібна додаткова інформація / випробування / питання. Це процес.


0

Якщо ми припустимо, що автомобіль є блакитним, то 100 з 1000, які говорять, що це не синій колір, передбачають надзвичайний упереджений зразок. Можливо, ви брали вибірки лише на незрячих людей. Якщо припустити, що автомобіль не синій, то зміщення зразка ще гірше. Отже, з усіх даних, що ми можемо зробити висновок, є те, що зразок дуже упереджений, і оскільки ми не знаємо, наскільки він був упередженим, ми не можемо нічого зробити висновок про колір автомобіля.


Гм, напевно той факт, що 900 людей сказали, що це блакитний, чи щось добре? Чи не можемо ми зробити висновок, що швидше синій, ніж ні ?? Пам'ятайте, що респондент знає лише цифри 900 і 100. Тож вони дійсно можуть щось сказати про упередженість?
Пат Моллой

0

Є відповіді. Я аж ніяк не гуру з математики, але добре, ось моє.

Можливі лише 4 можливості:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

Із запитання ви знаєте, що сума справи 1 та справи 4 становить 900 осіб (90%), а сума 2 та 3 справи - 100 осіб (10%). Однак тут є улов: те, чого ви не знаєте, - це розподіл між цими двома парами випадків. Можливо, сума справ 1 і 4 повністю складається із випадку 1 (а це означає, що автомобіль синій), або, можливо, вся сума складається з випадку 4 (а це означає, що автомобіль не синій). Те саме стосується суми справи 2 + 3. Отже ... Що вам потрібно - це придумати якийсь спосіб передбачити розподіл у сумах справи. Не маючи інших вказівок на запитання (ніде не сказано, що люди на 80% впевнені, що знають їх кольори чи щось подібне), ви не можете знайти певну, певну відповідь.

Сказавши це ... я підозрюю, що очікувана відповідь є чимось за принципом:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

де решта 50% просто невідомі, назвіть це межами помилки.


0

Нехай позначають справжній колір і відповіді відповідно. "Синій" кодується як , і навпаки. Припустимо, що - Бернуллі з параметром . Припустимо, що кожен - Бернулл з параметром , і припустимо - Бернуллі з параметром . Також виберіть пріоритет для параметрів .X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

Ви шукаєте . Сформулювавши це так, підкреслюється той факт, що (принаймні, якщо ви баєсієць) вам потрібно вибрати пріори для цих трьох параметрів. Байєсівська точка зору приємна тим, що ви могли скористатися тим, що знаєте про те, як часто автомобілі сині, і що ви знаєте про тенденції людей погоджуватися з реальністю.p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

Також ви можете узагальнити цю модель. Наприклад, що робити, якщо автомобіль змінює кольори, або якщо ви дивитеся на послідовність автомобілів (тоді у вас є послідовність ), або якщо люди оснащені для оцінки кольорів автомобіля ( не розподіляються однаково) або якщо люди засновують свої рішення на тому, що говорять інші тощо.{ y i | х }{xi}{yi|x}


-3

Людина, яка не може побачити машину, не знає, що науково доведено, що вона синя. Ймовірність того, що автомобіль синій - 50/50 (синій, чи ні). Опитування інших людей може вплинути на думку цієї людини, але це не змінює ймовірність того, що невидимий автомобіль буде синім, чи ні.

Вся вищевикладена математика визначає ймовірність того, що ваш набір зразків може визначити, чи є він синім кольором.


Я не впевнений, що це правда, що ймовірність того, що вона синього кольору, становить 50/50. Насправді це менше 50, оскільки він може бути червоним, білим, жовтим і т. Д. Ймовірність того, що автомобіль, вибраний навмання, синій, набагато менше 50%.
користувач
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.