Чи неправильно перефразовувати "1 на 80 смертей, спричинених автомобільною аварією", оскільки "1 в 80 людей гинуть внаслідок автокатастрофи?"


56
  • Заява перша (S1): "Кожна з 80 смертей спричинена автомобільною аварією".
  • Заява друга (S2): "Кожен 80 людей гине внаслідок автомобільної аварії".

Зараз я особисто не бачу великої різниці між цими двома твердженнями. Пишучи, я вважав би їх взаємозамінними для широкої аудиторії. Однак я вже зараз кинув виклик цим питанням двом людям, і шукаю певної додаткової точки зору.

Моя інтерпретація S2 за замовчуванням полягає в тому, що "З 80 людей, що складаються навмання рівномірно з популяції людей, ми очікували б, що одна з них загине внаслідок автомобільної аварії" - і я вважаю це кваліфікованим твердженням еквівалентним S1.

Мої запитання такі:

  • Q1) Чи моє тлумачення за замовчуванням справді еквівалентне Заяві 1?

  • Q2) Чи незвично чи необачно це є моєю інтерпретацією за замовчуванням?

  • Q3) Якщо ви вважаєте, що S1 і S2 відрізняються, так що, щоб заявити другий, коли один означає, що перший вводить в оману / невірно, ви можете, будь ласка, надати повністю кваліфіковану версію S2, що еквівалентно?

Відкладемо очевидну кайфу, що S1 спеціально не стосується смерті людини, і припустимо, що це розуміється в контексті. Відкладемо також будь-яке обговорення правдивості самої претензії: вона має бути ілюстративною.

Як найкраще я можу сказати, розбіжності, які я чув до цього часу, схоже, зосереджуються на дефолті в різних інтерпретаціях першого та другого твердження.

По-перше, мої претенденти, здається, інтерпретують це як 1/80 * num_deaths = кількість загиблих, спричинених автомобільними аваріями, але чомусь за замовчуванням інша інтерпретація другої лінії, "якщо у вас є якийсь набір 80 людей, один з них буде померти в автомобільній аварії »(який, очевидно , не є еквівалентом вимоги). Я думаю, що зважаючи на їх інтерпретацію S1, за замовчуванням для S2 було б це прочитати як (1/80 * num_dead_people = кількість людей, які загинули в автокатастрофі == кількість загиблих внаслідок автокатастрофи). Я не впевнений, чому розбіжність у трактуванні (їх дефолт для S2 є набагато сильнішим припущенням), або якщо вони мають певний природжений статистичний сенс, якого мені насправді бракує.


19
"якщо у вас є 80 осіб, один з них загине в автокатастрофі" - якщо саме так вони розуміють це твердження, то у мене надзвичайно стара жарт про те, що 1 з 3 дітей є китайцями, що вони абсолютно збирається кохати .
Стів Джессоп

3
Це дуже схоже на різницю між поширеністю та захворюваністю . Як зазначали інші, "спричинено" відноситься до деякого закінченого стану, а "вмирає" стосується теперішнього чи майбутнього.
Секст Емпірік

5
S2 не дає зрозуміти, що інші 79 загинули. Деякі або всі інші 79 могли бути живими. S1 каже, що "1 з 80 загиблих", що дає зрозуміти, що всі 80 в групі загинули.
Майкл Черник

5
Як мирянин, не знаючи контексту, я би трактував S1 як: "з усіх причин смерті для населення X 1/80 пов'язаний з автомобільними аваріями", тоді як S2 читає мені: "з усіх причетних людей в автомобільних аваріях 1 з 80 гине через це ".
Gnudiff

5
(S2): "Кожен 80 людей гине внаслідок автомобільної аварії". мені здається неоднозначним. Це кожен з 80 людей, які потрапили в автокатастрофи , або кожен із 80 людей?
Білл Ящірка

Відповіді:


67

Перш за все, моя перша інтуїтивна думка була: "S2 може бути таким же, як S1, якщо рівень смертності в трафіку залишається постійним, можливо, протягом десятиліть", - що, безумовно, не було б хорошим припущенням за останні стільки десятиліть. Це вже натякає, що одна складність полягає в неявних / невисловлених тимчасових припущеннях.

Я б сказав, що ваші заяви мають форму

x populationevent

У S1 чисельність населення - це випадки смерті, і мається на увазі часова специфікація в даний час або "у достатньо великій кількості [щоб мати достатню кількість випадків], але не надто широкій часовій рамці [щоб мати приблизно постійні характеристики ДТП] навколо сьогодення"

У S2 населення - це люди. І інші, здається, читають це не як "вмираючих людей", а як "живих людей" (що, зрештою, це те, що люди частіше / довше роблять). Якщо ви читаєте населення як живих людей, очевидно, що не кожен з 80 людей, які зараз живуть, гине "зараз" від автомобільної аварії. Отже, це читається як "коли вони вмирають (можливо, десятиліттями відтепер], причина смерті - автомобільна аварія".

Прийміть домашнє повідомлення: завжди будьте уважні, щоб уточнити, хто ваше населення та знаменник дробів взагалі. (У Герда Гігерензера є документи про те, як не визначити, що знаменник є основною причиною плутанини, особливо у статистиці та повідомленні про ризики).


1
"У S1 кількість населення - це випадки смерті, і мається на увазі тимчасова специфікація в даний час або" у відповідно великій кількості [щоб мати достатню кількість випадків], але не надто широкій часовій рамці [щоб мати приблизно постійні характеристики ДТП] навколо сьогодення "- Розглядаючи всі (чудові) відповіді, які я отримав, я думаю, що це найбільше вирішує цю проблему. Я був подвійно здивований величезною різноманітністю способів, коли люди можуть висловити друге твердження, і багато хто відкрив моє Очі на ці інтерпретації, але я це статистична специфікація, якої мені не вистачало в початковій заяві.
faulty_ram_sticks

faulty_ram_sticks: Спасибі за квіти :-) І ці дві можливі характеристики популяції, які я зробив із S2, далеко не єдині, наприклад, ви могли б вказати відповідно до відповіді @ PeterShor кількість людей, народжених у певний час, і слідувати цьому один (поздовжньо). І так далі.
cbeleites підтримує Моніку

@cbeleites квіти? які квіти? : - /
Велика качка

1
Можу я також відзначити, що використання «смертей буде викликано» і «люди вмирає » збивають з толком / погана формулювання , як well.I відчуває при описі статистики повинна бути «смерті були викликані» і «люди вмирали». Це робить однозначним, що ви описуєте минулу подію, а не робите прогноз. Звичайно, можна також сказати, що "люди помруть", щоб сказати, що статистика надає довіру передбаченням того, що певний відсоток нинішнього населення загине від автомобільних аварій. Я наводжу ці приклади для подальшого ознайомлення, оскільки вони самі по собі не є відповіддю.
Велика качка

Але сказати , відсоток смертей є викликаними мене бентежить , тому що описує справжню , як якщо подія відбувається прямо зараз або що - то. Якби я це бачив, вважав би це поганим формулюванням, але, мабуть, не надто читав. Однак, оскільки це обговорення формулювань, я відчув, що мені слід це викласти.
Велика качка

80

Для мене "1 на 80 смертей ..." є набагато чіткішим твердженням. Знаменник у вашому "1 на 80" - це сукупність усіх подій смерті, і це твердження робить це явним.

У формулюванні "1 на 80 людей ..." є неоднозначність. Ви дійсно маєте на увазі "1 на 80 людей, які помирають ...", але це твердження так само легко можна інтерпретувати як "1 на 80 людей, які зараз живуть ..." або подібне.

Я все за те, що явно висловлююсь про посилання, встановлені в твердженнях про ймовірність або частоту, як це. Якщо ви говорите про частку загиблих, то кажіть "смерті", а не "люди".


31
"" 1 з 80 людей, які помирають ... "- враховуючи, що не існує такого поняття, як безсмертя, ми можемо з упевненістю припустити, що набір людей, які помруть, - це той самий набір, що і всі люди. Вам знадобиться додатковий кваліфікатор, наприклад "люди, які помруть наступного року "
MSalters

16
@Msalters Висловлювання є в теперішньому часі, тому вони стверджують претензію щодо теперішнього курсу.
Нагромадження

6
Технічно я вважаю, що "1 на 80 людей" є більш конкретним, тому що загинуло набагато більше, ніж смерть людей: загибель птахів, загибель бактерій, загибель педантизму, ...
Кімбол

2
@Pere: Я не зовсім, слідкуйте, ви говорите те саме, що я сказав the 1/80 ratio does focus on the present time in particular. Або я нерозумію?
Flater

3
(На замітку можливої ​​неоднозначності) З точки зору англійської мови; Я думаю, що більш поширеним непорозумінням (і більш серйозним) буде читання S2, яке означає "1 на 80 людей, які трапили автомобільну аварію, загинуть у цій ДТП" (тобто "1 з 80 ДТП є смертельними") - що є зовсім іншим твердженням.
Білкокуя

43

Це залежить від того, опису або прогнозування .

"1 в 80 людей загине в автокатастрофі" - це передбачення. З усіх людей, що живуть сьогодні, через деякий час протягом останнього життя, кожен із 80 загине таким чином.

"1 з 80 смертей спричинені автомобільною аварією", - це опис. З усіх людей, які загинули за певний період (наприклад, часовий проміжок допоміжного дослідження), один із 80 із них дійсно загинув у автомобільній аварії.

Зауважте, що часове вікно тут неоднозначне. Одне речення означає, що смерть вже сталася; інше означає, що вони відбудуться одного дня. Одне речення означає, що ваше базове населення - це люди, які померли (і які були до цього живими); інший означає базове населення людей, які сьогодні живуть (і згодом помруть).

Це фактично різні твердження цілком, і лише одна з них, ймовірно, підтримується вашими вихідними даними.

Зі сторони, неоднозначність виникає через невідповідність стану буття людини (що відбувається постійно) та події вмирання (що відбувається в момент часу). Кожного разу, коли ви комбінуєте речі таким чином, ви отримуєте щось подібне неоднозначне. Ви можете негайно вирішити двозначність, використовуючи дві події замість одного стану та однієї події; наприклад, "З 80 народжених людей 1 людина гине в автокатастрофі".


1
Окрім передбачення, це може бути химерно трактуватися як загроза. Читання цієї відповіді змусило мене подумати про відповідний xkcd .
Wildcard

3
"Сьогодні кожна з 80 смертей спричинена автомобільною аварією. Але, враховуючи швидке вдосконалення транспортних засобів та дорожніх технологій, а також поступове перехід на інші види транспорту, ми очікуємо, що до 2050 року це зменшиться до 120 років, і один із 150 до 2100 року. Відповідно, людей, які живуть сьогодні, лише один із 135 загине в автокатастрофі ".
Майкл Кей

21

Ці два твердження відрізняються через упередженість вибірки, оскільки автомобільні аварії частіше трапляються, коли люди молоді.

Давайте зробимо це більш конкретним, створивши нереальний сценарій.

Розглянемо два твердження:

  • Половина всіх смертей спричинена автомобільною аварією.
  • Половина всіх живих сьогодні людей загине в автокатастрофі.

Ми покажемо, що ці два твердження не є однаковими.

Давайте значно спростимо речі та припустимо, що всі, хто народився, або помруть від серцевого нападу у віці 80 років або від автомобільної аварії у віці 40 років. Далі припустимо, що перша заява вище, і що ми перебуваємо в стабільному стані, смертність врівноважує народжуваність. Тоді будуть три популяції людей, всі однаково великі.

  • Люди до 40 років, які загинуть від автокатастрофи.
  • Люди до 40 років, які помруть від серцевого нападу.
  • Люди старше 40 років, які помруть від серцевого нападу.

Ці три популяції повинні бути однаково великими, тому що кількість людей, які загинули в автомобільних аваріях (від першого населення вище), і рівень людей, які помирають від серцевих нападів (від третього населення вище), рівні.

1/401/40

Тож у цьому випадку лише одна третина всіх людей, які живуть сьогодні, загине в автокатастрофі, тому дві заяви не є однаковими.

У реальному житті моє враження таке, що автомобільні аварії трапляються в значно молодшому віці, ніж більшість інших причин смерті. У такому випадку буде велика різниця між числами у вашій заяві один і два.

Якщо ви змінили друге твердження на

  • Половина всіх народжених людей загине в автокатастрофі,

тоді, при припущенні стаціонарного населення, два твердження були б рівнозначними. Але, звичайно, в реальному світі у нас немає сталого населення, і подібний (хоча і складніший) аргумент показує, що для зростаючого або скорочуваного населення вибір зміщення вибірки все-таки робить ці два твердження різними.


"Ці три популяції повинні бути однаково великими, тому що частота людей, що помирають від серцевих нападів (від першої популяції вище), і частота людей, що помирають від інфарктів (від третього населення вище), рівні". Як ви думаєте, ви могли б зробити це трохи очевидніше? (Також я припускаю, що ви маєте на увазі автомобільні аварії для першого населення) Інакше це чудовий приклад. Я навіть не думав, що може бути різниця між "половиною всіх народжених людей" та "половиною всіх живих людей".
faulty_ram_sticks

@faulty_ram_sticks. Так: зміщення вибірки може бути складним. Я пояснив це більш докладно ... Сподіваюся, це зараз досить добре. І дякую за те, що я спіймав мою друк
Петро Шор

5
Це чудове запитання щодо зміщення вибірки. Той факт, що перші 8 відповідей не виявили упередженості вибірки, показує, що це справді складно. Я можу використовувати його, коли навчаю ймовірності.
Петро Шор

Дуже вдало побудований, чіткий аргумент і той, який не лише теоретично зриває інтуїцію ОП про еквівалентність способом, який він, мабуть, навіть не думав.
Пітер - Відновіть Моніку

12

Чи моє тлумачення за замовчуванням справді еквівалентне Заяві 1?

Немає.

Скажімо, у нас 800 людей. 400 загинули: 5 від автокатастрофи, інші 395 забули дихати. Тепер S1 вірно: 5/400 = 1/80. S2 помилково: 5/800! = 1/80.

Проблема полягає в тому, що технічно S2 неоднозначний, оскільки в ньому не вказано, скільки смертей було загалом, а S1. Крім того, у S1 є ще одна інформація (загальна кількість загиблих) та одна менша частина інформації (загальна кількість людей). Узяті за номіналом, вони описують різні співвідношення.

Чи незвичне чи необачне це моє тлумачення за замовчуванням?

Я насправді не погоджуюся з вашою інтерпретацією, але я думаю, що це не має значення. Ймовірно, контекст дозволить зрозуміти, що мається на увазі.

  • З одного боку, очевидно, що всі люди вмирають, таким чином, мається на увазі, що загальна кількість людей = загальна смерть. Отже, якщо ви загалом обговорюєте показники смертності, застосовується ваше тлумачення за замовчуванням.
  • З іншого боку, якщо ви обговорюєте обмежений набір даних, в якому не всі дані помирають, моє тлумачення вище є більш точним. Але читачеві здається, що це важко не помітити цього.

Ви можете запитати, де ви могли зіткнутися з людьми, які не вмирають. Для одного ми могли б працювати зі статистичним набором даних, який відслідковує людей лише протягом 5 років, тому ті, хто ще живий в кінці дослідження, повинні ігноруватися, оскільки невідомо, від чого вони помруть. Крім того, причина смерті може бути невідомою, і в цьому випадку ви не можете присвоїти її автомобілям чи не автомобілям.

Якщо ви вважаєте, що S1 і S2 різні, такі, що заявити другий, коли один означає, що перший вводить в оману / невірно, ви можете, будь ласка, надати повністю кваліфіковану версію S2, еквівалентну?

"Кожен з 80 людей, які загинули, робить це внаслідок автомобільної аварії". що означає перефразування S1.


yy

Але це було лише стороною. Що я хотів сказати, це те, що ця відповідь відзначає лише семантичну проблему, але не вистачає статистичного питання про ситуацію, що ймовірність смерті внаслідок ДТП не є постійною незалежною від часу. Це робить його інакшим, коли ми маємо на увазі «спричинено» (минуле) та «(загине)» (теперішнє чи майбутнє).
Секст Емпірік

"Причина смерті" - це медико-юридичний термін, який потребує прихованого часу для медичного встановлення, звітування та збору. Це можна констатувати лише в ретроспективі лише тоді, коли вірогідність відсутності причини вмирання невелика, або в іншому випадку виправляється відсутні дані, наприклад, шляхом включення пізньої звітності з попереднього періоду звітності. Таким чином, статистично правильне твердження звучить що - щось на кшталт «У географічній області збору даних в протягом періоду часу , шанси смерті в зв'язку з дорожньо - транспортні пригоди були , по оцінках, один з 80 випадків смерті.»
Карл

7

Я погодився б, що ваше тлумачення другого твердження узгоджується з першим твердженням. Я також погодився б, що це цілком розумна інтерпретація другого твердження. Однак, друге твердження набагато неоднозначніше.

Друге твердження також можна інтерпретувати як:

  • Враховуючи зразок осіб, що відбулися в недавній автомобільній катастрофі, 1/80 загинула.
  • Зважаючи на вибірку населення в цілому, 1/80 загине через фактори, пов'язані з автомобільною катастрофою, деякі з них - самі нещасні випадки, а інші - самогубства, травми, непрацездатність лікарів, пильнування правосуддя тощо.
  • Екстраполяція сучасних тенденцій безпеки свідчить про те, що 1/80 людей, які живуть сьогодні, загинуть через автомобільну аварію.

Друге та третє вище трактування можуть бути досить близькими для широкої аудиторії, але перше досить суттєво відрізняється.


2
Перше тлумачення "1/80 всіх постраждалих в автокатастрофі гинуть через ДТП" - це те, як я спочатку трактував друге твердження. Хоча я не вважаю, що це правильне тлумачення і більше схоже на результат непрочитаного читання.
Секст Емпірік

5

Основна відмінність полягає в тому, що два твердження стосуються різних груп населення та різних часових рамків.

"Кожна з 80 смертей спричинена автомобільною аварією", мабуть, стосується частки загиблих за певний досить обмежений часовий період (скажімо, один рік). Оскільки питома вага загальної кількості населення, що користується автомобілями, та показники безпеки автомобілів значно змінилися з часом, заява не має сенсу, якщо ви не вкажете, на який часовий проміжок йдеться. (Як смішний приклад, очевидно, було б абсолютно неправильно 1919 рік, враховуючи рівень власності та користування автомобілями у загальній кількості населення на той час). Зауважимо, "частка всього населення, яке користується автомобілями", у вищезазначеному - це фактично помилка - це повинна бути "частка людей, які помруть найближчим часом за допомогою автомобілів"

"Кожен 80 людей помирає внаслідок автокатастрофи", мабуть, йдеться про всіх людей, які зараз живуть у якомусь регіоні, та їх можливу причину смерті в якийсь невідомий майбутній час. Оскільки поширеність та безпека подорожей на автомобілі майже напевно зміниться протягом їхнього життя (скажімо, протягом наступних 100 років для новонароджених немовлят), це твердження дуже відрізняється від першого.


3

A1) Якщо припустити, що всі помирають, і припускаючи, що контекст достатньо малого періоду часу, протягом якого були проведені вимірювання, так, ваша інтерпретація S2 відповідає S1.

A2) Так, ваша інтерпретація S2 необдумана. S2 можна трактувати як "1 з 80 людей, які беруть участь у автомобільних аваріях", що, очевидно, не еквівалентно S1. Тому використання S2 може спричинити плутанину.

Ваша інтерпретація 1 на 80 є розумною, однак інша інтерпретація (1 з будь-яких 80) є дуже незвичною. "1 в N з U є P" є дуже поширеною скороченням для "даного предиката, P і N випадкових вибірок, x, з Всесвіту U, очікувана кількість зразків, така що P (x) справді приблизно дорівнює 1" .

A3) Якщо всі люди, 1 на 80 помирає внаслідок автокатастрофи.


Ви не пояснюєте свою відповідь А1. Тим не менш, було кілька відповідей, що стосуються інших питань (сказати "А1" не). Чи можете ви пояснити, чому це не так?
Секст Емпірік

@MartijnWeterings Єдина відповідь, яка сказала "ні" A1, здається, не погоджується на тій підставі, що за певний проміжок часу не всі вмирають. Як ви вважаєте, мої редагування це стосуються?
Ваелюс

Я вважаю, що пропозиція, яка не вказує на те, що інші 79 померли від інших причин, є неоднозначною. Тож найкраще констатувати інше.
Майкл Черник

Ваелю, є ще одна причина сказати «ні» A1. Ця причина полягає в тому, що частка загиблих внаслідок дорожньо-транспортних пригод може не потребувати постійної тривалості в часі, тому це неоднозначно, і S1 і S2 мають різний погляд на цей (не постійний) вираз.
Секст Емпірік

-1

Так, це неправильно, і жодне словосполучення не здається достатнім, щоб послідовно передати бажаний сенс

Виступаючи як непрофесіонал, якщо ваша мета - непрофесійні люди, я б напевно рекомендував опублікувати повідомлення за адресою https://english.stackexchange.com/ , а не тут - ваше запитання зайняло кілька читань, щоб розв’язати, що інтуїтивно значить для мене S1 & S2 порівняно з тим, що ви хотіли сказати.

Для запису мої інтерпретації кожного твердження:

  • (S1) - на 80 загиблих, 1 смерть внаслідок автокатастрофи

  • (S2) - на 80 осіб у ДТП, 1 смерть

Щоб передати ваше значення, я, швидше за все, використовував би модифікований S2: "Кожен 80 людей загине в автокатастрофі".

Це все ще містить деяку неоднозначність, але зберігає схожу стислість.


Це коментар, а не відповідь.
Майкл Черник

1
@Michael Вибачте, як це? Я не прошу роз'яснення чи вказівки на друкарські помилки чи що-небудь - будь ласка, повідомте мене, чи допоможе редагування.
ap55
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.