Як НЕ використовувати статистику


15

Це свого роду відкрите питання, але я хочу бути зрозумілим. З огляду на достатню кількість населення, можливо, ви зможете чомусь навчитися (це відкрита частина), але що б ви не дізналися про своє населення, коли це коли-небудь стосується члена населення?

З того, що я розумію в статистиці, це ніколи не застосовується до одного члена популяції, однак, все часто я опиняюся в дискусії, де інша людина йде: "Я читаю, що 10% населення планети має це захворювання" і продовжую зробіть висновок, що кожна десята людина в кімнаті має це захворювання.

Я розумію, що десять людей у ​​цій кімнаті не є достатньо великою вибіркою, щоб статистика була релевантною, але, мабуть, багато цього не робиться.

Тоді є ця річ про досить великі зразки. Вам потрібно лише дослідити достатньо велику кількість населення, щоб отримати достовірні статистичні дані. Це, однак, чи не пропорційно складності статистики? Якщо я вимірюю щось дуже рідкісне, чи це не означає, що мені потрібно значно більший зразок, щоб можна було визначити релевантність такої статистики?

Річ у тому, що я справді сумніваюся у достовірності будь-якої газети чи статті, коли йдеться про статистику, і таким чином вона використовується для формування впевненості.

Це трохи тла.

Поверніться до питання, якими способами НЕ можна або НЕ використовувати статистику для формування аргументу . Я заперечував це питання, бо хотів би дізнатися більше про поширені помилки щодо статистики.


2
Це лише дуже часткова відповідь, тому я фактично не публікую це як відповідь. Ви вірні, що складна статистика потребує більшої кількості населення; ви маєте на увазі поняття "ступеня свободи", що є просто кількістю незалежних змінних мінус одна. Також, роблячи щось на кшталт p-тесту, ваш поріг відхилення залежить від кількості ступенів свободи на додаток до вибраного значення p (зазвичай .05).

2
Якщо більше людей читають статистику Гука, як сказати брехунам зі статистиків , можливо, не буде такої кількості "статистичних присосок", як зараз у світі.
JM не є статистиком

1
Я думаю, що вам може бути корисно, задавши це питання статистикою stackexchange - я позначив це питання, тому, можливо, воно буде перенесено туди.
ЗацікавивГост

Я навіть не знав, що у нас є форум, присвячений статистичному аналізу. Я б

3
@JM, або Хаффа, як зв'язатись зі статистикою

Відповіді:


2

Щоб зробити висновки про групу на основі населення, група повинна бути представником населення та незалежною. Інші обговорювали це, тому я не буду зупинятися на цьому творі.

Ще одне, що слід враховувати, - це неінтуїтивність ймовірностей. Припустимо, що у нас є група з 10 осіб, які є незалежними та представниками населення (випадкова вибірка) і що ми знаємо, що в популяції 10% мають певну характеристику. Тому кожен з 10 людей має 10% шансу мати цю характеристику. Поширене припущення полягає в тому, що цілком певно, що принаймні 1 матиме характеристику. Але це проста біноміальна проблема, ми можемо обчислити ймовірність того, що жоден з 10 не має такої характеристики, вона становить приблизно 35% (збільшиться до 1 / е для більшої групи / меншої ймовірності), що набагато вище, ніж більшість людей здогадалися. Також існує 26% шансів, що 2 або більше людей мають цю характеристику.


9

Якщо люди, що знаходяться в кімнаті, не є випадковою вибіркою світового населення, будь-які висновки, засновані на статистиці про населення світу, будуть дуже підозрюваними. Кожен з 5-ти людей у ​​світі є китайцем, але ніхто з моїх п’яти дітей ...


6
  1. Щоб вирішити питання про надмірне використання статистичних даних до невеликих зразків, я рекомендую протидіяти відомим анекдотам ("Я так схвильований, моя мама знову вагітна, а мій рідний брат буде китайцем". "Чому?" "Я читав, що кожен четвертий дитина є китайською. ").

  2. Насправді, я рекомендую жарти, щоб вирішити всі види помилкових уявлень у статистиці, див. Http://xkcd.com/552/ щодо кореляції та причинного зв'язку.

  3. Проблема газетних статей рідко полягає в тому, що вони трактують рідкісне явище.

  4. Парадокс Сімпсона приходить в голову як приклад того, що статистику рідко можна використовувати без аналізу причин.


2
Варіант жарту "китайська дитина", який я чув, коли майбутня мати побоювалася, що її дитину можна буде вважати незаконним іноземцем і, таким чином, депортувати ...
JM не є статистиком

3

Є цікава стаття Мері Грей про зловживання статистикою у судових справах та подібні речі ...

Грей, Мері У .; Статистика та закон. Математика. Маг. 56 (1983), вип. 2, 67–81



1

Статистичний аналіз чи статистичні дані?

Я думаю, що цей приклад у вашому запитанні стосується статистичних даних: "Я читав, що 10% світового населення має це захворювання". Іншими словами, у цьому прикладі хтось використовує цифри, щоб допомогти ефективніше повідомляти кількість, ніж просто говорити "багато людей".

Я здогадуюсь, що відповідь на ваше запитання прихована в мотивації оратора щодо того, чому вона використовує цифри. Це може бути краще донести якесь поняття, або це показати авторитет, або це може засліпити слухача. Хороша річ, коли вказувати цифри, а не говорити "дуже велика", - це те, що люди можуть спростувати число. Дивіться ідею Поппера про спростування.


0

Гіпотеза: А

(Підручник) Результат: Не відкидайтеА (σ=c)

Ваша заява: А тримається з імовірністю σ!

Правильно було б: У цьому випадку ви нічого не знаєте. Якщо ви хочете "довести"А, ваша гіпотеза повинна бути ¬А; відхилити це за допомогоюσ щоб отримати бажане твердження.


0

З того, що я розумію у статистиці, це ніколи не стосується одного члена населення

Це неправда. Це залежить від програми.

Приклад: розпад ядер у фізиці. Швидкість розпаду визначає ймовірність розпаду кожного окремого ядра . Ви берете будь-яке ядро, і воно матиме точно таку ж ймовірність розпаду, яку ви встановили, експериментуючи на зразку.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.