Яке ваше улюблене миряни пояснює складну статистичну концепцію?


36

Мені дуже подобається слухати прості пояснення складних проблем. Яка ваша улюблена аналогія чи анекдот, що пояснює складну статистичну концепцію?

Моїм улюбленим є пояснення Мюррея коінтеграції з використанням п'яниці та її собаки. Мюррей пояснює, як два випадкові процеси (блукаюча п'яна та її собака Олівер) можуть мати одиничне коріння, але все ще можуть бути спорідненими (коінтегрованими), оскільки їхні спільні перші відмінності нерухомі.

П'яний вирушає з бару, збираючись безцільно бродити безладно. Але періодично вона інтуює «Олівер, де ти?», І Олівер перериває його безцільне блукання, щоб гавкати. Він чує її; вона чує його. Він думає: "О, я не можу дозволити їй занадто далеко; вона заблокує мене". Вона думає: "О, я не можу дати йому занадто далеко; він розбудить мене посеред ночі своїм гавкотом". Кожен оцінює, наскільки далеко знаходиться інший, і рухається, щоб частково закрити цей проміжок.

Відповіді:


18

Значення р - це міра того, як бентежать дані до нульової гіпотези

Ніколас Максвелл, Дані Матеріалів: Концептуальна статистика для випадкового світу Емерівілла Каліфорнія: Ключове видання коледжу, 2004.


15
  1. Якщо ви вирізали розподіл (гістограму) з деревини і намагалися збалансувати його на пальці, точка балансу була б середньою, незалежно від форми розподілу.

  2. Якщо ви покладете паличку посередині ділянки розкидання і прикріпили палицю до кожної точки даних пружиною, то точка спокою палиці буде вашою лінією регресії. [1]

[1] це технічно було б регресією основних компонентів. вам доведеться змусити пружини рухатися лише «вертикально», щоб вони були найменшими квадратами, але приклад є наочним в будь-якому випадку.


2
Сила пружини пропорційна деформації, тож це не менше значення регресії квадратів!
shabbychef

1
Хороша спроба! Залежить від весни. Наприклад, якщо константа весни дорівнює 1 / сигма, чудово працює;)
Ніл МакГуйган

2
ні, ні, справа в тому, що в статичній рівновазі сума сил була б нульовою; припускаючи рівні пружинні константи, ви б мінімізували суму абсолютних відхилень, тобто регресу, не в останню чергу квадратів. Це ігнорує той факт, що пружини повинні були б вільно плавати на палиці, тому вони зміщуватимуться, щоб деформація не була повністю у напрямку , в результаті чого підходили основні компоненти, але з абсолютними помилками. L1у
shabbychef

@shabbychef: сила пружини, пропорційна деформації, означає, що енергія пружини пропорційна деформації у квадраті. Енергія весни - це дійсно те, що мінімізується при рівновазі. Сума сил, що дорівнює нулю, не є силами або мінімізована. L 1 мінімізує суму абсолютних значень. L1L1
wnoise

12

Я раніше використовував прогулянку п'яниці для випадкової прогулянки, а п’яну та її собаку для коінтеграції; вони дуже корисні (частково тому, що цікаво).

Один з моїх улюблених поширених прикладів - парадокс дня народження ( запис у Вікіпедії ), який ілюструє деякі важливі поняття ймовірності. Ви можете імітувати це з кімнатою, повною людьми.

Між іншим, я настійно рекомендую "Ефект Гелмана " Статистика викладання: мішок хитрощів " для деяких прикладів творчих способів викладання статистичних понять (див . Зміст ). Подивіться також його статтю про курс, який він викладає з викладання статистики: «Курс статистики викладання на рівні університету» . І на тему "Навчання Байєса аспірантам з політології, соціології, громадського здоров'я, освіти, економіки, ..." .

Для опису байєсівських методів використання несправедливої ​​монети та перегортання її кілька разів є досить поширеним / ефективним підходом.


1
Не існує такого поняття, як несправедлива монета: stat.columbia.edu/~gelman/research/publisher/diceRev2.pdf
Tim

11

Мені подобається демонструвати варіативність вибірки і, по суті, теорему про центральну межу через вправу "в класі". Усі в класі говорять, що 100 учнів записують свій вік на аркуші паперу. Всі папірці однакового розміру і складені однаково, після того, як я обчислив середню. Це чисельність населення, і я обчислюю середній вік. Потім кожен учень випадковим чином вибирає 10 аркушів паперу, записує віки і повертає їх у сумку. (S) він обчислює середнє значення і передає сумку наступному учневі. Врешті-решт, у нас є 100 зразків по 10 учнів, що оцінюють середню сукупність, яку ми можемо описати за допомогою гістограми та деяких описових статистичних даних.

Потім ми повторюємо демонстрацію цього разу, використовуючи набір 100 "думок", які повторюють деякі питання "Так / Ні" з останніх опитувань, наприклад, якби вибори (британські Генеральні) були призначені завтра, ви б розглядали можливість голосування за Британську національну партію. Учні вибирають 10 цих думок.

Наприкінці ми продемонстрували варіацію вибірки, теорему про центральний ліміт тощо з неперервними та двійковими даними.


10

Однозначно проблема Монті Холл. http://en.wikipedia.org/wiki/Monty_Hall_problem


1
+1 ця проблема перекрутила мій мозок, коли я вперше прочитав і подумав про це - і рішення досить просте, але багато чого вчить про ймовірність.
Шарпі

1
Я вважаю, що проблема "Монті Холл" - це не що інше, як просто пояснення ймовірності мирян. Я це розумію, але мені все ще важко обернути голову навколо цього, не кажучи вже про те, щоб зрозуміти його досить добре, щоб пояснити це людині, яка не має статистики, і змусити їх чомусь навчитися ... Як би там не було, ви не вказуєте, чи проблема це ваша складна концепція чи пояснення вашого мирянина . -1 поки ти не зробиш.
naught101

2
Простий спосіб пояснити проблему Monty Hall - уявити ту саму проблему, але з 1000 дверима - 999 з них мають козу за собою, і лише 1 з них має за собою машину. Скажіть, ви вибираєте двері, а ведучий ігор показує 998 інших дверей і запитує, чи хочете ви змінити своє рішення на ті двері, які він не відчинив. Знаючи, що він не міг би відчинити двері з машиною за нею, вам доведеться перейти на інші двері (або бути смішно впевненим, що ви мали рацію у своєму первинному виборі).
Берк У.

10

1) Хороша демонстрація того, як потрібно визначити "випадкові", щоб визначити ймовірність певних подій:

Який шанс, що випадкова лінія, проведена по колу, буде довшою за радіус?

Питання повністю залежить від того, як ви малюєте свою лінію. Можливості, які ви можете описати реальним способом для кола, намальованого на землі, можуть включати:

Накресліть дві випадкові точки всередині кола і проведіть через них лінію. (Дивіться, де падають дві мухи / камені ...)

Виберіть фіксовану точку по колу, а потім випадкову в іншому колі та з'єднайте їх. (По суті, це покладання палиці по колу під змінним кутом через задану точку і випадкової, наприклад, там, де камінь падає.)

Накресліть діаметр. Випадково виберіть точку вздовж неї і проведіть через неї перпендикуляр. (Прокрутіть палицю по прямій лінії, щоб вона опиралася по колу.)

Порівняно легко показати того, хто може виконати певну геометрію (але не обов’язково статистику), відповідь на питання може відрізнятися досить широко (приблизно від 2/3 до приблизно 0,866 або близько того).

(1210)

3) Пояснення, чому медична діагностика може здатися справді хибною. Тест на хворобу foo, який на 99,9% точний при виявленні тих, хто його має, але .1% помилково позитивно діагностує тих, хто насправді цього не має, може здатися помилковим насправді так часто, коли поширеність хвороби дійсно низька ( наприклад, 1 на 1000), але багато пацієнтів тестуються на це.

Це найкраще пояснити реальними цифрами - уявіть, що 1 мільйон людей тестуються, тож 1000 хворих мають хворобу, 999 правильно ідентифіковано, але 0,1% з 999 000 - це 999 людей, яким кажуть, що вони це мають, але ні. Так що половина тих, кому кажуть, що насправді цього немає, незважаючи на високий рівень точності (99,9%) та низький рівень помилкових позитивних результатів (0,1%). Потім другий (в ідеалі інший) тест відокремить ці групи.

[Між іншим, я вибрав цифри, оскільки з ними легко працювати, звичайно, їм не доводиться додавати до 100%, оскільки точність / помилкові позитивні показники є незалежними факторами тесту.]


2
Я думаю, що ваш перший приклад стосується парадоксу Бертранда. Дуже приємна ілюстрація різних способів визначення ймовірнісного простору!
chl

9

Книга Сема Савиджа « Проблема середніх показників» наповнена добрими миряними поясненнями статистичних понять. Зокрема, він добре пояснює нерівність Дженсена. Якщо графік рентабельності інвестиції випуклий, тобто він "посміхається вам", то випадковість вам на користь: ваша середня дохідність більша, ніж ваша дохідність в середньому.



6

Behar et al мають колекцію з 25 аналогій для викладання статистики. Ось два приклади:

2.9 Усі моделі теоретичні: У Всесвіті немає ідеальних сфер. Здається, що найпоширенішою геометричною формою у Всесвіті є сфера. Але скільки математично досконалих сфер існує у Всесвіті? Відповідь - жодна. Ні Земля, ні Сонце, ні більярдний кулька не є ідеальною сферою. Отже, якщо немає справжніх сфер, які б хороші формули для визначення площі чи об’єму сфери? Так це і зі статистичними моделями загалом і, зокрема, з нормальним розподілом. Хоча одним із найпоширеніших прикладів є розподіл по висоті, якби ми мали у своєму розпорядженні висоту кожної дорослої людини на планеті, програма гістограми не відповідала б кривій дзвона Гаусса, навіть якщо дані були стратифіковані за статтю, раса, або будь-яка інша характеристика.

2.25 Залишки не повинні містити інформацію: Залишки мішка для сміття - це те, що залишається після видалення всієї інформації з даних. Оскільки вони не повинні містити ніякої інформації, ми вважаємо їх "сміттям". Необхідно переконатися, що ми не викидаємо сміття, яке має значення (інформацію), і яке можна використовувати для кращого пояснення поведінки залежної змінної.

Інші приклади включають

  • "Вплив розміру проби на порівняння методів лікування: збільшення бінокля"
  • "Розмір вибірки порівняно з чисельністю населення: ложка для дегустації супу"

Список літератури

  • Behar, R., Grima, P., & Marco-Almagro, L. (2012). Двадцять п’ять аналогій для пояснення статистичних понять. Американський статистик, (щойно прийнятий).

3

Веселе питання.

Хтось дізнався, що я працюю в біостатистиці, і вони запитали мене (в основному) "Чи не статистика - це лише спосіб брехні?"

(Що повертає цитату Марка Твена про брехні, прокляті брехні та статистику.)

Я намагався пояснити, що статистика дозволяє нам зі стовідсотковою точністю сказати, що, враховуючи припущення та дані, що ймовірність такого-і-то була саме такою-і-такою.

Вона не була вражена.


1
"Дозволяє нам з 100% точністю сказати, наскільки велика наша
неточність

Якщо це не відверте спростування, відповідь @ Jeromy підказує, чому поняття "100% точності" слід брати до кінця.
rolando2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.