Інтервал довіри та ймовірність - де помилка в цьому твердженні?


12

Якщо хтось робить заяву, як нижче:

"Загалом, некурящі, які потрапляють під дію екологічного диму, мали відносний ризик ішемічної хвороби серця на 1,25 (95-відсотковий інтервал довіри, 1,17-1,32) порівняно з некурящими людьми, які не потрапляють до паління"

Який відносний ризик для населення в цілому? Скільки речей пов’язано з ішемічною хворобою серця? З величезної кількості речей, які можна перевірити, дуже мало насправді пов'язані з ішемічною хворобою серця, тому шанс, що якась конкретна річ, обрана навмання, зникає, малий. Таким чином, ми можемо сказати, що відносний ризик для населення становить 1. Але процитований інтервал не містить значення 1. Отже, або насправді існує зв'язок між цими двома речами, ймовірність яких зникає мало, або це одна з 5% інтервалів, які не містять параметр. Оскільки останній набагато частіше, ніж перший, це те, що ми повинні припустити. Тому відповідним висновком є ​​те, що набір даних майже напевно нетиповий для населення,

Звичайно, якщо є певна основа для припущення, що більше від 5% речей пов'язані з ішемічною хворобою серця, то в статистиці можуть бути деякі докази, які підтверджують припущення про те, що екологічний дим є одним із них. Здоровий глузд говорить про те, що це малоймовірно.

Яка помилка в їх міркуванні (оскільки всі організації охорони здоров’я погоджуються з тим, що є значна література щодо згубних наслідків куріння вживаних)? Це через їхні передумови, що "З величезної кількості речей, які можна перевірити, дуже мало насправді пов'язані з ішемічною хворобою серця"? Це речення може бути справедливим для будь-якого випадково обраного фактора (тобто, скільки собак у людини належить до ризику ішемічної хвороби), але апріорна ймовірність значно більша для куріння та ішемічної хвороби серця, ніж просто "будь-який випадковий фактор" .

Це правильне міркування? Або є щось інше?


Текст, що цитується, здається ... ну як цитата. Звідки воно? :)
MånsT

ха-ха, це цитата з Вікіпедії ... хтось додав це до статті для "інтервалу довіри". Я намагаюся його зняти, тому що це явно невірно, але хлопець відмовляється, тому мені потрібна математично обгрунтована причина замість просто "це явно неправильно" .. хоча у мене є деякі ідеї, я хотів знати, чи хтось може пояснити які саме помилки тут робляться. Тому що якщо це було правильно, то багато досліджень можна спростувати з аналогічних підстав
BYS2

3
Якщо воно трохи затягнеться, я переїду і спробую допомогти. Його аргумент очевидно помилковий і рішуче вказує на те, що він має порядок денний.
Ерік

3
Як фізик, який використовує багато статистичних даних, але не є статистиком, я вважаю, що цей абзац дуже корисний, не маючи на увазі те, що він звучить просто неправильно. Я завжди думав, можливо, неправильно, що 95% cl означало, що якщо нульова гіпотеза була вірною, то 1 раз у 20, якщо я повторюю експеримент, я отримаю результат, що є значним на рівні 95% (на мою думку, не використовуйте менше 99,9, але це ще одне обговорення). Ця публікація, здається, більше стосується корельованих факторів і насправді взагалі не допомагає не експертам (або комусь).
Боулер

@Erik. Користувач має досить хитру історію лялькового шкарпетки (мав кілька облікових записів та використовує правки IP) і заблокувався раніше ... не впевнений, у чому полягає його угода. Але це здається
проблематичним

Відповіді:


10

H0H1

H0H1

Потім він оновлює свою попередню заяву, заявляючи, що ймовірність отримати 95% інтервал впевненості, що не містить справжнього значення, має ймовірність 5%. Хоча це правда, це не шанс отримати саме цей інтервал під припущенням нульової гіпотези . Зауважимо, що він вважав би інтервал довіри [1.17, 1.32] точно таким же, як довірчий інтервал [100, 200], що явно проблематично.

Це дійсно важливо для байєсівського підходу: хоча ви маєте загальну ймовірність 5% не отримати інтервал, що містить 1, за умови, що 1 дорівнює нулю, щільність ймовірності отримання конкретного інтервалу різна (і менша).

H0H1

Четверта помилка - сказати, що належними діями було б відхилення даних. Зауважте, що його результат навіть не залежить від даних, його аргумент означає, що саме такі дії були б зроблені для будь-яких даних. Якщо ви знайдете цікаве посилання, але підозрюєте, що це може бути просто фальшивка, належним науковим завданням є спробувати повторити свій результат!


Дякуємо за розширення відповіді Нестора! Хоча швидке запитання, ви заявили, що "... це не шанс отримати саме цей інтервал під припущенням нульової гіпотези". Якби ми хотіли знайти шанс отримати певний інтервал під припущенням нульової гіпотези, нам би потрібно було використовувати байєсівський висновок і правильний інтервал? Інтервали довіри часто говорять вам лише про "шанс, що інтервал буде містити справжнє значення". Ще раз
дякую

Інтервал частоти довіри 95% побудований таким чином, що принаймні 95% разів, коли пройдений інтервал, містить справжнє значення. Все йде нормально. Якщо говорити, ви можете також обчислити ймовірність (або значення щільності) отримання певного довірчого інтервалу, якщо нульова гіпотеза відповідає дійсності. Точне місце розташування містить більше "інформації", ніж просто те, чи містила вона нульову гіпотезу. Викидання цієї інформації є поганим при використанні байєсівських висновків, оскільки це стосується ймовірності того, що нульове значення буде істинним.
Ерік

Прикладом іграшки є такий: Байєсівський умовивід, ви хочете зробити висновок у формі розподілу. Попередній дозволяє дві можливості: H1: Розподіл є нормальним нормальним. Н2: Нормальний розподіл, середнє = sd = 1. Зразок значень розподілів дозволяє оновити попереднє. Коли вам дадуть лише ознаки ваших значень, ви також можете оновити свої попередні, але оновлення буде менш інформативним, оскільки ви викинули відповідну інформацію.
Ерік

7

Це досить цікаве філософське питання, пов’язане з тестуванням гіпотез (і, таким чином, у періодичній обстановці також довірчі інтервали, як я пояснюю тут ).

Звичайно, існує безліч гіпотез, які можна було б дослідити - пасивне куріння викликає ішемічну хворобу серця, вживання алкоголю викликає ХД, приналежність собак викликає ХД, а Козеріг викликає ХД ...

Якщо ми обираємо одну з усіх цих гіпотез навмання, ймовірність того, що ми обираємо гіпотезу, яка, як істинна, практично дорівнює нулю. Це, мабуть, є аргументом у цитованому тексті - що навряд чи ми перевірили справжню гіпотезу.

Але гіпотеза була обрана не випадково. Це було мотивоване попередніми епідеміологічними та медичними знаннями про ішемічну хворобу серця. Існують теоретичні механізми, які пояснюють, як куріння може спричинити ішемічну хворобу серця, тому не здається надуманим думати, що вони також працюватимуть для пасивного куріння.

Критика в цитаті може бути справедливою для дослідницьких досліджень, де набір даних використовується для гіпотез. Саме тому ми не приймаємо такі «відкриття» як факти - замість цього ми вимагаємо, щоб результати можна було повторити в нових дослідженнях. Так чи інакше, цитований у цитаті документ є метадослідженням, і тому ця проблема не торкається.

Протягом останніх століть емпірично ми бачили, що тестування гіпотез, мотивованих теорією, порівнюючи прогнозовані результати із спостережуваними результатами, працює. Те, що ми віримо в цю процедуру, є причиною того, що ми досягли такого великого прогресу в галузі медицини, техніки та науки. Це є причиною того, що я можу написати це на своєму комп’ютері і ви можете прочитати це на своєму. Стверджувати, що ця процедура неправильна - це стверджувати, що науковий метод є принципово хибним - і ми маємо безліч доказів, які говорять про інше.

Я сумніваюся, що є щось, що людина, яка не бажає приймати подібні докази, насправді прийме ...


Я справді не отримав ваш абзац до останнього; чи замислюєтесь ви на "тестування на значимість" (наприклад, обчислення ймовірності даних принаймні більш екстремально) чи справді на "перевірку гіпотез" (байєсівська настройка)? Хто сказав, що будь-який з них не працює, якщо поставити правильне запитання?
Нестор

@ Нестор: Можливо, я, мабуть, писав би це інакше. Я насправді не робив заяву про тестування статистичної гіпотези, а радше робив спостереження про те, що порівняння прогнозів моделі з даними реального світу (тобто "тестування", якщо гіпотеза правильна) здається дуже ефективним способом здійснення наука. В основі цієї критики проти КІ, я вважаю, небажання приймати цей метод. Вид аргументів, наведених у цитаті, застосовуватиметься до будь-якого статистичного методу - з нульовими попередніми ймовірностями для всіх нульових гіпотез ми ніколи ні в що не віримо.
MånsT

6

Я дійсно не розумію, чому автор каже, що ймовірність відносного ризику захворювання на ІХС може бути малою, будуючи його аналіз виключно на довірчому інтервалі; це явно неправильно. Мені це здається, що він використовує частофілістські налаштування, але він міркує байезіан (що досить часто).

H0:p(De|H0)Dep(H0|D)D

p(H0|D)p(D|H0)p(H0),
p(H0)H0

Чи не буде H0: не існує зв'язку між пасивним курінням та ІХС? Оскільки нульова гіпотеза зазвичай є гіпотезою, що ефекту немає. Крім цього, дякую за цю відповідь!
BYS2

Так, ви праві! Я цього не помічав, поки ви не вказали :-). Я відредагую свою відповідь.
Нестор

3

Хоча в цій байєсівській міркуванні є щось (деконструйоване дуже грунтовно Еріком!), І справді ця думка пояснювала б, чому багато медичних висновків неможливо відтворити, саме цей аргумент застосовує таке мислення як кувалду.

Автор припускає дві речі, не надаючи доказів: що потрапляння до паління було обрано випадково, і що майже нічого у світі не спричиняє хвороб серця. Відповідно до цих похилих стандартів міркувань, автор міг би відхилити будь-який висновок про те, що щось викликає захворювання серця. Все, що вам потрібно зробити, це стверджувати:

  1. Що гіпотеза була обрана випадковим чином, і
  2. Ця хвороба серця має дуже близькі до нуля причини.

Обидва ці твердження є дискусійними (і, виходячи з моїх загальних знань, дуже вірогідні). Але, маючи ці припущення, навіть зауважуючи, що 100% людей, що потрапили до паленого диму, загинули від серцевого нападу протягом року, можна стверджувати, що зв’язок - це лише випадкова кореляція із прихованою, єдиною, "справжньою" причиною .


Добре дякую за ваші думки! Так, автор однозначно припускав, що гіпотеза була «обрана випадковим чином», що невірно.
BYS2

-1

Я не бачу нічого очевидного неправильного з абзацом у цитатах, але я не бачив даних і не можу перевірити, чи є це цифри. Однак два абзаци, що слідують за ним, дуже незрозумілі.

Припустимо, він сказав: "Загалом у некурящих, що страждають на ожиріння, відносний ризик ішемічної хвороби серця становив 1,25 (95-відсотковий інтервал довіри, 1,17-1,32) порівняно з некурящими, які мали нормальну масу тіла". Хтось мав би причини сумніватися в ньому?


Ну а перший абзац в цитатах був саме автором, цитуючи висновки епідеміологічного дослідження, тому в цьому немає нічого поганого. Наступні кілька пунктів намагаються дискредитувати дослідження, де він робить деякі сумнівні твердження.
BYS2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.