Які найпоширеніші упередження, які люди роблять під час збору чи інтерпретації даних?


39

Я екон / стат. Мені відомо, що економісти намагалися змінити свої припущення щодо поведінки та раціональності людини, визначивши ситуації, в яких люди не ведуть себе раціонально. Наприклад, припустимо, що я пропоную вам 100% шанс втрати 1000 доларів США або 50% шансу при втраті 2500 доларів , люди вибирають варіант 2500 доларів, хоча очікуване значення останнього - більший збиток, ніж гарантований 1000 доларів США втрати. Це відомо як «відраза до втрат». Економісти поведінки зараз вивчають ці закономірності та намагаються визначити, як люди відхиляються від тих аксіом, які, як правило, вважають "раціональною" поведінкою. Тут я припускаю, що раціонально віддати перевагу найменш очікуваним втратам.

Мені було цікаво, чи встановили статистики загальні закономірності в зборі даних, які дають необ’єктивні результати в тому, як люди інтерпретують дані. Якщо був по суті "раціональний" спосіб збору даних, я припускаю, що є приклади, коли люди відхиляються від цього і виявляють "упередженість". Якщо так, то які найпоширеніші упередження люди роблять під час збору чи інтерпретації даних?


5
Є чудовий документ Podsakoff et al. який переглядає загальні методи упередженості та пропонує як статистичні, так і процедурні засоби: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf Подивіться на Таблицю 2.
айхан


10
У вас ірраціональна презумпція ірраціональності. Ви не можете застосувати функцію корисності до результату. У вашому наведеному прикладі припустіть, що у людини є 1000 доларів, і потрібно скористатися нею, щоб погасити бандитську позику через хвилину, або бандит буде вбитий. 100% шанс втрати 1000 доларів призводить до 100% шансу бути вбитими, тоді як 50% шансу втрати 2500 доларів призводить лише до 50% шансу бути вбитими. Як головний екон, вам слід налаштувати корисність як вихідну точку, перш ніж заявити про ірраціональність.
Марк Л. Стоун

3
Статистики зазвичай не проводять такого роду дослідження. Цікаво, чи цей Q більше підходить для сайту Психологія та нейронаука .
gung - Відновіть Моніку

3
Я думаю, що ефект вуличного світла - пошук загублених ключів (даних) під підсвічуванням, тому що там знаходиться світло вночі - надзвичайно поширене, особливо зараз, коли так багато легких даних на кран. // Немає "раціонального способу" збирання даних, тому що ви - дослідник, який їх збирає - не є випадковим.
AS

Відповіді:


23

Я думаю, що в наукових колах p-значення дуже часто трактуються неправильно. Люди схильні забувати, що значення р виражає умовну ймовірність. Навіть якщо експеримент був ідеально проведений і всі реквізити обраного статистичного тесту виконані, частота помилкового виявлення зазвичай набагато вище, ніж рівень альфа-значення. Швидкість виявлення помилок збільшується зі зменшенням статистичної потужності та поширеності справжніх позитивних результатів (Colquhoun, 2014; Nuzzo, 2014).

Крім того, люди схильні сприймати свої оцінки як правду і параметр, який вони оцінюють як випадковий (Haller & Kraus, 2002). Наприклад, коли вони говорять, що у "95% випадків цей ідентифікований довірчий інтервал охоплює параметр" ...

Плутанина кореляції та причинного зв’язку, ймовірно, також є дуже поширеною помилкою в інтерпретації даних.

Щодо збору даних, я думаю, що поширеною помилкою є взяття найбільш легкодоступного, а не найбільш репрезентативного зразка.

Colquhoun, D. (2014). Дослідження рівня помилкового виявлення та неправильного тлумачення значень Р. Відкрита наука Королівського суспільства, 1–15.

Нуццо, Р. (2014). Статистичні помилки: значення P, "золотий стандарт" статистичної валідності, не такі надійні, як вважають багато вчених. Природа, 506, 150–152.

Haller, H. & Kraus, S. (2002): Помилкові тлумачення значущості: проблема, яку учні поділяють зі своїми вчителями? Методи психологічних досліджень в Інтернеті, т.7, №1


19

Я б сказав загальну нездатність оцінити, як виглядає справжня випадковість. Люди, здається, очікують занадто мало помилкових зразків, ніж насправді трапляються в послідовностях випадкових подій. Це також виявляється, коли ми намагаємось самостійно моделювати випадковість.

Інший досить поширений - це не розуміння незалежності, як у помилковості азартних гравців. Ми іноді думаємо, що попередні події можуть вплинути на майбутні, навіть коли це абсолютно неможливо, як попередня угода перетасованої колоди карт, що впливає на майбутню.


7

Вже вказувалося, що багато поведінкових та мисленнєвих процесів економістами, позначеними як "ірраціональні" або "упереджені", насправді є дуже адаптивними та ефективними в реальному світі. Тим не менш, питання ОП цікаве. Я думаю, однак, що може бути вигідніше посилатися на більш фундаментальні, описові знання про наші пізнавальні процеси, а не шукати конкретні "упередження", які відповідають тим, що обговорюються в економічній літературі (наприклад, неприязнь до втрат, ефект дарування, бездарне зневага тощо).

Наприклад, оцінювання , безумовно, є проблемою в аналізі даних. Теорія оцінювання стверджує, що ми перевантажуємо інформацію, яку нам легко інтерпретувати чи оцінювати. Розглянемо випадок коефіцієнта регресії. Оцінити "реальний" наслідки коефіцієнта може бути важкою працею. Нам потрібно розглянути одиниці незалежної та залежної змінної, а також розподіли нашої незалежної та залежної змінної, щоб зрозуміти, чи має коефіцієнт практичне значення. З іншого боку, оцінити значення коефіцієнта нескладно: я просто порівнюю його p-значення з моїм альфа-рівнем. Враховуючи більшу оцінюваність p-значення порівняно з самим коефіцієнтом, мало дивно, що так багато складається з p-значень.

(Стандартизація збільшує оцінюваність коефіцієнта, але може збільшити неоднозначність : сенс, що відповідна інформація недоступна або відмовлена, оскільки "оригінальна" форма даних, які ми обробляємо, нам недоступна.)

Пов'язаний когнітивний "упередженість" - це принцип конкретності, схильність до інформації про зайву вагу, яка "є там" у контексті прийняття рішення та не потребує пошуку з пам'яті. (Принцип конкретності також говорить про те, що ми, швидше за все, використовуємо інформацію у тому форматі, в якому вона надана, і, як правило, уникаємо перетворень.) Інтерпретацію p-значення можна здійснити, просто подивившись на результат регресії; це не вимагає від мене отримання будь-яких предметних знань про те, що я моделюю.

Я очікую, що багато упереджень інтерпретації статистичних даних можна простежити до загального розуміння того, що ми, швидше за все, підемо легким шляхом при вирішенні проблеми чи формуванні судження (див. "Когнітивний помилок", "обмежена раціональність" тощо) . Так само, роблячи щось "з легкістю", як правило, підвищується впевненість, з якою ми дотримуємось отриманих переконань ( теорія вільного володіння ). (Можна також розглянути можливість того, що дані, які легше сформулювати- нам самим чи іншим - переважені в наших аналізах.) Я думаю, що це стає особливо цікавим, коли ми враховуємо можливі винятки. Наприклад, деякі психологічні дослідження говорять про те, що якщо ми вважаємо, що проблему слід важко вирішити, то ми можемо віддати перевагу менш конкретним та складним підходам та рішенням, наприклад, вибрати більш прихований метод над простим.


7

Найбільший єдиний фактор, про який я можу подумати, широко відомий як "ухил підтвердження". Опинившись на тому, що, на мою думку, покаже моє дослідження, я некритично приймаю дані, які призводять до цього висновку, при цьому виправдовуючи всі пункти даних, які, здається, спростовують його. Я можу несвідомо відхиляти як "очевидну помилку інструменту" (або якусь аналогічну) будь-які точки даних, які не відповідають моєму висновку. У деяких випадках це буде не так нахабно; замість того, щоб викидати ці точки даних цілком, я буду придумувати якусь формулу для усунення "помилки", яка зручно спрямовуватиме результати на підтвердження мого попередньо визначеного висновку.

У цьому немає нічого особливо ганебного; це як працює наш мозок. Для фільтрації подібних ухилів потрібні великі зусилля, і це одна з причин, чому вчені люблять придумувати подвійні сліпі дослідження, такі, що людина, яка проводить вимірювання, не знає, що експеримент повинен довести. Тоді для цього потрібна величезна дисципліна, щоб не коригувати те, що він сумлінно вимірював.


1
Я думаю, що це найнебезпечніший ухил насправді тому, що він вже може статися на етапі збору даних, наприклад, збирання даних у крихітній підпробі, яка, швидше за все, підтвердить ваші очікування або використовуючи провідні питання опитування.
стинь

1
Відхилення підтвердження можуть бути дуже поганими між дисциплінами, де навіть передбачувана фундаментальна основа дисциплін є різною, що приводить до твердження, що "X неможливо (використовуючи) вашу дисципліну (з її методами зондування), але очевидно в моїх (ми можемо сенс X) ". наприклад, яблука мають на увазі висіти на деревах або лежати на землі; вони не можуть «впасти» за власним бажанням. Часто у фізичних науках відбувається зміна математичної основи, що приховує плутанину.
Філіп Оуклі

6

Лінійність .

Я думаю, що загальна упередженість під час інтерпретації / аналізу даних полягає в тому, що люди, як правило, швидко приймають лінійні відносини. Математично регресійна модель передбачає, що її детермінований компонент є лінійною функцією предикторів; на жаль, це не завжди так. Нещодавно я пішов на бакалаврську плакатну конференцію, і кількість найяскравіших квадратичних чи нелінійних тенденцій, які я побачила, що вони оснащені лінійною моделлю, хвилювалась.

p


2

Інтересний випадок - це обговорення помилки гравців.

Чи повинні бути включені чи виключені наявні дані? Якщо я вже випередив 6 шістдесят, чи варто їх включити до мого пробігу з десятка спроб? Будьте чіткі щодо попередніх даних.

Коли я повинен перейти від абсолютних чисел до коефіцієнта? Потрібно тривалий час, щоб перевага, здобута під час виїзної виграшної смуги, повернулася до нуля (випадкова прогулянка).

0,1% мільйона доларів може не бути великою компанією, але втратити 1000 доларів може бути життям і смертю для одноосібного продавця (саме тому інвестори хочуть, щоб “спонукали” людей інвестувати в них). Можливість переходу на відсотки може бути упередженою.

Навіть статистики мають упередження.


2

Я б рекомендував «Thinking, Fast і Slow» по Деніел Канеман , що пояснює багато когнітивні упередження в ясному мовою.

Ви також можете посилатися на " http://www.burns-stat.com/review-thinking-fast-slow-daniel-kahneman/ ", який узагальнює деякі ухили у вищевказаній книзі.

Для більш детального резюме розділу можна прочитати " https://erikreads.files.wordpress.com/2014/04/thinking-fast-and-slow-book-summary.pdf ".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.