Регрес до середнього значення в «Думаю, швидко і повільно»


14

У мисленні, швидкому і повільному , Даніель Канеман ставить таке гіпотетичне запитання:

(С. 186) Наразі Джулі є старшим в державному університеті. Вона читала вільно, коли їй було чотири роки. Який середній бал за її оцінку (GPA)?

Його наміром є проілюструвати, як ми часто не доводимо до регресу до середнього значення, роблячи прогнози щодо певної статистики. У подальшому обговоренні він радить:

(С. 190) Нагадаємо, що співвідношення між двома заходами - у даному випадку віком читання та ГПД - дорівнює частці спільних факторів серед їх детермінант. Яка найкраща здогадка про цю пропорцію? Моя найбільш оптимістична здогадка - близько 30%. Беручи до уваги цю оцінку, у нас є все, що нам потрібно для об'єктивного прогнозування. Ось вказівки, як дістатися туди в чотири простих кроки:

  1. Почніть з оцінки середнього середнього показника.
  2. Визначте середній бал, який відповідає вашому враженню доказів.
  3. Оцініть співвідношення між швидкістю читання та GPA.
  4. Якщо кореляція дорівнює .30, перемістіть 30% відстані від середнього до відповідного GPA.

Моє тлумачення його порад таке:

  1. Використовуйте "Вона вільно читала, коли їй було чотири роки", щоб встановити стандартний бал для швидкості читання Джулі.
  2. Визначте середній бал, який має відповідний стандартний бал. (Раціональне прогнозування ГДД відповідало б цьому стандартному балу, якби кореляція між GPA та швидкістю читання була ідеальною.)
  3. Оцініть, який відсоток відхилень у ГПД можна пояснити різницею швидкості читання. (Я припускаю, що він має на увазі коефіцієнт детермінації з "кореляцією" в цьому контексті?)
  4. Оскільки лише 30% від стандартного показника швидкості читання Джулі можна пояснити факторами, які також можуть пояснити стандартний бал її середнього балу, ми лише обґрунтовано прогнозуємо, що стандартна оцінка Джулі складе 30% від тієї, яка була б у випадку досконалої кореляції.

Чи правильне моє тлумачення процедури Канемана? Якщо так, чи існує більш формальне математичне обґрунтування його процедури, особливо кроку 4? Загалом, який взаємозв'язок між співвідношенням між двома змінними та змінами / відмінностями в їх стандартних показниках?

Відповіді:


2

Чи правильне моє тлумачення процедури Канемана?

Це трохи важко сказати, тому що крок Канемана №2 не сформульований дуже точно: "Визначте ГПД, що відповідає вашому враженню доказів" - що саме це повинно означати? Якщо враження когось добре відкалібровані, то не буде потреби коректуватися до середнього. Якщо в когось враження сильно збиті, то вони повинні скоріше виправити ще сильніше.

Тож я погоджуюся з @AndyW, що поради Канемана - це лише правило.

zz

[...] чи існує більш формальне математичне обґрунтування його процедури, особливо кроку 4? Загалом, який взаємозв'язок між співвідношенням між двома змінними та змінами / відмінностями в їх стандартних показниках?

ухzρ

у=ρх,

хуρ

Саме це називається "регресом до середнього". Деякі формули та виводи можна побачити в дискусії у Вікіпедії .


8

Порядок ваших номерів не відповідає цитаті Канемана. Через це здається, що, можливо, вам не вистачає загальної точки.

Точка Канемана є найважливішою. Це означає буквально оцінити середній бал - для всіх. Справа за цією порадою полягає в тому, що це ваш якір. Будь-який прогноз, який ви даєте, має стосуватися змін навколо цієї точки прив’язки. Я не впевнений, що бачу цей крок у будь-якому з ваших пунктів!

Канеман використовує абревіатуру, WYSIATI, все, що ви бачите, все є. Це схильність людини до завищення важливості наявної в даний час інформації. Для багатьох людей інформація про здатність до читання змусила б людей думати, що Джулі розумна, і тому люди здогадуються оцінити середній бал розумної людини.

Але поведінка дитини в чотири роки містить дуже мало інформації, пов’язаної з поведінкою дорослих. Вам, напевно, краще ігнорувати це, роблячи прогнози. Це повинно лише відхилити вас від якоря невеликою кількістю. Крім того, спочатку здогадки людей про розумних людей середній бал може бути дуже неточним. Завдяки відбору більшість старших курсів коледжу вище середнього рівня інтелекту.

Однак насправді є ще якась прихована інформація, окрім вміння читати Джулі у чотири роки.

  • Джулі, ймовірно, буде жіночим ім'ям
  • Вона відвідує державний університет
  • Вона старша

Я підозрюю, що всі три ці характеристики трохи підвищують середній бал середнього рівня середнього студента. Наприклад, я думаю, що старші люди, ймовірно, мають більш високий бал середнього рівня, ніж Софморес, тому що студенти з дуже поганим середнім балом закінчуються.

Тож процедура Канемана (як гіпотетична) йшла б приблизно так.

  1. Середній середній бал серед жінок середнього віку в державному університеті становить 3,1.
  2. Я здогадуюсь, що виходячи з розширеної здатності Джулі до читання у 4, її середній бал складає 3,8
  3. Я думаю, що здатність до читання у 4-річному віці має кореляцію 0,3 з GPA
  4. Тоді 30% шляху між 3,1 і 3,8 становить 3,3 (тобто 3.1 + (3.8-3.1)*0.3)

Отже, в цій гіпотетиці остаточна здогадка про Джулі середній бал становить 3,3.

Погіршення середнього значення в підході Канемана полягає в тому, що крок 2, ймовірно, буде грубо завищеною важливістю наявної інформації. Тож кращою стратегією є повернення нашого прогнозу до загальної середньої величини. Кроки 3 та 4 - це (спеціальні) способи оцінити, на скільки потрібно регресувати.


Я розумію інтуїцію, що стоїть за процедурою, але не математичне обгрунтування. Моя інтерпретація полягає в тому, що суть оцінки середньої середньої загальної кількості полягає в тому, щоб дозволити оцінювати конкретні середні бали за рівнем стандартних балів; інакше їх не можна було б змістовно порівняти із швидкістю читання. (Проти.)
Рації

1
Канеман зазначає, що більшість людей здогадується, що середній бал складає 3,7 або 3,8, що, ймовірно, відповідає стандартній оцінці, яку вони асоціюють із швидкістю читання Джулі, але також неявно припускає, що кореляція між двома змінними є ідеальною. Мене в основному бентежить питання про те, чи є етап 4 інтуїтивно зрозумілим правилом чи справжньою, статистично обгрунтованою процедурою (тобто, чи можна застосовувати стандартні оцінки додатково і приймати пропорції на основі співвідношення?). Якщо це лише велике правило мирянина, чи існує більш статистично жорсткий метод наближення?
Рації

Під "адитивно" я маю на увазі наше припущення, що (1) деяка частка стандартної середньої оцінки Джулі пояснюється факторами, які також можуть пояснити її швидкість читання, що (2) решта пропорцій її стандартної бальної оцінки пояснюється факторами Унікальне для пояснення ГПД, що (3) ці внески підсумовуються рівному кінцевому стандартному балу GPA, який ми прогнозуємо для Джулі, і що (4) ми можемо виправити наше прогнозування, просто взявши частку нашого упередженого прогнозу. Чи дійсна робота з пропорціями стандартних відхилень на відміну від, скажімо, роботи з їх квадратними коренями?
Рації

Це спеціальне правило. Кроки два та три не обов'язково логічно узгоджуються один з одним. (Це два різні способи виголошення однієї інформації: один - розмір ефекту, а другий - стандартизований розмір ефекту.)
Енді Ш
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.