Я читав Чорного лебедя пару років тому. Ідея Чорного лебедя є хорошою, і напад на лудійну помилковість (бачити речі так, ніби вони є кубиковими іграми, з відомими ймовірностями) хороший, але статистика відверто неправильно представлена, центральною проблемою є неправильне твердження, що вся статистика розпадається, якщо змінні зазвичай не розподіляються. Цей аспект мене досить роздратував, щоб написати Талебу лист нижче:
Шановний доктор Талеб
Нещодавно я читав "Чорний лебідь". Як і ви, я прихильник Карла Поппера, і я виявив, що погоджуюся з тим, що є в ньому. Я думаю, що ваше висловлювання лудійської помилки є в основному обгрунтованим і звертає увагу на реальну та загальну проблему. Однак я вважаю, що більша частина ІІІ підводить ваш загальний аргумент погано, навіть до того, що можливо дискредитує решту книги. Це соромно, як я вважаю, що аргументи стосовно Чорних Лебедів та "невідомих невідомих" стоять по суті, не покладаючись на деякі помилки в частині III.
Основне питання, на яке я хочу звернути увагу, і шукати вашої відповіді, особливо якщо я неправильно зрозумів, - це ваше неправильне представлення галузі прикладної статистики. На мій погляд, глави 14, 15 та 16 значною мірою залежать від солом'яного аргументу, неправильного представлення статистики та економетрики. Описана вами економетрика не є тією, яку я навчав, коли я вивчав прикладну статистику, економетрику та теорію актуарного ризику (в Австралійському національному університеті, але використовуючи тексти, які здавалися досить стандартними). Питання, які Ви порушуєте (наприклад, обмеження розподілу Гаусса), добре і по-справжньому зрозумілі та вивчені навіть на рівні бакалаврату.
Наприклад, ви спробуєте показати, як розподіл доходу не йде за нормальним розподілом, і подаєте це як аргумент проти статистичної практики загалом. Жоден компетентний статистик ніколи не стверджує, що це робить, і способи вирішення цього питання добре знайдені. Просто використання методів самого елементарного рівня «економетрики першого року», наприклад, перетворення змінної за допомогою логарифму зробить ваші числові приклади набагато менш переконливими. Таке перетворення насправді позбавить значної частини сказаного, оскільки тоді дисперсія вихідної змінної дійсно збільшується зі збільшенням її середнього значення.
Я впевнений, що є деякі некомпетентні економетрики, які роблять регресії OLS тощо з неперетвореною змінною відповіді так, як ви говорите, але це просто робить їх некомпетентними та використовуючи добре встановлені методи, які є невідповідними. Вони, безумовно, не змогли б навіть на бакалаврських курсах, які витрачають багато часу на пошук більш відповідних способів моделювання змінних, таких як дохід, що відображає фактичне спостережуване (не гауссове) розподіл.
Сімейство узагальнених лінійних моделей - це набір методик, розроблених частково для подолання проблем, які ви виникаєте. Багато експоненціальної сімейства розподілів (наприклад, гамма, експоненціальні та пуассонові розподіли) є асиметричними і мають дисперсію, яка збільшується в міру збільшення центру розподілу, долаючи проблему, яку ви вказуєте, використовуючи розподіл Гаусса. Якщо це все ще занадто обмежує, можна взагалі скинути попередньо існуючу "форму" і просто вказати залежність між середнім значенням розподілу та його дисперсією (наприклад, дозволяючи дисперсії пропорційно збільшуватися до середнього квадрата), використовуючи метод «квазіімовірності».
Звичайно, ви можете стверджувати, що така форма моделювання все ще надто спрощена, і інтелектуальна пастка, яка заколисує нас у думці про майбутнє, буде як минуле. Ви можете бути правильними, і я думаю, що сила вашої книги полягає в тому, щоб змусити людей, як я, вважати це. Але вам потрібні різні аргументи до тих, які ви використовуєте в главах 14-16. Велика вага, яку ви приділяєте тому, що дисперсія гауссового розподілу є постійною незалежно від його середнього значення (що спричиняє проблеми зі масштабованістю), наприклад, недійсна. Отже, ви наголошуєте на тому, що реальні розподіли мають тенденцію бути асиметричними, а не кривими дзвіночками.
В основному, ви скористалися одним із надмірних спрощень найпростішого підходу до статистики (наївне моделювання сировинних змінних як гауссових розподілів) і показали, з великою довжиною, (правильно) недоліки такого спрощеного підходу. Потім ви використовуєте це, щоб зробити прогалину для дискредитації всього поля. Це або серйозний проміжок логіки, або пропагандистський прийом. Це прикро, тому що це погіршує ваш загальний аргумент, більшу частину з якого (як я вже сказав) я вважав дійсним та переконливим.
Мені було б цікаво почути, що ви говорите у відповідь. Я сумніваюся, що я перший, хто порушив це питання.
Щиро Ваш
ПЕ