Чому статистики не використовують взаємну інформацію як міру асоціації?


10

Я бачив пару переговорів нестатистів, де, здається, винаходити кореляційні заходи, використовуючи взаємну інформацію, а не регресію (або еквівалентні / тісно пов'язані статистичні тести).

Я вважаю, що є вагомі причини, що статистики не застосовують такого підходу. Я розумію, що оцінювачі ентропії / взаємної інформації, як правило, є проблематичними та нестабільними. Я припускаю, що влада також є проблематичною в результаті: вони намагаються обійти це, заявляючи, що вони не використовують параметричну рамку тестування. Зазвичай така робота не турбується з розрахунками потужності, або навіть з довірчими / надійними інтервалами.

Але якщо зайняти позицію захисника диявола, чи повільна конвергенція велика угода, коли набори даних надзвичайно великі? Крім того, іноді ці методи, здається, "працюють" в тому сенсі, що асоціації перевірені подальшими дослідженнями. Яка найкраща критика щодо використання взаємної інформації як міри асоціації, і чому вона не використовується широко в статистичній практиці?

редагувати: Чи є хороші документи, які висвітлюють ці питання?


3
ІМ - це міра асоціації між двома дискретними змінними. Це не дуже поширене налаштування в загальній статистиці (це може бути в деяких спеціалізованих підполях). Але в межах цієї установки я бачу, що вона використовується досить часто. Безумовно, коли я стикаюся з прикладними людьми, які використовують кореляцію Пірсона на двовимірних дискретних наборах даних, я вказую на ІМ.
user603

1
Дивіться також stats.stackexchange.com/questions/1052/… Однак, на мою думку, обговорення тут вже є гарним чи кращим, тому звичайне питання щодо дублікатів є суперечливим.
Нік Кокс

Також для довідок див. Stats.stackexchange.com/q/20011/1036
Andy W

2
Наступним загальним посиланням є Меттью Реймгер і Ден Л. Ніколае. 2013. Про кількісну оцінку залежності: рамки для розробки інтерпретаційних заходів. Статистична наука 28: 116-130.
Нік Кокс

Відповіді:


4

Я думаю, вам слід розрізняти категоричні (дискретні) дані та безперервні дані.

Для безперервних даних кореляція Пірсона вимірює лінійну (монотонну) залежність, рангову кореляцію монотонну залежність.

MI з іншого боку "виявляє" будь-які стосунки. Зазвичай це не те, що вас цікавить, та / або може бути шумом. Зокрема, ви повинні оцінити щільність розподілу. Але оскільки це безперервно, ви спершу створите гістограму [дискретні бункери], а потім обчислите ІМ. Але оскільки MI дозволяє здійснювати будь-які відносини, ІІ змінюватиметься, коли ви використовуєте менші скриньки (тобто ви дозволяєте більше хитатися). Таким чином, ви можете бачити, що оцінка ІМ буде дуже нестабільною, не дозволяючи ставити будь-які довірчі інтервали на оцінку і т. Д. [Те саме стосується, якщо ви робите безперервну оцінку щільності.] В основному є занадто багато речей для оцінювання, перш ніж насправді обчислити. МВ.

З іншого боку, категоричні дані досить добре вписуються в рамки ІМ (див. G-тест), і вибирати між G-тестом та хі-квадратом не так вже й багато.


Я здебільшого маю на увазі випадки дискретної асоціації (регресуючи, я мав на увазі ГЛМ, а не лише OLS). Насправді, багато вчених, які вивчають складні явища (наприклад, генетика), можуть сказати, що їх більше цікавить саме те, що ви описуєте (виявляйте будь-які стосунки). Приманка уникнути очевидної загальної критики "що робити, якщо функціональна форма кореляції неправильна? Звичайно, я хочу виявити будь-які стосунки!" сильний. Однак, я думаю, що тут грає невільний обід, але це буде не помічено, що я намагаюся краще сформулювати / зрозуміти.
user4733

1
... Я не знав про зв'язок між тестами на ЛР та ІМ, хоча це дуже цікаво!
user4733
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.