Цікаво, чи є якийсь статистичний тест, щоб "перевірити" значущість бімодального розподілу. Я маю на увазі, наскільки мої дані відповідають бімодальному розподілу чи ні? Якщо так, чи є тест в програмі R?
Цікаво, чи є якийсь статистичний тест, щоб "перевірити" значущість бімодального розподілу. Я маю на увазі, наскільки мої дані відповідають бімодальному розподілу чи ні? Якщо так, чи є тест в програмі R?
Відповіді:
Ще один можливий підхід до цього питання - подумати про те, що може відбуватися за кадром, що генерує дані, які ви бачите. Тобто, можна думати з точки зору моделі суміші , наприклад, моделі суміші Гаусса. Наприклад, ви можете вважати, що ваші дані беруться або з однієї нормальної сукупності, або з суміші двох нормальних розподілів (у деякій пропорції), різними способами та відхиленнями. Звичайно, не потрібно вірити, що є лише одне-два, і ви не повинні вірити, що популяції, з яких черпаються дані, повинні бути нормальними.
Є (принаймні) два пакети R, які дозволяють оцінити моделі сумішей. Один пакет є flexmix , а інший - mclust . Оцінивши дві моделі-кандидати, я вважаю, що можливо можливо провести тест на коефіцієнт ймовірності. Крім того, ви можете використовувати параметричний метод перехресного завантаження ( pdf ).
Як згадується в коментарях, на сторінці Вікіпедії в розділі "Бімодальний дистрибутив" перелічено вісім тестів на мультимодальність проти унімодальності та наведено посилання на сім із них.
У Р. є принаймні деякі. Наприклад:
У пакеті diptest
реалізований тест Hartigan.
Ці stamp
дані в bootstrap
пакеті був використаний в Ефрон і Tibshirani в введенні до Bootstrap (книги , на якій заснований пакет) , щоб зробити приклад , що відноситься до самонастроювання за кількістю режимів; якщо у вас є доступ до книги, можливо, ви зможете скористатися таким підходом.
Ефрон, Б. та Тібшірані, Р. (1993) Вступ до завантажувальної програми .
Чапман і Холл, Нью-Йорк, Лондон.
-
Є питання про CV, яке говорить про визначення (тобто, а не про оцінку, а не про тестування) кількості режимів, в яких з'являється пошук @ whuber. Там варто прочитати відповіді. Один з відповідей там (мій, як це буває) містить посилання на пошук в Google, який з'ясовує цей документ Девідом Донохо про створення однобічних КІ для кількості режимів, які, звичайно, можуть бути використані в якості тесту (наприклад, , якщо односторонній інтервал не включає унімодальний випадок, ви можете відхилити унімодальність). Наскільки мені відомо, це не такодин із тестів, про який згадує Вікіпедія. Я не думаю, що існує R-реалізація цього інтервалу, але (незважаючи на те, що Донохо схильний використовувати досить складні інструменти в його обговоренні), це насправді досить проста ідея. Ця ідея безпосередньо пов'язана з поняттям використання оцінки щільності ядра.