Тест на бімодальний розподіл


30

Цікаво, чи є якийсь статистичний тест, щоб "перевірити" значущість бімодального розподілу. Я маю на увазі, наскільки мої дані відповідають бімодальному розподілу чи ні? Якщо так, чи є тест в програмі R?


3
Ви не знайшли відповіді, шукаючи наш сайт ? Якщо ні, то чого не вистачає?
whuber

7
Існують тести на бімодальність або мультимодальність, але вони, як правило, однобічні. Тобто, ви можете зробити висновок про такі речі, як "є більше одного режиму", але ви не можете сказати, що "менше трьох режимів" - ви можете отримати нижню межу за кількістю режимів, але ви не можете дійсно отримати верхні межі, оскільки можна знайти багатомодальний розподіл з будь-якою кількістю режимів, який довільно близький до розподілу з будь-якою меншою кількістю режимів. Я побачу, чи зможу я викопати явні тести чи посилання.
Glen_b -Встановити Моніку

4
На сторінці вікіпедії на бімодальному розповсюдженні перелічено вісім тестів на мультимодальність проти унімодальності та надаються посилання на сім із них. Я не впевнений, чи є такі у Р. Я буду дивитись.
Glen_b -Встановити Моніку

Відповіді:


17

Ще один можливий підхід до цього питання - подумати про те, що може відбуватися за кадром, що генерує дані, які ви бачите. Тобто, можна думати з точки зору моделі суміші , наприклад, моделі суміші Гаусса. Наприклад, ви можете вважати, що ваші дані беруться або з однієї нормальної сукупності, або з суміші двох нормальних розподілів (у деякій пропорції), різними способами та відхиленнями. Звичайно, не потрібно вірити, що є лише одне-два, і ви не повинні вірити, що популяції, з яких черпаються дані, повинні бути нормальними.

Є (принаймні) два пакети R, які дозволяють оцінити моделі сумішей. Один пакет є flexmix , а інший - mclust . Оцінивши дві моделі-кандидати, я вважаю, що можливо можливо провести тест на коефіцієнт ймовірності. Крім того, ви можете використовувати параметричний метод перехресного завантаження ( pdf ).


Привіт @gung, для параметричного методу перехресного завантаження, як би ви визначили оптимальний критерій стосовно бімодального розподілу? Може трапитися випадок, коли два конкуруючих розподілу перетинаються один з одним у двох точках. Що робити у такому випадку?
акашрайкн

32

Як згадується в коментарях, на сторінці Вікіпедії в розділі "Бімодальний дистрибутив" перелічено вісім тестів на мультимодальність проти унімодальності та наведено посилання на сім із них.

У Р. є принаймні деякі. Наприклад:

  1. У пакеті diptestреалізований тест Hartigan.

  2. Ці stampдані в bootstrapпакеті був використаний в Ефрон і Tibshirani в введенні до Bootstrap (книги , на якій заснований пакет) , щоб зробити приклад , що відноситься до самонастроювання за кількістю режимів; якщо у вас є доступ до книги, можливо, ви зможете скористатися таким підходом.

    Ефрон, Б. та Тібшірані, Р. (1993) Вступ до завантажувальної програми .
    Чапман і Холл, Нью-Йорк, Лондон.

-

Є питання про CV, яке говорить про визначення (тобто, а не про оцінку, а не про тестування) кількості режимів, в яких з'являється пошук @ whuber. Там варто прочитати відповіді. Один з відповідей там (мій, як це буває) містить посилання на пошук в Google, який з'ясовує цей документ Девідом Донохо про створення однобічних КІ для кількості режимів, які, звичайно, можуть бути використані в якості тесту (наприклад, , якщо односторонній інтервал не включає унімодальний випадок, ви можете відхилити унімодальність). Наскільки мені відомо, це не такодин із тестів, про який згадує Вікіпедія. Я не думаю, що існує R-реалізація цього інтервалу, але (незважаючи на те, що Донохо схильний використовувати досить складні інструменти в його обговоренні), це насправді досить проста ідея. Ця ідея безпосередньо пов'язана з поняттям використання оцінки щільності ядра.


Це цінна робота.
rolando2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.