Я хотів би зрозуміти використання моделювання Монте-Карло у chisq.test()
функції Р.
У мене є якісна змінна, яка має 128 рівнів / класи. Розмір моєї вибірки - 26 (я не зміг взяти вибірку більше "осіб"). Тож очевидно, у мене будуть деякі рівні з 0 "особами". Але факт полягає в тому, що я маю лише дуже малу кількість класів, представлених із 127 можливих. Оскільки я чув, що для того, щоб застосувати тест на чи-квадрат, у нас повинно бути не менше 5 осіб на кожному рівні (я не зовсім розумію причину цього), я подумав, що simulate.p.value
для визначення оцінки розподілу я мав використовувати варіант використання моделювання Монте-Карло. і обчислити р-значення. Без моделювання Монте-Карло, R дає мені p-значення < 1e-16
. Завдяки моделюванню в Монте-Карло це дає мені значення p 4e-5
.
Я спробував обчислити р-значення з вектором 26 одиниць і 101 нуль, і за допомогою моделювання Монте-Карло я отримую p-значення у 1.
Чи правильно констатувати, що навіть якщо розмір моєї вибірки невеликий порівняно з кількістю можливих класів, спостережуване розподіл таке, що дуже малоймовірно, що всі можливі класи існують з однаковою ймовірністю (1/127) у реальній сукупності ?