У мене є набір даних, що містить кількість дій, здійснених особами протягом 7 днів. Конкретна дія не повинна відповідати цьому питанню. Ось деякі описові статистичні дані для набору даних:
Ось гістограма даних:
Судячи з джерела даних, я вважав, що це буде відповідати розподілу Пуассона. Однак середня ≠ дисперсія та гістограма сильно зважують зліва. Крім того, я пройшов goodfit
тест на R і отримав:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
Метод максимальної ймовірності також дав p-значення = 0. Припустимо, що нульова гіпотеза така: дані відповідають розподілу Пуассона (документація цього не визначає), то goodfit
тест говорить, що ми повинні відкинути нульову гіпотезу, тому дані не відповідати розподілу Пуассона.
Це правильний аналіз? Якщо так, який розподіл, на вашу думку, відповідатиме цим даним?
Моя кінцева мета - порівняти середню кількість дій між двома зразками, щоб побачити, чи відрізняються засоби; чи потрібна перевірка розподілу? Я розумію, що типові тести (тести z-, t-, ) не працюють для пуассонівських розподілів. Який тест слід використовувати, якщо дані дійсно розподілені Поассоном?