Я усуну всі біологічні деталі та експерименти і навожу лише проблему, яку я маю на увазі, і що я зробив статистично. Я хотів би знати, чи є її право, а якщо ні, як діяти. Якщо дані (або моє пояснення) недостатньо зрозумілі, я спробую пояснити краще, редагуючи.
Припустимо, у мене є дві групи / спостереження, X і Y, розмірами і . Я хотів би знати, чи рівні засоби цих двох спостережень рівні. Перше моє запитання:N y = 40
Якщо припущення виконані, чи доречно тут використовувати параметричний двопробний тест? Я запитую це, тому що, наскільки я розумію, його зазвичай застосовують, коли розмір невеликий?
Я побудував гістограми як X, так і Y, і вони зазвичай не були розподіленими, що є одним із припущень двопробного t-тесту. Моя плутанина в тому, що я вважаю їх двома групами, і тому я перевірив нормальний розподіл. Але тоді я збираюся виконати тест з двома зразками ... Це правильно?
З теореми про центральну межу я розумію, що якщо ви будете проводити вибірку (з / без повторення залежно від розміру вашої сукупності) кілька разів і щоразу обчислювати середнє значення для зразків, то воно буде приблизно нормально розподілене. І, середнє значення цих випадкових величин буде хорошою оцінкою середньої сукупності. Отже, я вирішив зробити це і в X, і в 1000 разів, і отримав зразки, і призначив випадкову змінну в середньому для кожного зразка. Сюжет був дуже нормально розподілений. Середнє значення X і Y склало 4,2 і 15,8 (що було таким же, як і населення + - 0,15), а дисперсія становила 0,95 і 12,11.
Я провів t-тест на цих двох спостереженнях (по 1000 точок даних у кожному) з неоднаковими відхиленнями, оскільки вони дуже різні (0,95 та 12,11). І нульова гіпотеза була відхилена.
Це взагалі має сенс? Чи достатній цей правильний / осмислений підхід або двопробний z-тест чи це абсолютно неправильно?Я також провів непараметричний тест Вілкоксона, щоб бути впевненим (на оригіналах X і Y), і нульова гіпотеза також була переконливо відкинута. У випадку, якщо мій попередній метод був абсолютно невірним, я вважаю, що непопараметричне тестування добре, крім статистичної потужності, можливо?
В обох випадках засоби суттєво відрізнялися. Однак я хотів би знати, чи один чи обидва підходи несправні / абсолютно неправильні, і якщо так, то яка альтернатива?