У мене є два сильно перекошених зразка і я намагаюся використовувати завантажувальний аналіз, щоб порівняти їх засоби, використовуючи t-статистику.
Яка правильна процедура зробити це?
Процес, який я використовую
Мене хвилює доцільність використання стандартної помилки вихідних / спостережуваних даних на останньому етапі, коли я знаю, що це нормально не поширюється.
Ось мої кроки:
- Bootstrap - випадковий вибірки із заміною (N = 1000)
- Обчисліть t-статистику для кожної завантажувальної стрічки для створення t-розподілу:
- Оцініть t довірчі інтервали, отримавши та1 - α / 2 відсотків t-розподілу
Отримати довірчі інтервали через:
де- Подивіться, де потрапляють довірчі інтервали, щоб визначити, чи є значна різниця в засобах (тобто не нульових)
Я також роздивився суму рангів Вілкоксона, але вона не дає дуже розумних результатів через дуже сильно перекошеного розподілу (наприклад, 75-й == 95-й перцентиль). З цієї причини я хотів би далі вивчити завантажений тест.
Отже, мої запитання:
- Це відповідна методологія?
- Чи доцільно використовувати SE спостережуваних даних, коли я знаю, що вони сильно перекошені?
Можливий дублікат: Який спосіб є кращим, тест завантаження або непараметричний тест на основі ранжу?