Як виконати тест завантаження для порівняння засобів двох зразків?


12

У мене є два сильно перекошених зразка і я намагаюся використовувати завантажувальний аналіз, щоб порівняти їх засоби, використовуючи t-статистику.

Яка правильна процедура зробити це?


Процес, який я використовую

Мене хвилює доцільність використання стандартної помилки вихідних / спостережуваних даних на останньому етапі, коли я знаю, що це нормально не поширюється.

Ось мої кроки:

  • Bootstrap - випадковий вибірки із заміною (N = 1000)
  • Обчисліть t-статистику для кожної завантажувальної стрічки для створення t-розподілу:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/н
  • Оцініть t довірчі інтервали, отримавши та1 - α / 2α/21-α/2 відсотків t-розподілу
  • Отримати довірчі інтервали через:

    СЯL=(Х¯1-Х¯2)-Т_СЯL.SЕоriгiнал
    СЯU=(Х¯1-Х¯2)+Т_СЯU.SЕоriгiнал
    де
    SЕ=σХ12/н+σХ22/н
  • Подивіться, де потрапляють довірчі інтервали, щоб визначити, чи є значна різниця в засобах (тобто не нульових)

Я також роздивився суму рангів Вілкоксона, але вона не дає дуже розумних результатів через дуже сильно перекошеного розподілу (наприклад, 75-й == 95-й перцентиль). З цієї причини я хотів би далі вивчити завантажений тест.

Отже, мої запитання:

  1. Це відповідна методологія?
  2. Чи доцільно використовувати SE спостережуваних даних, коли я знаю, що вони сильно перекошені?

Можливий дублікат: Який спосіб є кращим, тест завантаження або непараметричний тест на основі ранжу?


Наскільки великі зразки?
Майкл М

@Michael Mayer Близько 800
CatsLoveJazz

Відповіді:


16

Я б просто робив звичайний тест на завантаження:

  • обчислити t-статистику у ваших даних та зберегти її
  • змінити дані так, щоб нульова гіпотеза була правдивою. У цьому випадку віднімаємо середнє в групі 1 для групи 1 і додаємо загальне середнє значення, і робимо те ж саме для групи 2, таким чином засоби в обох групах будуть загальними середніми.
  • Візьміть з цього набору даних зразки завантажувальної програми, ймовірно, порядку 20 000.
  • обчислити t-статистику у кожному з цих зразків завантаження. Розподіл цих t-статистичних даних - це оцінка завантаження для розподілу вибірки t-статистики у ваших перекошених даних, якщо нульова гіпотеза є правдивою.
  • p(+1)(+1)

Більше про це можна прочитати в:


Це, по суті, те, що я роблю, але, дивлячись на частку разів від початкової / спостережуваної t-статистики, є> = завантажена в боці т-статистика. Чи нормально робити тест на сильно перекошених даних у першу чергу, хоча це одна з причин, чому я хочу зробити завантаження.
CatsLoveJazz

2
Технічно для тесту завантажувальної програми вам просто потрібна тестова статистика, так що це не проблема. По суті, t-тест порівнює засоби і у перекошених даних медіани часто є більш значущими, ніж засоби. Тож тест, порівнюючи медіанів замість засобів, може мати більше сенсу. Однак це залежить від вашої нульової гіпотези - це ваш вибір і ваш вибір.
Maarten Buis

Добре дякую, це означає, що ми хочемо перевірити, як і всі інші наші результати були в цій формі.
CatsLoveJazz
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.