Перестановочний тест порівняння одного зразка із середнім


10

Коли люди реалізують тести на перестановку для порівняння одного зразка із середнім (наприклад, як це можна зробити з t-тестом перестановки), як обробляється середнє? Я бачив реалізації, які беруть середнє значення та зразок для тесту перестановки, але незрозуміло, що вони насправді роблять під кришкою. Чи існує навіть змістовний спосіб зробити перестановку на перестановку (наприклад, t-тест) для одного зразка проти передбачуваного середнього? Або, як альтернатива, вони просто дефолтують на тест без перестановки під кришкою? (наприклад, незважаючи на виклик функції перестановки або встановлення прапора перестановки для перестановки, дефолт до стандартного t-тесту чи подібної функції)

У стандартному тесті на перестановку з двома зразками можна було б мати дві групи і рандомізувати призначення міток. Однак, як це обробляється, коли одна "група" є припущеною середньою? Очевидно, що передбачається середнє значення не має самої по собі вибірки. Тож, який типовий спосіб опрацювати середнє у форматі перестановки? Чи вважається, що "середній" зразок є єдиною точкою? Зразок, рівний розміру вибірковій групі? Зразок нескінченного розміру?

З огляду на те, що передбачається середнє значення, я вважаю, я б сказав, що технічно він має або нескінченну підтримку, або будь-яку підтримку, яку ви хочете взяти на себе. Однак жодне з них не є дуже корисним для фактичного розрахунку. Зразок рівного розміру зі значеннями, рівними середньому, здається, те, що іноді робиться за допомогою деяких тестів (наприклад, ви просто заповнюєте іншу половину пар із передбачуваним розташуванням). Це має певний сенс, оскільки це зразок рівної довжини, який ви бачите, чи було припущене середнє значення правильним без відхилення.

Отже, моє запитання таке: На практиці чи насправді люди наслідують рандомізацію міток стилю перестановки-тесту, коли другий набір є середнім (або подібним абстрактним припущеним значенням)? Якщо так, то як люди обробляють рандомізацію міток, коли роблять це?


6
Тест на перестановку конкретної гіпотезованої середньої величини не відрізняється від віднімання цього значення серед гіпотезованих та тестування на середнє значення нуля. Парний тест обговорюється тут ; це робить припущення, що під нулем пари мають однаковий розподіл, що означає, що відмінності, на яких базується подальший однопробний тест, вважаються симетричними. Виходячи з цього, знаки випадково
перекидаються

1
(ctd) ... (що для парного тесту еквівалентно гортанню міток груп). Ну це для тесту на рандомізацію - для повного тесту на перестановку ви зробите все2нможливі комбінації знаків-переворотів. Якщо ви не можете припустити симетрію, трохи важко зрозуміти, що ви перестановите - але ви все одно зможете провести тест завантаження.
Glen_b -Встановити Моніку

Що має сенс. Але я трохи замислююся над обчислювальними реалізаціями, які роблять люди. Якщо ви можете перетворити це на тест знаків, чи насправді люди турбують обчислення перестановок? Для будь-якої послідовності довжини N повний набір перестановок перевертання знаків був би однаковим, ні? Тож я думаю, що під кришкою люди можуть просто перевести це на біноміальний тест, а не вручну генерувати перестановки, які роблять біноміальну дистрибуцію. Мене в основному цікавить, чи / коли є користь для відновлення та пермітування порівняно із використанням стандартного тесту у випадку одного зразка проти середнього.
Namey

Я взагалі не пропонував перетворити його на тест з ознаками. За схемою, в якій я відмовився, знаки перестановлені, але абсолютні значення вихідних даних зберігаються; токго перестановлено хi є сi[к]|хi| де с є або +1 або -1. Тобто, якщох10 в одному вибірковому тесті було значення 11,43 проти середнього нуля, перестановленого х10все було б або -11,43 або +11,43. Якщо ви ранжируєте абсолютні дані першими, ви насправді закінчили б тестуванням підписаного Вілкоксоном рангу, тож це як неперероблена версія оригінальних даних.
Glen_b -Встановити Моніку

Відповіді:


6

Розширення коментаря Glen_b у відповідь

Приблизний тест перестановки на один зразок для середнього зразка проти нульової гіпотези нульової середньої величини реалізується шляхом призначення випадкових ознак даним у вибірці. Ненульові нульові гіпотези можна перевірити, віднімаючи з даних потрібну нульову середню.

Це легко помітити у джерелі функції R onetPermutationв пакеті DAAG. Ось уривок відповідного коду з доданими коментарями:

function (x, nsim) {

  ## Initialize and pre-allocate

  n <- length(x)
  dbar <- mean(x)
  absx <- abs(x)  # there's actually a bug in the code; below you'll see that the function ends up re-computing abs(x) instead of using this
  z <- array(, nsim)


  ## Run the simulation    

  for (i in 1:nsim) {                             # Do nsim times:
      mn <- sample(c(-1, 1), n, replace = TRUE)   #  1. take n random draws from {-1, 1}, where n is the length of the data to be tested
      xbardash <- mean(mn * abs(x))               #  2. assign the signs to the data and put them in a temporary variable
      z[i] <- xbardash                            #  3. save the new data in an array
  }


  ## Return the p value
  # p = the fraction of fake data that is:
  #      larger than |sample mean of x|, or
  #    smaller than -|sample mean of x|

  (sum(z >= abs(dbar)) + sum(z <= -abs(dbar)))/nsim
}

Яка функція absв наведеному вище коді? Чи не буде гортання етикеток настільки ж випадковим без abs?
Меттью Бретт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.