Яка інтуїція за обмінними зразками під нульовою гіпотезою?


15

Перестановочні тести (також називаються тестом рандомизації, тестом на повторну рандомізацію або точним тестом) дуже корисні і корисні, коли припущення про нормальний розподіл, необхідне, наприклад, t-testне виконується, і при перетворенні значень за ранжуванням непараметричний тест, як-от Mann-Whitney-U-test, призведе до втрати більше інформації. Однак одне і єдине припущення не слід оминути увагою при використанні такого виду тестування - це припущення про обмінність зразків під нульовою гіпотезою. Примітно також, що подібний підхід може бути застосований і тоді, коли існує більше двох зразків, таких як реалізована в coinпакеті R.

Чи можете ви, будь ласка, використовувати якусь образну мову чи концептуальну інтуїцію простою англійською мовою, щоб проілюструвати це припущення? Це було б дуже корисно для уточнення цього занедбаного питання серед нестатистів, як я.

Примітка.
Було б дуже корисно згадати випадок, коли застосування тесту на перестановку не є або недійсним за тим самим припущенням.

Оновлення:
Припустімо, що у мене є 50 випадків, зібраних із місцевої клініки в моєму окрузі. Їх випадковим чином призначали для прийому препарату або плацебо у співвідношенні 1: 1. Всі вони були виміряні для параметра 1 Par1на V1 (базовий рівень), V2 (через 3 місяці) та V3 (на 1 рік пізніше). Усі 50 предметів можна підгрупувати у 2 групи на основі ознаки А; Позитивні = 20 та негативні = 30. Їх також можна підгрупувати в інші 2 групи на основі ознаки B; B позитивний = 15 і B негативний = 35.
Тепер я маю значення Par1з усіх предметів у всіх візитах. Чи можна вважати порівняння між рівнями Par1використання тесту на перестановку, якщо я міг би:
- Порівняти суб'єктів з препаратом із тими, які отримували плацебо на V2?
- Порівняйте теми з ознакою A з тими, які мають функцію B на V2?
- Порівняйте об'єкти, які мають особливість A у V2, з тими, які мають особливість A, але у V3?
- За якої ситуації це порівняння було б недійсним і порушило б припущення про обмін?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
Припустимо, я мав кожне спостереження на окремому аркуші ситцевого паперу, і коли я передав вам стопку, я ковзнув, і аркуші вилетіли в усі сторони, коли вони осіли на підлогу. Буде соромно, якби це знищило чинність тесту, який ви сподівалися виконати за цими даними. Якщо ваші спостереження є обмінними, і ви застосовували тест на основі цього, ви потішите мене і скажете мені не хвилюватися, допомагаючи мені збирати документи з підлоги. Якщо ні, а збір даних був особливо дорогим, мені, можливо, доведеться запустити своє життя.
кардинал

2
З іншого боку, замовлення має значення для таких речей, як дані часових рядів (загалом), а тести, як правило, повинні дотримуватися цього порядку відповідним чином.
кардинал

@cardinal, хоча ваша інтуїтивна історія намалювала яскраву картину, як виглядає це припущення, але я все ще плутаюсь, як судити про те, чи були падіння цінних паперів обмінними чи ні. Ви можете запустити ще один коментар, якщо це можливо!
докторантура

Відповіді:


7

fХYZ(х=1,у=3,z=2)=fХYZ(х=3,у=2,z=1)тощо). Якщо це не так, то підрахунок перестановок не є коректним способом перевірки нульової гіпотези, оскільки кожна перестановка матиме різну вагу (ймовірність / щільність). Перевірка перестановок залежить від кожного присвоєння заданого набору числових значень вашим змінним, що мають однакову щільність / ймовірність.

f(x1=1,x2=2,X3=3...XN=N)f(x1=N,x2=N1,X3=N2...XN=1)


+1, хоча незмінність добре пояснена, але я все ж спотикався, намагаючись застосувати метафору банок на дослідження. (див. оновлення питання). З огляду на тривалість відвідувань та підгрупування за ознаками, як я можу судити, чи може порівняння цих значень бути обмінним чи ні?
докторантура

@docto: це здається, що ви стратифікуєте свої групи за факторами, що мають відношення до результату Par1, правда? Поки ви використовуєте перестановки в певному квадраті A / B, тоді я вважаю, що ваші суб'єкти є незмінними. Ваш перший тест, який дозволить вирішити всі функції, потрібно буде додатково обробити, перш ніж ви зможете використовувати тест, який покладається на замінюваність. зокрема, вам потрібно кількісно оцінити ефект від лікування та виправити заплутані наслідки особливостей A і B - інакше розмір гуп вплине на загальні результати (парадокс

1
@doctors: Я зрозумів, що мій вище коментар, можливо, був на зразок косого wrt того, що ви хочете: банки у вашому випадку будуть парами функцій, тобто (A +, B +), (A-, B +), (A +, B -), (В-, А-) на загальну суму 4 «банки». Чи допомагає це зробити більш конкретним?

Tks, але що бентежить нестатистів, як я, - як можна судити, чи було виконано це припущення чи ні? часто проводяться тести, щоб вивчити припущення, наприклад, для нормальності існує тест Шапіро-Вілка. Але мені цікаво, який тест досліджував би змінність? інакше було б дуже важко або неясно визначити, і два статистики можуть не погодитися з тієї чи іншої підгрупи. Як ви вже згадували, в A / B-квадранті немає проблем, але всередині наркотиків / плацебо ви виявили певну стурбованість. Так чи є тест на кислоту для цього припущення?
докторантура

2
Щодо мінливості, то немає ніякого "тесту" на вигідність. На відміну від незалежності (яка перевіряється), змінюваність - це скоріше припущення моделювання, що якби ви брали повторні зразки, як той, який ви взяли, ви виявите, що кожна перестановка виникає точно однаковою частиною часу. У вас є лише 1 зразок, тому ви не можете "протестувати" його.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.