Поздовжнє порівняння двох розподілів


10

У мене є результати аналізу крові, проведеного 2500 людям чотири рази з шестимісячним інтервалом. Результати в основному складаються з двох заходів імунної відповіді - одного за наявності певних антигенів туберкульозу, а одного за відсутності. В даний час кожен тест оцінює як позитивний, так і негативний, виходячи з різниці між реакцією на антиген і нульовою відповіддю (при цьому ідея полягає в тому, що якщо ваша імунна система реагує на антигени проти туберкульозу, ви, швидше за все, потрапили в саму бактерію в якийсь момент ). По суті, тест передбачає, що розподіл нульових та туберкульозних реакцій у людей, що не піддаються впливу, має бути в основному однаковим, тоді як у людини, що має вплив на туберкульоз, будуть відповіді на туберкульоз, отримані з іншого розподілу (більш високих значень). Caveat: відповіді дуже, дуже ненормальні, і значення збиваються як на природній підлозі, так і на урізаному приладом стелі.

Однак у цій поздовжній обстановці виглядає досить зрозуміло, що ми отримуємо «помилкові позитиви» (я боюся, що немає жодного фактичного золотого стандарту при латентному туберкульозі), спричиненого (типово невеликими) коливаннями антигенної та нульової реакцій. Хоча цього може бути важко уникнути в деяких ситуаціях (у вас може бути лише один шанс протестувати когось), є багато ситуацій, коли люди регулярно тестуються на туберкульоз щороку або близько того - у США це звичайно для медичних працівників, військові, бездомні, які перебувають у притулках тощо. Зрозуміло соромно ігнорувати попередні результати випробувань, оскільки діючі критерії мають поперечний переріз.

Я думаю, що те, що я хотів би зробити, - це те, що я грубо уявляю як аналіз поздовжньої суміші. Так само, як критерії поперечного перерізу, я хотів би мати можливість оцінити ймовірність того, що відповіді на туберкульоз та нульові показники людини отримують з одного і того ж розподілу, але щоб ця оцінка включала попередні результати тестування, а також інформацію з вибірки як в цілому (наприклад, чи можу я використовувати вибіркове розподіл внутрішньоособистих змінних для покращення моїх оцінок розподілу нуля або туберкульозу конкретного індивіда?). Розрахована ймовірність повинна мати можливість змінюватися з часом, звичайно, враховувати можливість нової інфекції.

Я повністю перекрутився, намагаючись подумати про це незвичними способами, але я відчуваю, що ця концептуалізація така ж гарна, як і будь-яка, з якою я збираюся придумати. Якщо щось не має сенсу, будь ласка, попросіть пояснення. Якщо моє розуміння ситуації здається неправильним, будь ласка, скажіть мені. Дуже дякую за допомогу.

У відповідь на Srikant: Це випадок латентної класифікації (зараженої туберкульозом чи ні) з використанням двох безперервних (але не нормальних і усічених) результатів тесту. Зараз ця класифікація проводиться за допомогою відсікання (у спрощеному вигляді TB - нуль> .35 -> позитивний). З результатами тесту, представленими як (нульові, туберкульозні, результати), основними архетипами * є:

Ймовірний негатив: (0,06, 0,15, -) (0,24, 0,23, -) (0,09, 0,11, -) (0,16, 0,15, -)
Ймовірний позитивний: (0,05, 3,75, +) (0,05, 1,56, +) (0,06 , 5,02, +) (0,08, 4,43, +)
Воблер: (0,05, 0,29, -) (0,09, 0,68, +) (0,08, 0,31, -) (0,07, 0,28, -)

Позитив другого тесту на Воблера - це явно відхилення, але як би ви це моделювали? Хоча одна з моїх думок полягає у оцінці "справжньої різниці" між ТБ та нулем у кожний момент часу, використовуючи багаторівневу модель повторних заходів, мені прийшло в голову, що те, що я дійсно хочу знати, - це чи нульова реакція людини та відповідь на туберкульоз. отримують з одного і того ж розподілу, або якщо їх імунна система розпізнає антигени проти туберкульозу та активується, викликаючи посилену реакцію.

Щодо того, що може спричинити позитивний тест, крім інфекції: я не впевнений. Я підозрюю, що це як правило, лише коливання результатів у людини, але, безумовно, є ймовірність інших факторів. У нас є анкети з кожного моменту, але я ще не надто розглядав їх.

* Сфабриковані, але наочні дані


О, і не соромтесь повторно додавати теги - мій браузер не працює з автоматичною пропозицією, тому мені важко бачити, що там.
Метт Паркер

Ваша залежна змінна безперервна чи дискретна? Або, можливо, результат тесту є безперервним, і він перетворюється на дискретний відповідь (тобто, "позитивний", "негативний") залежно від деякої межі? Чи можете ви також уточнити, чому людина перетвориться з негативу на позитивне, не дивлячись на те, що не піддається захворюванню на туберкульоз? Конкретний приклад (з деякими цифрами) такого перевертання може допомогти.

1
Приклади дуже корисні для візуалізації даних. Ще одне питання щодо вашого застереження: "значення знаходяться в групі підлоги та стелі, і що дані не є нормальними". Чи можете ви сказати, чи (а) дані на нижньому кінці шкали виглядають нормально та (б) дані верхнього кінця шкали виглядають нормально?

Примітка: я, мабуть, пропустив термін, щоб насправді нагородити нагороду, тому я встановлюю ще один, щоб я міг належним чином нагородити Сріканта за його допомогу. Більше відповідей завжди вітається, але щедрота за нього.
Метт Паркер

Відповіді:


2

Це не є повною відповіддю, але я сподіваюся, що вона дає вам кілька ідей щодо того, як скласти моделювання ситуації на узгодженому рівні.

Припущення

  1. Значення в нижньому кінці шкали відповідають нормальному розподілу, усіченим знизу.

  2. Значення у верхньому кінці шкали слідкують за нормальним розподілом, усіченим зверху.

    (Примітка. Я знаю, що ви сказали, що дані не є нормальними, але я припускаю, що ви маєте на увазі розподіл усіх значень, тоді як наведені вище припущення стосуються значень у нижньому та верхньому кінці шкали.)

  3. Базовий стан людини (має туберкульоз чи ні) слід за ланцюжком марків першого порядку.

Модель

Дозволяє:

  1. Di(t) буде 1 , якщо в момент часу в людина має TB і 0 в іншому випадку,tith

  2. RTBi(t) буде тест відповідь на тест на туберкульоз в момент часу в людини,tith

  3. RNi(t) - тестова відповідь на тест NILL в момент людини людини,tith

  4. f(RNi(t)|Di(t)=0)N(μl,σl2)I(RNi(t)>Rl)

  5. f(RNi(t)|Di(t)=1)N(μl,σl2)I(RNi(t)>Rl)

    Точки 4 та 5 відображають думку про те, що реакція людини на тест на НІЛ не залежить від стану захворювання.

  6. f(RTBi(t)|Di(t)=0)N(μl,σl2)I(RTBi(t)>Rl)

  7. f(RTBi(t)|Di(t)=1)N(μu,σu2)I(RTBi(t)<Ru)

  8. μu>μl

    Бали 6, 7 та 8 відображають думку про те, що реакція людини на тест на туберкульоз залежить від стану захворювання.

  9. p(t) - ймовірність того, що людина заразиться туберкульозом протягом 6 місяців, що передували часу враховуючи, що вони не були хворобами протягом попереднього періоду тестування. Таким чином, матриця переходу стану буде такою, як нижче:t

    [1p(t)p(t)01]

    Іншими словами,

    Prob(Di(t)=1|Di(t1)=0)=p(t)

    Prob(Di(t)=0|Di(t1)=0)=1p(t)

    Prob(Di(t)=1|Di(t1)=1)=1

    Prob(Di(t)=0|Di(t1)=1)=0

У ваших критеріях тесту зазначено, що:

D^i(t)={1,RTBi(t)RNi(t)0.350,otherwise

Однак, як видно із структури моделі, ви можете фактично параметризувати обмеження та змінити всю проблему на проблему того, що має бути вашим скороченням, щоб точно діагностувати пацієнтів. Таким чином, проблема воблера, швидше за все, викликає ваш вибір обрізань, а не все інше.

Для того, щоб вибрати «правильні» межі, ви можете взяти історичні дані про пацієнтів, які остаточно ідентифіковані як туберкульоз, та оцінити отримані параметри вищевказаних даних. Ви можете використовувати деякі критерії, наприклад, кількість пацієнтів, правильно класифікованих як туберкульоз, або як показник, щоб визначити "найкращу" модель. Для простоти ви можете припустити, що - інваріантний за часом параметр, який здається розумним за відсутності епідемій тощо.p(t)

Сподіваюся, що це корисно.


Спасибі, Срікант! Вибачте, я якось пропустив ваш коментар раніше. Верхній кластер насправді є просто шипом прямо під стелею - там немає ніякої змінності, за винятком довгого розтягування, що пов'язує його з нижнім розподілом, що в основному, як ви описуєте. Знадобиться трохи часу, щоб проаналізувати вашу відповідь (тим більше, що я застряг в IE і не можу побачити LaTeX належним чином зараз), але я дуже вдячний за вашу прихильність до цього дивного маленького питання.
Метт Паркер

3

Хитрий Метт, стільки проблем зі статистикою в реальному світі!

Я б почав визначати цілі / завдання вашого дослідження.

Не знаючи справжнього статусу випробовуваних, важко буде визначити розподіл ймовірностей для тесту на ТБ + та ТБ. Чи є у вас сумніви щодо попередньої туберкульозної інфекції (а ще краще, історії хвороби). Також я все ще тестую туберкульоз через імунізацію в дитинстві - кілька десятиліть тому - тому попередні щеплення потрібно враховувати.

Мені здається, ваше внутрішнє питання таке: чи впливає повторне тестування на туберкульоз на результат тесту?

Варто було б отримати копію Аналізу поздовжніх даних Пітера Дігґла .

Зробіть деякий дослідницький аналіз даних, зокрема розкидайте сюжетні матриці результатів ніл-тесту кожного разу проти один одного, і результати тесту на туберкульоз кожного разу проти один одного; і туберкульоз проти нульових ділянок розсіювання (щоразу). Також візьміть відмінності (тест на туберкульоз - тест на Ніль) і зробіть матриці розсіювання ділянок. Спробуйте перетворити дані та повторити ці дані - я думаю, що журнал (TB) - журнал (Nil) може допомогти, якщо результати туберкульозу дуже великі щодо Nil. Шукайте лінійні відношення в структурі кореляцій.

Іншим підходом було б прийняття визначеного результату тесту (позитивний / негативний) та моделювання цієї логістично на основі нелінійної моделі змішаних ефектів (logit link). Чи переходять деякі люди між тестуванням на туберкульоз + на туберкульоз і це пов'язано з їх тестом на Ніль, на тест на туберкульоз, на туберкульоз - ніль або на деякою трансформацією результатів тесту?


Дякую за вашу відповідь. Що стосується невідомості справжнього статусу: у нас є обширна анкета, і ми добре знаємо проблему вакцини БЦЖ за допомогою шкірного тесту - насправді ці аналізи крові повинні вирішити цю проблему, оскільки вони використовують інший набір антигенів, ніж ППД. звикли. Це майже окреме питання, але над тим, над яким ми будемо працювати трохи пізніше, - саме зараз я зацікавлений у тому, щоб зробити цей тест «довговічно усвідомленим».
Метт Паркер

... тим більше, що деякі люди перетворюються з негативного на позитивне, і це часто є результатом їх типових результатів нуля та туберкульозу, що робить невеликі коливання - трохи знижуються, туберкульоз трохи зростає, і раптом вони позитивні. Наступним тестом вони повернулися до негативних. Я бачу це, переглядаючи окремі результати, але я не впевнений, як належним чином включити свою інтуїцію в модель.
Метт Паркер

Нарешті, хоча я намагався брати результати журналів, це здається недостатньою, щоб наблизити їх до нормальності. Вони дуже-дуже перекошені, і укорочення на високому кінці ще більше ускладнює це, додаючи помітну плітку щільності під стелею. Цікаво, однак, що вибірки розподілу нуля та туберкульозу є досить схожими, з тією лише різницею, що ця крапля на стелі набагато більша за результати туберкульозу.
Метт Паркер

Дякуємо, що знайшли час прочитати та відповісти на цю звірину на запитання!
Метт Паркер
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.