Які плюси та мінуси використання методу реєстрації та порівняння методу Мантеля-Хаенцеля для обчислення коефіцієнта небезпеки в аналізі виживання?


17

Одним із способів узагальнити порівняння двох кривих виживань є обчислення коефіцієнта небезпеки (HR). Існують (принаймні) два способи обчислення цього значення.

  • Метод Логранка. У рамках обчислень Каплана-Мейєра обчисліть кількість спостережуваних подій (як правило, випадків смерті) у кожній групі ( і O b ), а також кількість очікуваних подій, припускаючи нульову гіпотезу про відсутність різниці у виживанні ( E a і Е б ). Коефіцієнт небезпеки тоді: H R = ( O a / E a )ОаОбЕаЕб
    НR=(Оа/Еа)(Об/Еб)
  • Метод Мантеля-Хаенцеля. Перший обчислити V, що є сумою гіпергеометричних дисперсій у кожній часовій точці. Потім обчисліть коефіцієнт небезпеки як: Я отримав обидва ці рівняння з розділу 3 Махіна, Ченґу та Пармара,аналіз виживання. У цій книзі зазначено, що обидва методи дають дуже схожі методи, і справді це стосується прикладу в книзі.
    НR=досвід((Оа-Еа)V)

Хтось надіслав мені приклад, коли два способи відрізняються в три рази. У цьому конкретному прикладі очевидно, що оцінка великого розміру є розумною, а оцінка Мантеля-Хаенцеля - далеко. Моє запитання: чи хтось має якусь загальну пораду щодо того, коли найкраще вибрати оцінку коефіцієнта небезпеки, а коли найкраще вибрати оцінку Мантеля-Хаензеля? Це стосується розміру вибірки? Кількість зв’язків? Коефіцієнт розмірів зразків?


Як ці оцінки ставляться до тієї, яку дає регресія Кокса? Це має бути золотим стандартом для оцінки HR.
Аніко

Модель Кокса включає в себе коваріати. Методи Каплана-Мейєра, Нельсона-Аалена, Мантеля-Хаензеля моделюють небезпеку як функцію лише віку.
shabbychef

@shabbychef: використовуючи Cox PH, використовуйте єдиний бінарний коваріат, тобто закодований 0/1 для груп порівняння / порівняння, тоді exp (beta) = HR.
АРС

Журнал рангів є більш потужним тестом, ніж Кокс PH, коли пропорційне припущення про небезпеку виконано. Таким чином, з однорівневим дворівневим коефіцієнтом кращим є тест на зруб або тест Мантеля-Хаензеля.
Thylacoleo

див. відповідь нижче
Thylacoleo

Відповіді:


11

Я думаю, я зрозумів відповідь (на власне запитання). Якщо припущення про пропорційну небезпеку вірно, два методи дають аналогічні оцінки коефіцієнта небезпеки. Невідповідність, яку я виявив в одному конкретному прикладі, я думаю, зараз пояснюється тим, що це припущення є сумнівним.

Якщо припущення про пропорційну небезпеку вірно, то на графіку log (час) проти log (-log (St)) (де St - пропорційне виживання в момент t) повинен відображатися дві паралельні лінії. Нижче наведено графік, створений із набору проблемних даних. Це здається далеко не лінійним. Якщо припущення про пропорційну небезпеку не вірно, то поняття коефіцієнта небезпеки є безглуздим, і тому не має значення, який метод використовується для обчислення коефіцієнта небезпеки.

alt текст

Цікаво, чи невідповідність між оцінкою коефіцієнта небезпеки між грагранком та Мантел-Хаенцелем може бути використана як метод перевірки припущення про пропорційну небезпеку?


7

Якщо я не помиляюся, оцінювач журналу рангів, на який ви посилаєтеся, також відомий як оцінка щука. Я вважаю, що зазвичай рекомендується для HR <3, оскільки він виявляє меншу упередженість у цьому діапазоні. Наступний документ може представляти інтерес (зауважте, що цей документ називає його O / E):

[...] Метод O / E є упередженим, але в межах значень співвідношення відсотків ризику, що представляють інтерес у клінічних випробуваннях, він є більш ефективним щодо середньої квадратичної помилки, ніж КМЛ або Ментел-Хаензель метод для всіх, крім найбільших випробувань. Метод Мантеля-Хаенцеля є мінімально упередженим, дає відповіді дуже близькі до тих, які отримані за допомогою CML, і може використовуватися для забезпечення задовільних приблизних довірчих інтервалів.


Коротко ознайомившись із цим документом, я не впевнений, що їхні оцінки є такими ж, як і в рівняннях запитувача. Я погоджуюся з коментарями під питанням - можливо, у 1981 році приблизні методи були корисними, але в наші дні немає очевидних причин не використовувати регресію Кокса.
onestop

@onestop: хм, подумайте, визначення O / E == LR з логом, забутим вище? Я погоджуюся з тим, що ви говорите про Cox PH - це не питання, на яке я намагався відповісти, але ваша порада краще в більш широкому контексті.
АРС

Bernstein та ін. ін. покажіть деякі причини (малі n, зв’язки), які спричиняють неточність або різні методи двох методів. Але всі виявлені ними розбіжності невеликі. Тож я не думаю, що в цьому документі нічого пояснюється трикратною невідповідністю, яку я побачив, що наштовхнуло це питання. Дивіться нижче відповідь, яку я придумав.
Харві Мотульський

7

Насправді існує ще кілька методів, і вибір часто залежить від того, чи найбільше ви зацікавлені в пошуку ранніх розбіжностей, пізніших відмінностей, або - як для тесту журналу та тесту Мантеля-Хаенцеля - надайте однакову вагу всім моменту часу.

До питання під рукою. Тест рангового журналу насправді є формою тесту Мантеля-Хаенцеля, застосованого до даних виживання. Тест Мантел-Хаензеля зазвичай використовується для перевірки незалежності в стратифікованих таблицях на випадок надзвичайних ситуацій.

Якщо ми спробуємо застосувати тест МЗ до даних виживання, ми можемо почати з того, що припускаємо, що події в кожен момент відмови є незалежними. Потім ми стратифікуємо час відмови. Ми використовуємо методи MH для того, щоб робити кожен провал часу. Не дивно, що вони часто дають однаковий результат.

Виняток трапляється, коли одночасно відбувається більше однієї події - множинні випадки смерті точно в один і той же час. Я не можу пригадати, як тоді відрізняється лікування. Я думаю, що тест журнального рейтингу в середньому перевищує можливі впорядкування зв'язаних часів відмов.

Таким чином, тест журнального рейтингу є тестом MH на дані про виживання і може мати справу з зв'язками. Я ніколи не використовував тест МЗ для даних про виживання.


3

Я подумав, що натрапив на веб-сайт та довідку, яка стосується саме цього питання:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Почніть з "Порівняння двох методів".

Сайт посилається на пов'язані (вище) документи про папери Берштейна:

http://www.jstor.org/stable/2530564?seq=1

Сайт добре підводить результати Berstein та ін, тому я цитую його:

Обидві зазвичай дають однакові (або майже однакові) результати. Але результати можуть відрізнятися, коли одночасно гинуть декілька суб'єктів або коли коефіцієнт небезпеки далекий від 1,0.

Бернсетін та його колеги проаналізували модельовані дані обома методами (1). У всіх їх моделювання припущення про пропорційну небезпеку було правдивим. Два методи дали дуже схожі значення. Метод реєстрації (який вони називають методом O / E) повідомляє про значення, близькі до 1,0, ніж справжній коефіцієнт небезпеки, особливо коли коефіцієнт небезпеки великий або розмір вибірки великий.

Коли є зв’язки, обидва способи є менш точними. Методи входу в систему, як правило, повідомляють про коефіцієнти небезпеки, які навіть ближче до 1,0 (тому коефіцієнт небезпеки, про який повідомляється, занадто малий, коли коефіцієнт небезпеки перевищує 1,0, і занадто великий, коли коефіцієнт небезпеки менше 1,0). Метод Мантеля-Хаензеля, навпаки, повідомляє про коефіцієнти небезпеки, що перевищують 1,0 (тому коефіцієнт небезпеки, що повідомляється, занадто великий, коли коефіцієнт небезпеки перевищує 1,0, і занадто малий, коли коефіцієнт небезпеки менше 1,0).

Вони не перевіряли двох методів із імітованими даними, де припущення про пропорційну небезпеку не відповідає дійсності. Я бачив один набір даних, де дві оцінки ЧСС сильно відрізнялися (в три рази), і припущення про пропорційну небезпеку було сумнівним для цих даних. Здається, що метод Мантеля-Хаензеля надає більшої ваги різниці в небезпеці в пізні моменти часу, тоді як метод входу в систему дає однакову вагу скрізь (але я не детально це досліджував). Якщо ви бачите дуже різні значення HR за допомогою двох методів, подумайте, чи розумне припущення про пропорційну небезпеку. Якщо це припущення не є розумним, то, звичайно, вся концепція єдиного коефіцієнта небезпеки, що описує всю криву, не має сенсу.

На сайті також посилаються на набір даних, в яких "дві оцінки HR були дуже різними (в три рази)", і припускають, що припущення щодо PH є ключовим фактором.

Тоді я подумав: "Хто автор сайту?" Після невеликого пошуку я виявив, що це Гарві Мотульський. Тож Гарві, мені вдалося посилатися на вас, відповідаючи на ваше власне запитання. Ви стали авторитетом!

Чи "набір даних проблем" є загальнодоступним набором даних?


Я зрозумів відповідь два дні тому і опублікував її тут як нову відповідь. Потім я розширив та оновив знайдену веб-сторінку на graphpad.com. Я щойно відредагував цю сторінку, щоб включити посилання на файл Excel із даними про проблему ( graphpad.com/faq/file/1226.xls ). Я не міг цього зробити, поки не отримав дозвіл від хлопця, який створив дані (він хоче бути анонімним, і дані нечітко позначені).
Харві Мотульський
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.