Трійця тестів з максимальною вірогідністю: що робити, стикаючись із суперечливими висновками?


10

Тести мультиплікатора Wald, коефіцієнта ймовірності та Lagrange у контексті максимальної оцінки ймовірності є асимптотично еквівалентними. Однак для невеликих зразків вони, як правило, розходяться зовсім небагато, а в деяких випадках призводять до різних висновків.

Як їх можна класифікувати відповідно до того, наскільки ймовірним є відхилення нуля? Що робити, коли тести мають суперечливі відповіді? Чи можете ви просто вибрати той, який дає відповідь, яку ви хочете, або є "правило" чи "керівництво" щодо того, як діяти?


це, мабуть, лише випадок, коли асимптотичні наближення до [нульових] розподілів однієї чи декількох з трьох статистичних даних тесту не такі гарні? можливо, результати відрізняються, оскільки фактичні розміри тестів різні? наскільки великі розміри вашої вибірки?
ronaf

Відповіді:


5

Я не знаю літератури в цій галузі досить добре, щоб запропонувати прямий відгук. Однак мені здається, що якщо три тести різняться, то це свідчить про необхідність подальших досліджень / збору даних, щоб остаточно відповісти на ваше запитання.

Ви також можете переглянути цей пошук Google Академії

Оновіть у відповідь на ваш коментар:

Якщо збір додаткових даних неможливий, то існує один спосіб вирішення. Зробіть моделювання, яке відображає вашу структуру даних, розмір вибірки та запропоновану модель. Ви можете встановити параметри для деяких заздалегідь заданих значень. Оцініть модель, використовуючи отримані дані, а потім перевірте, який із трьох тестів вказує на правильну модель. Таке моделювання запропонувало б певні вказівки щодо того, який тест використовувати для ваших реальних даних. Чи має це сенс?


1
Ви маєте на увазі певний документ? Я думаю, я міг би знайти відповідь на своє запитання, якби я досліджував, вивчав, читав багато, але так би міг 95% питань, які задають інші люди тут ... Також у деяких випадках, особливо з даними макроекономіки (що є моєю сферою ), більше даних для збору немає. Даних мало, маю на увазі кількість спостережень), і вам просто потрібно з цим жити. Рішення "отримати більше даних" не існує. Я сподівався, що хтось тут дізнається цю тему, але це не схоже. Можливо, раз веб-сайт відкриється для широкої громадськості?
Vivi

Я підозрюю, що відповідь на ваше запитання буде конкретною для домену / моделі, і тому я не впевнений, що можу порекомендувати конкретний документ.

1
Вибачте за пізню відповідь. Мені подобається ваша пропозиція моделювання. Однак це не дуже просто. Правда полягає в тому, що я бачу на практиці те, що дослідники просто роблять тест обчислювально простішим або дають їм бажаний результат.
Vivi

8

Я не дам остаточної відповіді з точки зору ранжирування трьох. Створіть 95% ІС навколо своїх параметрів на основі кожного, і якщо вони кардинально відрізняються, то ваш перший крок повинен бути копати глибше. Перетворіть ваші дані (хоча LR буде інваріантним), регулюйте свою ймовірність і т. Д. Хоча я, мабуть, обрав би тест LR та пов'язаний з ним ІП. Звідси випливає брутальний аргумент.

LR є інваріантним при виборі параметризації (наприклад, T проти logit (T)). Статистика Уолда передбачає нормальність (T - T0) / SE (T). Якщо це не вдасться, ваш ІС поганий. Приємне в LR, що вам не потрібно знайти перетворення f (T), щоб задовольнити нормальність. 95% ІС на основі Т буде однаковим. Крім того, якщо ваша ймовірність не є квадратичною, ІР-синдром 95%, симетричний, може бути незграбним, оскільки він може віддавати перевагу значенням з меншою ймовірністю, ніж тим, у кого більша ймовірність.

Ще один спосіб думати про LR - це те, що він використовує більше інформації, вільно кажучи, від функції ймовірності. Wald заснований на MLE і кривизну ймовірності при нулі. Оцінка базується на нахилі при нулі та кривизні при нулі. LR оцінює вірогідність під нульовим і ймовірність за об'єднанням нульового та альтернативного та поєднує обидві. Якщо ви змушені вибрати один, це може бути інтуїтивно задоволенням для вибору LR.

Майте на увазі, що існують інші причини, такі як зручність чи обчислюваність, для вибору Wald або Score. Wald - це найпростіший і з урахуванням багатовимірного параметра, якщо ви перевіряєте встановлення багатьох індивідуальних на 0, є зручні способи наблизити ймовірність. Або якщо ви хочете додати змінну одночасно з якогось набору, можливо, ви не хочете збільшити ймовірність для кожної нової моделі, і реалізація тестів Score пропонує тут деяку зручність. Wald і Score стають привабливими, оскільки ваші моделі та ймовірність стають непривабливими. (Але я не думаю, що це те, про що ви питали, оскільки у вас є всі три доступні ...)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.