Пояснення моделі Тобіта


13

У нас 100 учасників у двох групах, n=50в кожній групі. Ми використовували оцінку здатності базового функціонування за 4 часові моменти. Оцінка включає 6 запитань, кожне з яких оцінило 0 - 5. У нас немає індивідуальних балів за кожне запитання, лише загальні бали, що становлять від 0 до 30. Вищі бали вказують на краще функціонування. Проблема полягає в тому, що оцінка є дуже базовою та має суттєвий ефект на стелі. Результати дуже негативно перекошені. Більшість учасників набрали близько 30, особливо за 3 періоди часу подання. Цілком імовірно, що не всі учасники, які набрали верхню межу, є справді рівними у здібностях: деякі учасники мали лише забити 30, а інші набрали 30 з легкістю і набрали б набагато вище, якби це було можливо, і тому дані є цензурований зверху.

Я хочу порівняти дві групи та з часом, але, очевидно, це дуже важко, враховуючи характер результатів. Трансформації будь-якого виду не мають значення. Мені повідомили, що модель Tobit найкраще підходить для цієї оцінки, і я можу запустити аналіз на R, використовуючи приклади з статті Арна Геннінгена, Оцінюючи цензуровані регресійні моделі в R за допомогою пакету censReg .

Однак я маю лише основні знання статистики і вважаю, що інформація про модель Tobit є досить складною. Мені потрібно вміти пояснити цю модель простою мовою, і я не можу знайти простої мови, гайок і болтів пояснення того, що насправді робить і як модель Tobit. Чи може хтось пояснити модель Тобіта або вказати мені у бік читабельної посилання без складних статистичних та математичних пояснень?

Надзвичайно вдячний за будь-яку допомогу

Відповіді:


8

Вікі описує модель Tobit так:

yi={yiifyi>0 0ifyi0

yi=βxi+ui

uiN(0,σ2)

Я пристосую вищевказану модель до вашого контексту і запропоную просте англійське тлумачення рівнянь, яке може бути корисним.

yi={ yiifyi3030ifyi>30

yi=βxi+ui

uiN(0,σ2)

yi

  1. yi=30ifyi>30

  2. yi=yiifyi30

  3. yixi

Я сподіваюся, що це корисно. Якщо якийсь аспект не зрозумілий, сміливо запитайте у коментарях.


Варті, я дуже цінував вашу відповідь. Це було дуже корисно, і дуже швидко! Не впевнений, що мені буде комфортно пояснювати це, але я продовжую читати. Якщо ви знаєте якісь тексти, прочитані на Tobit, будь ласка, не соромтеся пересилати їх. Велике спасибі ще раз
Адам

4

Є стаття Берка у виданні американського соціологічного огляду 1983 року (3-й випуск) - саме так я дізнався про цензуру. Пояснення стосується спеціальної упередженості вибору, але абсолютно стосується вашої проблеми. Зміщення селекції, як обговорює Берк, - це лише цензура за допомогою процесу відбору вибірки; у вашому випадку цензура є результатом нечутливого інструменту. Існує кілька приємних діаграм, які точно показують, як ви можете очікувати зміщення вашої регресійної лінії, коли Y по-різному цензурується. Взагалі стаття є логічною та інтуїтивно зрозумілою, а не математичною (так, я розглядаю їх як окремі, віддаючи перевагу першій). Тобіт обговорюється як одне рішення проблеми.

Загалом, звучить, як тобіт - це правильний інструмент для роботи. В основному, як це працює, це оцінити ймовірність цензури, а потім включити її в рівняння, що прогнозує рахунок. Є ще один підхід, запропонований Гекманом із використанням пробіта та коефіцієнта зворотних фрез, що в основному одне і те ж, але дозволяє вам мати різні змінні, що прогнозують ймовірність цензури та оцінку на тесті - очевидно, що це не було б прихильним до ситуації, яку ви мати.

Ще одна рекомендація - ви можете розглянути ієрархічну модель тобітів, де спостереження вкладені у людей. Це правильно би пояснювало тенденцію до помилок, пов’язаних із особами. Або якщо ви не використовуєте ієрархічну модель, принаймні не забудьте скоригувати свої стандартні помилки для кластеризації спостережень у людей. Я знаю, що це все можна зробити в Stata, і я впевнений, що R з усією її універсальністю може це зробити і .. але, як завзятий користувач Stata, я не можу надати вам ніяких вказівок щодо того, як це зробити в Р.


Я припускаю, що це повна цитата до статті @Will має на увазі: Berk, RA (1983). Вступ до зміщення відбору вибірки в соціологічних даних. Американський соціологічний огляд, 48, 386-398. doi: 10.2307 / 2095230 Існує кілька вільно доступних версій цього документу, які ви знайдете в Google Scholar, наприклад.
crsh
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.