Було обстежено випадкову вибірку популяції. Їх запитали, чи їдять вони вегетаріанську дієту. Якщо вони відповіли "так", їх також попросили вказати, як довго вони їдять вегетаріанську дієту без перешкод. Я хочу використовувати ці дані для обчислення середньої тривалості прихильності до вегетаріанства. Іншими словами, коли хтось стає вегетаріанцем, я хочу знати, що в середньому вони залишаються вегетаріанцями. Припустимо, що:
- Усі респонденти дали правильні та точні відповіді
- Світ стабільний: популярність вегетаріанства не змінюється, не змінюється і середня тривалість прихильності.
Мої міркування поки що
Мені було корисно проаналізувати модель іграшок світу, де на початку кожного року двоє людей стають вегетаріанцями. Щоразу один з них залишається вегетаріанцем 1 рік, а інший - 3 роки. Очевидно, середня тривалість прихильності в цьому світі становить (1 + 3) / 2 = 2 роки. Ось графік, що ілюструє приклад. Кожен прямокутник являє собою період вегетаріанства:
Скажімо, ми проводимо опитування в середині 4 року (червона лінія). Ми отримуємо такі дані:
Ми отримаємо ті самі дані, якби ми взяли опитування в будь-який рік, починаючи з третього року. Якщо ми просто оцінюємо відповіді, які ми отримуємо:
(2 * 0,5 + 1,5 + 2,5) / 4 = 1,25
Ми недооцінюємо, оскільки вважаємо, що всі перестали бути вегетаріанцями відразу після опитування, що, очевидно, неправильно. Щоб отримати оцінку, що ближче до реального середнього часу, коли ці учасники залишатимуться вегетаріанцями, можна припустити, що в середньому вони повідомили про час приблизно на півдорозі свого періоду вегетаріанства та помножили тривалість повідомлення на 2. У великому опитуванні малювали випадковим чином з населення (на зразок тієї, яку я аналізую), я вважаю, що це реально припущення. Принаймні, це дасть правильне очікуване значення. Однак якщо подвоєння - це єдине, що ми робимо, ми отримуємо в середньому 2,5, що є завищеним. Це тому, що чим довше людина залишається вегетаріанцем, тим більше шансів (і) він опинитися у вибірці нинішніх вегетаріанців.
Тоді я подумав, що ймовірність того, що хтось є у вибірці нинішніх вегетаріанців, пропорційна їх тривалості вегетаріанства. Щоб пояснити цю упередженість, я намагався розділити кількість поточних вегетаріанців на їх передбачувану тривалість прихильності:
Однак це дає і невірне середнє значення:
(2 * 1 + ⅓ * 3 + ⅕ * 5) / (2 + ⅓ + ⅕) = 4 / 2,533333 = 1,579 року
Це дасть правильну оцінку, якби кількість вегетаріанців розділили на їх правильну довжину прихильності:
(1 + ⅓ * (1 + 3 + 5)) / (1 + ⅓ * 3) = 2 роки
Але це не спрацьовує, якщо я використовую передбачувані довжини дотримання, і вони є все, що я маю насправді. Я не знаю, що ще спробувати. Я читав трохи про аналіз виживання, але не знаю, як його застосувати в цьому випадку. В ідеалі я також хотів би мати можливість обчислити 90% довірчий інтервал. Будь-які поради були б дуже вдячні.
EDIT: Можливо, на вищезазначене питання немає відповіді. Але також було ще одне дослідження, яке запитувало випадкову вибірку людей, чи є вони / були вегетаріанцями і скільки разів вони були вегетаріанцями в минулому. Я також знаю вік кожного в навчанні та в деяких інших речах. Можливо, ця інформація може бути використана разом із опитуванням сучасних вегетаріанців, щоб якось отримати середнє значення. Насправді, дослідження, про яке я говорив, - це лише одна частина головоломки, але дуже важлива і я хочу отримати її більше.