Пошук точності оцінки імітації Монте-Карло


12

Фон

Я розробляю моделювання Монте-Карло, що поєднує в собі результати ряду моделей, і я хочу бути впевненим, що моделювання дозволить мені висловити обґрунтовані твердження щодо ймовірності імітованого результату та точності цієї оцінки ймовірності.

Моделювання знайде ймовірність того, що присяжні, складені із визначеної громади, засудять певного підсудного. Це етапи моделювання:

  1. Використовуючи наявні дані, сформуйте логістичну модель ймовірності ( M ) шляхом регресування «голосування при голосуванні в першому ж складі» на демографічних прогнозах.

  2. Використовуйте методи Монте-Карло для імітації 1000 версій M (тобто 1000 версій коефіцієнтів для параметрів моделі).

  3. Виберіть одну з 1000 версій моделі ( M i ).

  4. Емпанель 1000 присяжних, випадковим чином вибравши 1000 наборів із 12 «присяжних» від «громади» ( С ) осіб із заданими розподілами демографічних характеристик.

  5. Детерміновано обчисліть ймовірність першого голосування винних за кожне присяжне за допомогою M i .

  6. Перетворіть кожен ймовірний голос "присяжних" на визначений голос (виходячи з того, чи більший він чи менший від випадково вибраного значення між 0-1).

  7. Визначте "остаточне голосування" кожного "присяжного" за допомогою моделі (отриманої з емпіричних даних) ймовірності того, що журі буде засуджено, залежно від частки присяжних, які проголосували за засудження у першому голосуванні.

  8. Зберігайте частку винних вироків для 1000 присяжних ( PG i ).

  9. Повторіть кроки 3-8 для кожного з 1000 змодельованих версій M .

  10. Обчислити середнє значення PG і звіт про те , що в якості точкової оцінки ймовірності засудження в  C .

  11. Визначте значення 2,5 та 97,5 перцентилу для PG та повідомте, що довірчий інтервал 0,95.

В даний час я використовую 1000 присяжних і 1000 присяжних за теорією, що 1000 випадкових результатів випливає з розподілу ймовірностей - демографічних характеристик С або версій М - заповнить цей розподіл.

Запитання

Чи це дозволить мені точно визначити точність моєї оцінки? Якщо так, то скільки присяжних мені потрібно подавати для кожного розрахунку PG i, щоб покрити розподіл ймовірностей C (тому я уникаю упередженості відбору); чи можу я використовувати менше 1000?

Дуже дякую за будь-яку допомогу!


Лише з цікавості: чи обумовлено щось у цій моделі від того, чи справді обвинувачений винен ?
whuber

Модель базується на відповідях опитування щодо єдиної моделі фактів, тому фактична провина не змінюється. Я прогнозую, як в одній спірній справі виходитимуть різні присяжні.
Меггі

Гаразд, відхиляючись, ви повідомляєте про три оцінки: середній і 2,5 та 97,5 відсотків ПГ. Для яких (-ів) вам потрібно "точне" визначення та наскільки воно повинне бути точним?
whuber

Також крок (6) загадковий. Чи могли б ви пояснити, що він призначений робити? Чи є різне "випадково вибране значення" для кожного присяжного (5), кожного присяжного (4), кожної моделі (3) або якоїсь їх комбінації?
whuber

1
(Див. Коментар вище) Я думаю, що можу зменшити (а) кількість присяжних. Помилка вибірки - це залежність від кількості вибірок. З 1000 присяжних на кожну модель у мене є мільйон зразків. Похибка вибірки, пов'язана з 10 ^ 6 пробами, становить ~ 0,1%. Якщо я використовую лише 35 присяжних на кожну модель, я маю 3,5 * 10 ^ 4 зразка та ~ 0,5% помилки вибірки. Ця помилка вибірки набагато менша за мою помилку вимірювання ~ 5,0%. Тому я повинен мати можливість використовувати 35 присяжних на кожну модель і просто використовувати помилку вимірювання для оцінки мого довірчого інтервалу.
Меггі

Відповіді:


4

Існує один загальний і "всесвітній" критерій доброти Монте-Карло - конвергенція.

Дотримуйтесь одного М і перевірте, як PG поводиться з кількістю присяжних - він повинен сходитися, тому покаже вам кількість повторень, для яких у вас буде розумна (для вашої заявки) кількість значущих цифр. Повторіть цей орієнтир для кількох інших представниць, щоб переконатися, що вам не пощастило з вибором M, а потім приступайте до всього моделювання.


1
не впевнений, що хтось повністю відповідав на питання. Вона складається з двох частин: (1) Чи описана описана стратегія моделювання захищає вирішення проблеми, яку вона хоче вирішити, а саме - яка ймовірність того, що присяжне, обране випадковим чином із громади С , із визначеними демографічними характеристиками, проголосує за пошук підсудний винен? І (2) Якщо стратегія моделювання є розумною, скільки "присяжних" вона повинна вибрати, і скільки "вироків" вона повинна імітувати для кожного, щоб повідомити обґрунтовану оцінку судимості і 0,95 CI? Вона хоче економити на обчислювальній техніці. Дивіться її останній коментар
dmk38

0

Мені здається, проблема тут полягає в тому, чи є модель занадто складною, щоб виглядати, не використовуючи моделювання Монте-Карло.

Якщо модель є відносно простою, то слід розглянути її за допомогою конвенціональної статистики та отримати рішення заданого питання, не повторно запускаючи модель кілька разів. Це трохи непосильне спрощення, але якщо вся ваша модель робила точки, засновані на нормальному розподілі, ви зможете легко отримати потрібний варіант відповідей. Звичайно, якщо модель така проста, то вам навряд чи знадобиться робити моделювання в Монте-Карло, щоб знайти свої відповіді.

Якщо проблема є складною і її неможливо розбити на більш елементарну, Монте-Карло - це правильний тип моделі, але я не думаю, що існує спосіб визначення меж довіри без руйнування моделі. Зрештою, щоб описати тип меж довіри, описаний ним, модель повинна була б бути запущена кілька разів, розподіл ймовірностей повинен був би відповідати результатам, і звідти можна було б визначити межі конфіденційності. Одне з викликів моделювання Монте-Карло полягає в тому, що моделі дають хороші і регулярні відповіді на розподіли в середньому діапазоні, але хвости часто дають набагато більше змінних результатів, що в кінцевому підсумку означає більше пробіжок для визначення форми виходів на рівні 2,5% і 97,5% перцентилів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.