Фон
Я розробляю моделювання Монте-Карло, що поєднує в собі результати ряду моделей, і я хочу бути впевненим, що моделювання дозволить мені висловити обґрунтовані твердження щодо ймовірності імітованого результату та точності цієї оцінки ймовірності.
Моделювання знайде ймовірність того, що присяжні, складені із визначеної громади, засудять певного підсудного. Це етапи моделювання:
Використовуючи наявні дані, сформуйте логістичну модель ймовірності ( M ) шляхом регресування «голосування при голосуванні в першому ж складі» на демографічних прогнозах.
Використовуйте методи Монте-Карло для імітації 1000 версій M (тобто 1000 версій коефіцієнтів для параметрів моделі).
Виберіть одну з 1000 версій моделі ( M i ).
Емпанель 1000 присяжних, випадковим чином вибравши 1000 наборів із 12 «присяжних» від «громади» ( С ) осіб із заданими розподілами демографічних характеристик.
Детерміновано обчисліть ймовірність першого голосування винних за кожне присяжне за допомогою M i .
Перетворіть кожен ймовірний голос "присяжних" на визначений голос (виходячи з того, чи більший він чи менший від випадково вибраного значення між 0-1).
Визначте "остаточне голосування" кожного "присяжного" за допомогою моделі (отриманої з емпіричних даних) ймовірності того, що журі буде засуджено, залежно від частки присяжних, які проголосували за засудження у першому голосуванні.
Зберігайте частку винних вироків для 1000 присяжних ( PG i ).
Повторіть кроки 3-8 для кожного з 1000 змодельованих версій M .
Обчислити середнє значення PG і звіт про те , що в якості точкової оцінки ймовірності засудження в C .
Визначте значення 2,5 та 97,5 перцентилу для PG та повідомте, що довірчий інтервал 0,95.
В даний час я використовую 1000 присяжних і 1000 присяжних за теорією, що 1000 випадкових результатів випливає з розподілу ймовірностей - демографічних характеристик С або версій М - заповнить цей розподіл.
Запитання
Чи це дозволить мені точно визначити точність моєї оцінки? Якщо так, то скільки присяжних мені потрібно подавати для кожного розрахунку PG i, щоб покрити розподіл ймовірностей C (тому я уникаю упередженості відбору); чи можу я використовувати менше 1000?
Дуже дякую за будь-яку допомогу!