Скільки разів я повинен котити штамп, щоб впевнено оцінити його справедливість?


22

(Заздалегідь вибачтесь за використання простої мови, а не статистичної мови.)

Якщо я хочу виміряти шанси прокатки кожної сторони певного фізичного шестигранного штампу до приблизно +/- 2% з розумною впевненістю, скільки потрібно було б зразків валків?

тобто скільки разів мені знадобиться прокатати штамп, підраховуючи кожен результат, щоб бути на 98% впевненим, що шанси, що він котить кожну сторону, знаходяться в межах 14,6% - 18,7%? (Або деякі подібні критерії, коли можна було б приблизно на 98% впевнитись, що загибель справедлива в межах 2%.)

(Це проблема в реальному світі щодо імітаційних ігор, що використовують кістки, і хочуть бути впевненими, що певні конструкції з кістки прийнятно близькі до 1/6 шансу прокатати кожне число. Існують твердження, що багато поширених конструкцій з кістки були виміряні прокатки 29% 1 на прокатка декількох таких кісток 1000 разів у кожній.)


1
Це набагато складніше, ніж пошук довірчого інтервалу для бінома, оскільки ви хочете перевірити всі ймовірності під контролем. Подивіться на статтю Хсюінга Ванга про одночасні довірчі інтервали для багаточленних розподілів ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). Ви можете знайти якийсь код у цій публікації блогу , яка також дає короткий підсумок деяких робіт, які були зроблені над цим.
idnavid

1
Зауважте, що якщо ви просто зацікавлені у тому, щоб перевірити, чи вистачає часу на 1-ю кількість часу, це значно спрощує питання.
Денніс Джахеруддін

2
Важливо зауважити, що "інтервал довіри" не дає вам "відсоткової ймовірності бути правильним". Я підозрюю, що ви використовуєте дуже розумне загальне використання терміна "98% впевнений", але ви повинні знати, що колись хтось згадає "довірчий інтервал", який зовсім не такий, як 98% ймовірність
BrianH

1
@BrianH Дякую! Я не просто мав на увазі розмовний вираз, але шукаю кількісну оцінку визначеності, яку передбачає тест. Мені здається, що так само, як має сенс сказати, що я розраховую на прокручування деякого результату штампу, який можна вирахувати, відсоток часу, що буде подібний (але складніший) розрахунок, наскільки вірогідний я прокат результатів певна помилка в тому, що я прокручую n разів, саме так, на мою думку, я розумію відповідь Xiamoi (та коментар, що подається). Так?
Дронз

1
@Dronz Справедливо кажучи, це одна з тих речей, які, на вашу думку, були б більш прямими, ніж виявляється насправді. Насправді диявольсько хитрі. Ось декілька ключових питань, пов’язаних із цим, де можна допомогти вам зрозуміти, як не існує неймовірно прямої відповіді: Частота math.stackexchange.com/questions/1578932/… Байєсівська математика.stackexchange.com/ questions/ 1584833/… та весело: rpg.stackexchange.com/questions/70802/…
BrianH

Відповіді:


18

TL; DR: якщо p = 1/6, і ви хочете знати, наскільки великим н потрібно бути на 98% впевненим, що кістки справедливі (до 2%), н повинно бути не менше н ≥ 766 .


Нехай н - кількість рулонів, а Х кількість рулонів, які приземляються на деяку задану сторону. Тоді Х слідує за двочленним (n, p) розподілом, де p - ймовірність отримання зазначеної сторони.

За центральною граничною теоремою ми це знаємо

n(X/np)N(0,p(1p))

Оскільки X/n - вибіркове середнє значення n випадкових величин Бернуллі (p) . Отже, для великих n довірчі інтервали для p можна побудувати як

Xn±Zp(1p)n

Так як p невідомо, ми можемо замінити його середню вибіркову р = Х / п , і різними теоремами збіжності, ми знаємо , що в результаті довірчий інтервал буде асимптотический дійсним. Таким чином ми отримуємо довірчі інтервали формиp^=X/н

p^±Zp^(1p^)n

з р = Х / п . Я припускаю, що ви знаєте, що таке Z -користувачі. Наприклад, якщо ви хочете 95% -ний довірчий інтервал, ви берете Z = 1,96 . Отже, для заданого рівня довіри α у нас єp^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Тепер скажімо, що ви хочете, щоб цей довірчий інтервал був довжиною менше Cα , і хочете знати, наскільки великий вибірки нам потрібно зробити для цього випадку. Ну, це рівносильно питати, що nα задовольняє

Zαp^(1p^)nαCα2

Що потім вирішується для отримання

nα(2ZαCα)2p^(1p^)

ZαCαp^nαpn


3
Спасибі. Оскільки я не займався математикою типу коледжу протягом десятиліть, чи можу я занепокоїти вас, щоб підключити цифри і насправді дати мені бальний стіл, скільки разів мені потрібно було прокатати штамб, як ціле число?
Дронз

9
p=1/6nnn766Cα

4
Можливо, буде цікавіше подивитися на розподіл багаточленів, оскільки зараз ми перевіряємо кожну сторону окремо. Це не враховує всю інформацію, яку ми маємо про проблему. Для детального пояснення дивіться на stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
січня

5
Я згоден з @Jan: Ця відповідь не стосується питання. Більше того, його не можна легко пристосувати для побудови відповіді, застосувавши її окремо до всіх шести граней, оскільки шість тестів взаємозалежні.
whuber

3
Це гарна відповідь, але я повністю згоден з @Jan, whuber. Це запитання заслуговує на відповідь, засновану на статистиці хі-квадрата та мультиноміальному розподілі.
Łukasz Grad
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.