Скажімо, у мене є друг (назвемо його "Джордж"), який каже, що він може керувати рулонними кістками, використовуючи свій розум (тобто, зробіть так, щоб кубики падали на певну кількість, про яку він думає).
Як я можу розробити науково суворий тест, щоб визначити, чи він насправді може це зробити? (Я, звичайно, не думаю, що він може, звичайно, але я хочу, щоб він погодився з деталями тесту, вражаючим стилем Ранді до початку тесту.) Я хочу зменшити (дуже ймовірно) після тестових виправдань що він придумає.
Ось що я маю досі:
Визначте техніку кочення фізичних кісток (які кістки, чашка шейкера, поверхня для посадки тощо)
Визначте "тестовий сеанс", що складається з X рулонів кістки. Це повинно бути достатньо малим, щоб зробити це за один засідання, але достатньо великим, щоб визначити (після аналізу) в межах 95% -99% впевненості, що кістки випали справедливими, або вигідно одній стороні
Запускайте сеанси Y на вибраних кістяках (без впливу Джорджа), як "контроль", щоб переконатися, що кістки показують "справедливі" результати самостійно
Запустіть Z сесії з Джорджем. Перед кожним розкачайте окремий штамб, щоб визначити, на яке число Джордж буде "зосереджено" протягом усього сеансу.
Складіть і проаналізуйте результати.
Джордж виправдовує свої жахливі виступи.
Тож мої запитання до вас:
Якісь недоліки чи проблеми з моєю загальною методологією? Що б Джордж, швидше за все, заперечив?
Чи варто використовувати D6? Або D20? Це важливо? Чи потребує штампу з більшою кількістю облич більше рулонів, щоб отримати аналогічно впевнені результати? Або навпаки? Я вважаю за краще менше рулонів, ніж більше, через практичні міркування :)
Які розумні значення для X , Y та Z ? Вони не зовсім споріднені; якщо вибране значення X дозволяє лише 95% довіри за один сеанс, то 1 з кожні 20 сеансів може "провалитися", навіть без впливу Джорджа
Як визначити "успіх" чи "провал" для окремого сеансу? (Я знайшов це запитання, яке детально описує тест чи-квадрата, тому я вважаю, що це моя методологія оцінки, але які розумні пороги довіри?)
Як визначити "успіх" чи "провал" для загального тесту? Джордж може "виграти" один сеанс за шансом, але скільки Z сесій йому доведеться пройти, щоб пройти весь тест?
Я, мабуть, буду аналізувати ці результати в електронній таблиці MS Excel, якщо це має значення.