Дані Джона Керріха


12

Хто-небудь може підказати, де отримати результати 10 000 монетних переворотів (тобто всіх 10 000 голів і хвостів), виконаних Джоном Керріхом під час Другої світової війни?


1
Зважаючи на те, що він був закритий у нацистській тюрмі, мені цікаво, чи вистачало паперу, щоб записати всі 10-кілограмовий результат, чи він фактично записав підсумкові значення.
Корон

6
Результати @Corone 10K легко можна записати на один стандартний аркуш паперу, використовуючи, скажімо, крапку та штрих-код (як у ||||..|....||.|..||.тощо). Це можна стиснути, використовуючи (наприклад) шістнадцятковий. У попередньому прикладі, якщо нехай |буде 1, а .0, це шестигранний подання f21a6. Вводячи невеликі, але видимі символи, я легко вміщую 50 таких символів в один рядок і 50 рядків на аркуші, тим самим представляючи послідовність 50 * 50 * 4 = 10 К результатів.
whuber

2
@whuber haha, так, я почав обмірковувати подібні речі після свого коментаря. Я сумніваюся, що в докомп'ютерну епоху шістнадцяткова цифра виникла б на розум, як це відбувається зараз, хоча восьмерик все одно дасть вам шанс. І все-таки я дав йому піти, і в крапках і крапках один я міг отримати більше, ніж 100 на аркуші, тож якби він використовував обидві сторони, 10K майже підійде. Можливо, тому він зупинився на 10К!
Корон

Нацистська в'язниця, так, але в Данії це був не табір винищення ...
kjetil b halvorsen

@kjetilbhalvorsen - насправді датський табір в'язниць у Холді з датськими охоронцями тощо, щоб захистити інтернованих від німців
Генріх

Відповіді:


13

Я раніше не чув про Керріха - яка дивна історія. Сканування книги Google (спільне використання reftt) "Експериментальне введення в теорію ймовірності", схоже, не містить основної частини тексту. Відчувши себе трохи старомодно, я перевірив примірник видання 1950 року з бібліотеки.

Я просканував кілька сторінок, які мені здалися цікавими. Сторінки описують його умови випробування, дані перших 2000 монет перевертаються та дані перших 500 із 5000 з 5000 однаково неправдоподібних звукових експериментів урн (з 2 червоними та 2 зеленими кулями для пінг-понгу).


Розпізнавання тексту (і деяке очищення) за допомогою Mathematica 9 дає таку послідовність 2000 хвостів (0) та голов (1) з Таблиці 1. Кількість головок 1014 є на один більше 502 + 511 = 1013 в Таблиці 2, тому розпізнавання було недосконалий, але це виглядає досить добре - принаймні, він отримав потрібну кількість символів! (Готовим очима читачів пропонується виправити це.)

Ось графічний підсумок цієї випадкової прогулянки з наступними самими даними. Накопичена різниця між кількістю голови та хвоста йде зліва направо, охоплюючи всі 2000 результатів.

Малюнок

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111

3
Ласкаво просимо. Я наклав сюжет цих даних на ваше відскановане зображення, сподіваючись, що це зробить якісь розбіжності очевидними, але я не в змозі знайти будь-яких відмінностей. Або немає помилок, і Керріх помилився, або я просто не можу знайти помилку, але в будь-якому випадку наведені тут дані є точним текстовим відображенням його таблиці 1.
whuber

4

Ця презентація показує дані для встановлених інтервалів кидок. Він також посилається на першоджерело Керріха.


2
Джерелом (підсумкових) даних у цій презентації є Freedman, Pisani & Purves Statistics (будь-яке видання). Це, однак, лише короткий підсумок, а не звіт про всі запитувані тут результати. Керріх опублікував свої результати в 1946 році в невеликій книжці; Google оцифрував це .
whuber

Як я вже говорив, у ньому є дані для "інтервалів кидок" і презентація посилається на монографію Керріха, де він опублікував свої результати. Я не знаю, чи опублікував Керріх свій список кожного окремого жеребкування. Зрозуміло, що це принаймні корисніше, ніж просто загальна частка.

@whuber: так, на таку монографію згадувались у презентації. схоже, обмежена доступність. хтось знайшов pdf?

2

У книзі "Шанси зустрічаються: перший курс з аналізу даних та висновку" Кріса Уайлда та Джорджа Себера є ще одне посилання Керріха, яке в главі 4 (можна завантажити доповнення з цієї сторінки ) говорить про те, що дані публікуються в Керріху [1964] та Фрідман [1991, табл. 1, с. 248]. Книга Керріха - це, мабуть, експериментальний вступ до теорії ймовірності , а Фрідман - той самий підручник, про який вже говорилося. Я сумніваюся, що монографія 1964 року міститиме більше даних, ніж одна 1946 року.


2

Цю книгу Керріха можна придбати у Amazon, але ціна, що котирується, досить жорстка!

Кращий варіант - https://openlibrary.org. Тут
потрібно зробити обліковий запис, а потім встановити Adobe Digital Editions для читання книги. (схоже, що жодна інша програма не зробить, завантажена книга має DRM, управління цифровими обмеженнями). Потім ви можете завантажити ("позичити") книгу. Я читаю це саме зараз. Я думаю, що я можу взяти на екрані копію сторінок із результатами та використати ocr для цього. На потім ...

(Ні, я швидко пройшов книгу, здається, що тільки перші 2000 закидів даються окремо, але є багато різноманітних таблиць із підсумками кидків. Також є таблиці для деяких інших експериментів, наприклад, малювання куль із урни , у тому ж дусі.


3
Не ясно, чи помітили ви, що перші 2000 індивідуальних результатів вже доступні в цій темі у відповідь Білла Бредлі . Книга з’являється в книгах Google; Я надав посилання в іншому коментарі . В даний час Google посилається на інших продавців книг, крім Amazon, де котирувана ціна (включаючи доставку) значно дешевша.
whuber

Дякую, я відзначив 2000 балів, які були доступні вище, але сподівався, що зможу знайти більше у самій книзі. Здається, ні. Я не в змозі читати книгу через книги Google, можливо, цей доступ залежить від географії? До речі, зараз я повернув свою позику з відкритої бібліотеки, тож інші можуть спробувати ...
kjetil b halvorsen

1
Я намагався те ж саме, коли з’явився цей потік, з однаковими негативними результатами. :-( Я не мав на увазі інтиму, що ми можемо насправді читати версію в книгах Google: це лише такий тип пошуку. Головне значення ГБ (принаймні до зміни політики Google) полягає у наданні посилань на місця, де ми можемо придбати її.
whuber

1

Я натрапив на це, роблячи деякі фонові дослідження Керріха. Я взяв дані з відповіді Білла Бредлі - дуже ціную, що дані були оцифровані! Я додав дані до пакету R, який використовую для викладання, який доступний на GitHub .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.