Деякі питання щодо статистичної випадковості


15

Зі статистичної випадковості Вікіпедії :

Глобальна випадковість та локальна випадковість різні. Більшість філософських концепцій випадковості є глобальними, оскільки вони ґрунтуються на ідеї, що "з часом" послідовність виглядає справді випадковою, навіть якщо певні підрядки не виглядають випадковими. Наприклад, у "справді" випадковій послідовності чисел достатньої довжини, ймовірно, були б довгі послідовності нічого, крім нулів, хоча в цілому послідовність може бути випадковою. Локальна випадковість стосується ідеї про те, що можуть бути мінімальні довжини послідовностей, в яких наближені випадкові розподіли.Довгі розтяжки одних і тих же цифр, навіть ті, що породжуються "справді" випадковими процесами, зменшать "локальну випадковість" вибірки (це може бути лише локально випадковою для послідовностей 10000 цифр; якщо послідовності менше 1000 можуть не здаватися випадковими взагалі, наприклад).

Таким чином, послідовність, що демонструє візерунок, не є статистично випадковою. Відповідно до принципів теорії Рамзі, досить великі об'єкти обов'язково повинні містити задану підструктуру ("повний розлад неможливий").

Я не зовсім розумію значення двох речень жирним шрифтом.

  1. Чи означає перше речення, що щось робить послідовність локальною випадковою на більшій довжині, а не локальною випадковою на меншій довжині?

    Як працює приклад усередині дужок?

  2. Чи означає друге речення, що послідовність, що демонструє візерунок, не може бути доведена статистично випадковою? Чому?

Спасибі


1
Гарне питання. Я вважаю цей текст трохи збентежуючим себе. Я б міг подумати, що будь-яка послідовність є випадковою чи ні - це пов'язана з тим, як вона генерується; не те, що результат. Я підозрюю, що тут є мовна проблема - для мене випадкова означає, як вона породжена; для здорового глузду (а можливо, менш чітко мислячих філософів?) йдеться про щось, що видається невпорядкованим?
Пітер Елліс

3
@ Петер, у вас може виникнути складний час навіть з визначенням випадковості, якби ви могли посилатися лише на механізм генерації. Зрештою, оскільки вся корисність випадкових послідовностей полягає в числах, які вони містять - а не в тому, як ці числа були отримані - повинен бути спосіб визначити і перевірити випадковість виключно з точки зору послідовностей, ви не думаєте?
whuber

1
Звичайно, я згоден, ви можете перевірити випадковість за її результатами - на правдоподібність випадковості, не прагнучи до доказу цього. Напевно, мені потрібно ще трохи почитати і подумати над філософськими викликами визначення, що ґрунтується на поколінні.
Пітер Елліс

Я думаю, що випадковість - це просто синонім невідомого. Я теж вважаю це речення bizzare
ймовірністьлогічний

Відповіді:


15

Концепцію можна акуратно проілюструвати деяким виконавчим кодом. Ми починаємо (в R), використовуючи хороший псевдогенератор випадкових чисел, щоб створити послідовність 10000 нулів і одиниць:

set.seed(17)
x <- floor(runif(10000, min=0, max=2))

Це проходить кілька основних тестів на випадкові числа. Наприклад, Т-тест для порівняння середнього до 1/2 має р-значення %, що дозволяє прийняти гіпотезу про те , що нулі і одиниці равновероятно.40.09

З цих чисел ми переходимо до отримання підрядки послідовних значень, починаючи з 5081-го значення:1000

x0 <- x[1:1000 + 5080]

Якщо вони виглядатимуть випадково, вони також повинні пройти те саме тестування випадкових чисел. Наприклад, давайте перевіримо, чи є їх середнє значення 1/2:

> t.test(x0-1/2)

    One Sample t-test

data:  x0 - 1/2 
t = 2.6005, df = 999, p-value = 0.009445
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval:
 0.01006167 0.07193833 
sample estimates:
mean of x 
    0.041 

Низьке значення р (менше 1%) наводить на думку , середнє значно більше , ніж . Дійсно, сукупна сума цієї сукупності має сильну тенденцію до зростання:1/2

> plot(cumsum(x0-1/2))

Випадкова прогулянка?

Це не випадкова поведінка!

Порівнюючи початкову послідовність (побудовану у вигляді кумулятивної суми) з цією послідовністю, виявляється, що відбувається:

Випадкова прогулянка

9000


Як показали ці прості аналізи, жоден тест не може "довести", що послідовність виявляється випадковою. Все, що ми можемо зробити, - це перевірити, чи послідовності відхиляються достатньо від поведінки, що очікується від випадкових послідовностей, щоб запропонувати докази того, що вони не є випадковими. Ось так працюють батареї тестів з випадковими числами : вони шукають шаблони, які малоймовірно виникають у послідовностях випадкових чисел. Кожен раз у довгий час вони змусять нас зробити висновок, що справді випадкова послідовність чисел не видається випадковою: ми відкинемо її, спробуючи щось інше.

Зрештою, так само - як ми всі мертві - будь-який по-справжньому генератор випадкових чисел генерує кожну можливу послідовність з 1000 цифр, і це буде робити нескінченно багато разів. Що нас врятує від логічної катастрофи - це те, що нам доведеться чекати жахливо довгий час, щоб відбулася така явна аберація.


Спасибі! Пов'язане питання: під час тестування випадковості псевдовипадкових чисел, породжених деякими методами, чи означає випадковість рівномірний розподіл? Іншими словами, чи перевіряє випадковість лише тестування рівномірних розподілів? Я запитав це, тому що ті більш упереджені розподіли здаються мені інтуїтивно менш випадковими.
Тім

@Tim: ні, існує багато загальних тестів на випадковість Гаусса, і слід створити тести для будь-якого розподілу.
naught101

1
[0,1)

2
Я майже можу "подивитися" у верхній частині відповіді і сказати "Whuber" :) Дуже приємно!
Кандидат наук

2

Цей уривок використовує терміни "локальна випадковість" та "глобальна випадковість" для розрізнення того, що може статися з кінцевою кількістю вибірок випадкової величини, та розподілу ймовірності чи очікування випадкової величини.

хi{0,1}θθlimн1нi=1нхi=θ

[0,1][а,б]0а<б1θ .

Тут нічого нового.

н , тим більше шансів на те, що поведінка виглядає "локально випадковою", а "локально випадкова" визначена (неправильно) як проявляє шаблони, близькі до середнього ( у цьому прикладі.)

Таким чином, я б не спалив надто багато клітин мозку, думаючи про цей уривок. Математично це не так точно і насправді вводить в оману характер випадковості.

Редагувати на основі коментаря: @kjetilbhalvorsen +1 до вашого коментаря для історичних знань. Однак я все-таки вважаю, що значення цих термінів є обмеженим та оманливим. Таблиці, які ви описуєте, здаються, що вводять в оману наслідки, що невеликі зразки, які, наприклад, вибірки, означають далеко від фактичного очікуваного значення або, можливо, малоймовірну, але, безумовно, можливу довгу послідовність повторень 0 (на моєму прикладі Бернуллі), якимось чином виявляють менша випадковість (кажучи, що вони не виявляють цієї фальшивої "локальної випадковості"). Я не можу придумати що-небудь більш оманливого для статиста-початківця!


Хоча "глобальна випадковість" виявляється ідіосинкратичною, "локальна випадковість" має принаймні 20-річну історію. Наприклад , див. Isiweb.ee.ethz.ch/papers/arch/umaure-mass-inspec-1991-1.pdf .
whuber

нн

2
Пам’ятаю, я читав іноді таке: У часи, коли люди публікували книги із таблицями «випадкових чисел», які використовувались для моделювання, експериментів тощо, деякі з них позначали частини таблиць як придатні для використання в невеликих моделюваннях (демонструючи «місцеві випадковість ") та інші частини, які слід використовувати лише для більш великих моделей (демонструючи" глобальну випадковість "). Отже, поняття, схоже, вказують на щось цінне!
kjetil b halvorsen

1
Вибачте, я не можу пригадати, де я це прочитав. Але це майже очевидно: зовсім крім філософських проблем у визначенні випадковості. Якщо у вас дуже малі симуляції, коли вам потрібно 1000 випадкових чисел, а ваш високоякісний випадковий генератор дає вам 1000 нулів, ¿Що ви робите? Незважаючи на те, що подібні випадки можливі і дійсно необхідні в "справді випадковій" послідовності, ваше моделювання руйнується!
kjetil b halvorsen

1
Спасибі, хлопці, я був, мабуть, занадто суворий у своєму осуді. Я трохи зміню мову цього.
Кріс А.

-1

Я думаю, що автори поста у Вікіпедії неправильно трактують випадковість. Так, можуть бути розтяжки, які здаються не випадковими, але якщо процес, який створив послідовність, справді випадковий, таким повинен бути вихід. Якщо певні послідовності виявляються невипадковими, це читач помилково сприймає (тобто люди призначені для пошуку шаблонів). Наша здатність бачити на нічному небі Велику Ковшану та Оріона тощо не свідчить про те, що візерунки зірок не випадкові. Я згоден, що випадковість часто виявляється не випадковою. Якщо процес генерує справді не випадкові шаблони для коротких послідовностей, це не випадковий процес.

Я не думаю, що процес змінюється в різних розмірах вибірки. Ви збільшуєте розмір вибірки, збільшуєте ймовірність того, що ми бачимо випадкову послідовність, яка нам здається не випадковою. Якщо є 10% шансів, що ми побачимо закономірність у 20 випадкових спостереженнях, збільшення загальної кількості спостережень до 10000 збільшило б ймовірність того, що ми десь побачимо не випадковість.


2
"Якщо процес генерує справді не випадкові шаблони для коротких послідовностей, це не випадковий процес", боюся, абсолютно невірний. Наприклад, у будь-яких 100 переворотах справедливої ​​монети ми очікували б спостерігати шість голов або шість хвостів поспіль - і це "справді не випадковий зразок для [короткої послідовності]" майже будь-яким значенням "випадкового". " Я підозрюю, що ти мав намір написати щось, що потрібно більш ретельно кваліфікувати, наприклад, застосувати "все" до "коротких послідовностей".
whuber

Дійсно? Я б подумав, що оскільки очікуємо побачити струни головок хвостів від генератора випадкових чисел, то, коли ми це бачимо, ми не повинні дивуватися. Чому вважають це невипадковим? Якби у кого був генератор чисел, який робив 100 обертів, і він цілеспрямовано уникав 4 або більше головок чи хвостів поспіль, це виглядало б більш випадково, ніж справді випадковий процес, але насправді це було б не випадково. Наївним поглядом на випадковість є відсутність усіх моделей - але це було б не випадково.
P auritus

Ваш коментар правильний, але висловлювання у вашій відповіді є незрозумілим і навіть суперечливим у цьому питанні. Подумайте більш точно пояснити, що ви маєте на увазі, наприклад, генеруючи «справді не випадкові шаблони для коротких послідовностей», або що означає «бачити не випадковість».
whuber

Я не бачу суперечності. Ви, здається, думаєте, що випадкові генератори створюють не випадкові зразки. Це суперечність. Ви стверджуєте, що справді випадкові процеси будуть генерувати не випадкові спостереження. Те, що ви описуєте, - це дещо, що називається "ілюзією кластеризації", що є тенденцією до неправильного сприйняття кластерів від випадкових розподілів. Я тільки говорю, що якщо процес створює не випадкові спостереження, то це не є випадковим. Ви стверджуєте, що ви очікуєте випадкового процесу для створення рядків не випадкових спостережень, але ви називаєте це не випадковим. Класичний приклад Апофенії.
P auritus

1
Важко вести розмову із співрозмовником, який неправильно ставиться до своєї позиції, тому я схиляюся від цього. Вибачте.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.