Передумови та термінологія
Щоб бути абсолютно зрозумілим, що ми обговорюємо, давайте встановимо деякі поняття та термінологію. Приємною моделлю пропорцій є двійкова урна: вона містить кулі, пофарбовані або сріблястими («успіх»), або фуксія («невдача»). Частка срібних кульок в урні дорівнює (але це не та «пропорція», про яку ми будемо говорити). p
Ця урна забезпечує спосіб моделювання судового процесу Бернуллі . Щоб отримати одну реалізацію, ретельно перемішайте кульки і сліпо намалюйте одну, спостерігаючи за її кольором. Для отримання додаткових реалізацій спочатку відновіть коробку, повернувши намальований кульку, після чого повторіть процедуру заздалегідь задану кількість разів. Послідовність реалізацій можуть бути зведені на число його успіхи, . Це випадкова величина, властивості якої повністю визначаються і . Розподіл називається двочленним розподілом. Пропорція (експериментальна, або "вибіркова") - це відношенняnXnpX(n,p)X/n.
Ці цифри є бароклами розподілу ймовірностей для різних біноміальних пропорцій . Найбільш примітною є послідовна закономірність, незалежно від , в якій розподіли стають вужчими (а смуги відповідно вище), коли рухається від вниз.X/nnp1/2
Стандартне відхилення - це стандартна похибка пропорції, згадана у питанні. Для будь-якого даного ця кількість може залежати лише від . Назвемо це . Перемикаючи ролі кульок - називайте сріблясті «невдачами», а фуксії - «успіхами» - легко зрозуміти, що . Таким чином, ситуація, коли - це, має бути особливою. Питання стосується того, як змінюється, коли відходить від до більш екстремального значення, такого якX/nnpse(p)se(p)=se(1−p)p=1−pp=1/2se(p)p1/20.
Знання проти розуміння
Оскільки всім було показано подібні цифри на початку навчання, всі "знають" ширину ділянок - які вимірюються повинні зменшуватися, коли відходить від . Але це знання - це просто досвід, тоді як питання шукає глибшого розуміння. Таке розуміння можна отримати з ретельного аналізу біноміальних розподілів, таких як Авраам де Мойвр, який здійснив близько 300 років тому. (Вони були схожі по духу з тими, які я представив під час обговорення теореми про центральну межу .) Я думаю, що, можливо, досить порівняно простих міркувань, щоб зробити висновок про те, що ширина повинна бути найширшою біля .se(p)p1/2p=1/2
Простий інтуїтивний аналіз
Зрозуміло, що слід очікувати, що частка успіхів в експерименті буде близькою до . Стандартна помилка стосується того, наскільки далеко від цього очікування ми можемо обгрунтовано припустити, що дійсний результат буде лежати. Припустимо, без втрати загальності, що становить від до , що потрібно для збільшення від ? Як правило, навколо куль, намальованих в експерименті, були сріблясті і (отже) навколо були фуксія. Щоб отримати більше срібних куль, деякі з цихpX/np01/2X/nppn(1−p)npnРезультати фуксії мали бути різними. Наскільки ймовірно, що шанс може діяти таким чином? Очевидна відповідь полягає в тому, що коли невеликий, ми ніколи не дуже вірогідно будемо малювати срібну кулю. Таким чином, наші шанси намалювати срібні кульки замість фуксії завжди низькі. Ми можемо з розумом сподіватися, що за чистої удачі пропорція результатів фуксії могла б відрізнятися, але здається, що набагато більше, ніж це, змінилося б. Таким чином, правдоподібно, що не змінюватиметься набагато більше, ніж . В еквіваленті не змінюватиметься набагато більше, ніж .ppXp×(1−p)nX/np(1−p)n/n=p(1−p)
розв'язка
Таким чином виявляється магічне поєднання . p(1−p) Це практично вирішує питання: очевидно, що ця величина досягає і зменшується до нуля при або . Це дає інтуїтивне, але кількісне обґрунтування тверджень про те, що "одна крайність є більш обмежуючою, ніж інша", або інші подібні зусилля для опису того, що ми знаємо.p=1/2p=0p=1
Тим НЕ менше, не зовсім правильне значення: воно лише вказує шлях, кажучи нам , скільки повинно мати значення для оцінки поширення . Ми проігнорували той факт, що везіння також має тенденцію діяти проти нас: так само, як деякі кульки фуксії могли бути срібними, деякі з срібних куль могли бути і фуксіями. Облік всіх можливостей строго може ускладнитися, але результат в тому , що замість того , щоб використовувати як розумна межа на скільки може відхилятися від очікування , для обліку всіх можливих результатів правильно , ми маємо взяти квадратний коріньp(1−p)Xp(1−p)nXpn p(1−p)n−−−−−−−−√. (Для більш ретельного пояснення того, чому, будь ласка, відвідайте ( https://stats.stackexchange.com/a/3904 .) Розділившись на , ми дізнаємось, що випадкові зміни самої пропорції повинні бути в порядку що є стандартною помилкою .nX/np(1−p)n−−−−−−−−√/n=p(1−p)n−−−−−√,X/n