Чому працює корекція безперервності (скажімо, нормальне наближення до біноміального розподілу)?


24

Я хотів би краще зрозуміти, як виведена корекція безперервності до біноміального розподілу для нормального наближення.

Який метод був використаний, щоб вирішити, що ми повинні додати 1/2 (чому б не інше число?). Будемо вдячні за будь-яке пояснення (або посилання на запропоноване читання, крім цього ).

Відповіді:


29
  1. Насправді це не завжди "працює" (у сенсі завжди поліпшується наближення двочленного cdf нормальним при будь-якому ). Якщо двочлен дорівнює 0,5, я думаю, що це завжди допомагає, за винятком, можливо, самого крайнього хвоста. Якщо не надто далеко від 0,5, для досить великих він, як правило, працює дуже добре, за винятком дальнього хвоста, але якщо близько 0 або 1, це може зовсім не допомогти (див. Пункт 6. нижче)xppnp

  2. Варто пам’ятати (незважаючи на ілюстрації, які майже завжди включають pmfs та pdfs), - це те, що ми намагаємось наблизити - це cdf. Це може бути корисно задуматися про те, що відбувається з cdf двочленного і приблизного нормального (наприклад, ось ):n=20,p=0.5

    введіть тут опис зображення

    У межах обмеження cdf стандартизованого двочлена перейде до стандартного нормального (зауважте, що стандартизація впливає на масштаб на осі x, але не на вісь y); по дорозі до все більших стрибків біноміального cdf, як правило, рівномірніше стримують звичайний cdf.n

    Давайте збільшимо масштаб і розглянемо це на наведеному вище простому прикладі:

    введіть тут опис зображення

    Зауважте, що оскільки наближається нормальний проходить близько до середини вертикальних стрибків *, тоді як у межі нормальний cdf локально приблизно лінійний і (як прогресування двочленного cdf у верхній частині кожного стрибка); в результаті cdf має тенденцію до перетину горизонтальних сходів поблизу . Якщо ви хочете наблизити значення біноміального cdf, у цілому , нормальний cdf досягає цієї висоти поблизу . F(x)xx+1x+12F(x)xx+12

    * Якщо ми застосуємо Berry-Esseen до змінених Bernoulli змінних, межі Berry-Esseen дозволяють отримати дуже мало місця для хитання, коли знаходиться поблизу і є поблизу - нормальний cdf повинен проходити досить близько до середини стрибки туди, тому що в іншому випадку абсолютна різниця в cdfs перевищить кращий Berry-Essen, пов'язаний з тієї чи іншої сторони. Це, у свою чергу, стосується того, наскільки далеко від звичайний cdf може перетинати горизонтальну частину крокової функції двочленного cdf.1p xμx+112xμx+12

  3. Розширюючи мотивацію, що в 1. розглянемо, як ми використали нормальне наближення до двочленного cdf для опрацювання . Наприклад (див. Другу схему вище). Отже наш нормальний з тим же середнім і sd - . Зауважимо, що ми могли б наблизити стрибок у форматі cdf у 9 шляхом зміни нормального cdf між приблизно 8,5 та 9,5.n = 20 , p = 0,5 , k = 9 N ( 10 , ( P(X=k)n=20,p=0.5,k=9N(10,(5)2)

введіть тут опис зображення

  1. Роблячи те ж саме за менш формальної, але більш "звичайної" мотивації підручника (що, мабуть, більш інтуїтивно зрозуміло, особливо для початківців учнів), ми намагаємось наблизити дискретну змінну до суцільної. Ми можемо зробити безперервну версію двочлена, замінивши кожен шип вірогідності висоти на прямокутник шириною 1, центрований на , надаючи йому висоту (див. Синій прямокутник внизу; уявіть собі по одному для кожного x- значення), а потім наближаючи його до нормальної щільності з тим же середнім значенням і sd, що і вихідний двочлен:x p ( x )p(x)xp(x)

    ! [введіть тут опис зображення

    Площа під полем приблизна до норми між та ; дві майже трикутні частини, що лежать над горизонтальним кроком і під ним, розташовані близько одна від одної. Деяка сума біноміальних ймовірностей в інтервалі скоротиться до набору цих наближень. (Намалювання такої діаграми часто дуже корисно, якщо миттєво не зрозуміло, чи потрібно вам піднятись на 0,5 на певний розрахунок на 0,5). Опрацюйте, які біноміальні значення ви хочете у своєму обчисленні, і підете в будь-яку сторону для кожен.)x12x+1212

    Можна підключити цей підхід алгебраїчно, використовуючи деривацію [по лінії Де Моївра - див. Тут або тут ], щоб отримати нормальне наближення (хоча це може бути виконано дещо прямо, ніж підхід Де Мойвра).

    Це по суті відбувається за допомогою декількох наближень, включаючи використання апроксимації Стірлінга на терміні та використання для отримання цього(nx)log(1+x)xx2/2

    P(X=x)12πnp(1p)exp((xnp)22np(1p))

    що означає, що щільність нормали із середнім та дисперсією при дорівнює висоті двочленного pmf при . Це, по суті, туди, куди потрапив Де Моївр.μ=npσ2=np(1p)xx

    Отже, тепер розглянемо, що у нас є наближення правила середньої точки для нормальних областей з точки зору біноміальних висот ... тобто для , правило середньої точки говорить, що і ми маємо від De що . Перегортаючи це приблизно, .YN(np,np(1p))F(y+12)F(y12)=y12y+12fY(u)dufY(y)fY(x)P(X=x)P(X=x)F(x+12)F(x12)

    [Аналогічне наближення типу "правило середньої точки" може бути використане для мотивації інших таких наближень безперервних pmfs по щільності за допомогою корекції безперервності, але завжди слід бути обережним, щоб звернути увагу на те, де є сенс викликати це наближення]

  2. Історична примітка: виправлення безперервності, здається, відбулося з Августа де Моргана в 1838 році як поліпшення наближення Де Мойвра. Див., Наприклад, Hald (2007) [1]. З опису Гальда, його міркування були узгоджені з пунктом 4. вище (тобто по суті з точки зору спроби наблизити pmf, замінивши шип ймовірності на "блок" шириною 1, орієнтований на значення x).

  3. Ілюстрація ситуації, коли корекція безперервності не допомагає:

    введіть тут опис зображення

    У зліва (де, як і раніше, є двочленним, - нормальне наближення), і так . На праворуч (той самий двочлен, але далі в хвіст) і так - що є сказати, що ігнорувати корекцію безперервності краще, ніж використовувати її в цьому регіоні.XYp(x)FY(x+1FX(x)FY(x+12)FX(x)FY(x)p(x)FY(x)-FY(x-1)p(x)FY(x+12)FY(x12)FX(x)FY(x)p(x)FY(x)FY(x1)

    [1]: Холд, Андерс (2007),
    "Історія параметричного статистичного висновку від Бернуллі до Фішера, 1713-1935",
    Джерела та дослідження історії математики та фізичних наук,
    Спрінгер-Верлаг, Нью-Йорк


1

Я вважаю, що чинник виникає через те, що ми порівнюємо безперервний розподіл з дискретним. Таким чином, нам потрібно перекласти, що означає кожне дискретне значення у безперервному розподілі. Ми можемо вибрати інше значення, однак це може бути незбалансованим щодо заданого цілого числа. (тобто ви зважите ймовірність бути на 6 більше до 7, ніж 5.)

Тут я знайшов корисне посилання: посилання

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.