Висновок "важкий" для 'посередині, тому що зразок з поблизу середини відповідає більш широкому діапазону . Близько кінців не може бути так далеко - тому що кінці є "бар'єрами", за якими не може вийти.рpp^рpp
Я думаю, що інтуїція простіша, якщо дивитися на дисперсію.
Інтуїція про величину дисперсії двочлена в середині та невеликої на кінцях є досить простою: біля кінцевих точок немає місця для "розповсюдження" даних. Розглянемо малий - оскільки середнє значення близьке до 0, варіація не може бути великою - для даних до середнього це може бути лише далеко від середнього.рpp
Розглянемо дисперсію пропорційної вибірки в серії випробувань Бернуллі. Тут . Таким чином, тримаючи фіксованих і змінюючи , варіація значно менша для поблизу 0:п р рVar(p^)=p(1−p)/nnpp
Частка вибірки у двочленних зразках - тут просто випадкова рівномірна; у блакитному корпусі є середнє значення 0,03, у чорному - 0,5 (додається трохи тремтіння, щоб точки не накопичувалися занадто багато і втрачали деталі)
y
Відповідні функції ймовірності:
У кожному випадку зверніть увагу на лінії, що позначають середню. Оскільки середня лінія стає більше "застрягла" проти бар'єру, точки нижче середньої можна отримати лише невеликим шляхом внизу.
Як результат, точки вище середньої величини зазвичай не можуть надто далеко над середньою (бо в іншому випадку середня зміститься!). Біля кінцеві точки насправді не "підштовхують" так, як це відбувається, коли є бар'єр.p=12
Ми одночасно бачимо, чому розподіл повинен бути перекошений на кінцях; щоб випадкова величина була деякою частиною часу більше, ніж вище середньої, повинно бути відповідно більше ймовірності, що знижується приблизно на середній, наскільки це може піти. Цей навісний бар'єр при 0 дає як обмеження змінності, так і призводить до косості. рp^p
[Ця форма інтуїції не говорить про те, чому вона приймає саме таку функціональну форму, але це чітко дає зрозуміти, чому дисперсія повинна бути невеликою біля кінців, а менше бути ближче до кінців, на які ви йдете.]