Біноміальна випадкова величина з випробувань та ймовірністю успіху може приймати більше двох значень. Біноміальна випадкова величина представляє кількість успіхів у цих випробуваннях і може насправді приймати різних значень ( ). Отже, якщо дисперсія цього розподілу більша, ніж очікується, при біноміальних припущеннях (можливо, є зайві нулі, наприклад), це випадок завищення. р Н Н + 1 0 , 1 , 2 , 3 , . . . , NNpNN+10,1,2,3,...,N
Завищена дисперсія не має сенсу для випадкової величини Бернуллі ( )N=1
У контексті кризи логістичної регресії ви можете вважати "невеликий зріз" або групування через вузький діапазон значення прогнозувачем реалізацією біноміального експерименту (можливо, у нас є 10 балів у зрізі з певною кількістю успіхи та невдачі). Незважаючи на те, що ми не маємо по-справжньому декількох випробувань на кожне значення прогнозувача і ми дивимося на пропорції замість необроблених підрахунків, ми все одно очікуємо, що частка кожного з цих "фрагментів" буде близькою до кривої. Якщо ці «зрізи» мають тенденцію бути далеко від кривої, занадто велика мінливість у розподілі. Таким чином, групуючи спостереження, ви створюєте реалізацію біноміальних випадкових величин, а не дивлячись на дані 0/1 окремо.
Приклад нижче - з іншого питання на цьому сайті. Скажімо, блакитні лінії представляють очікувану пропорцію в діапазоні змінних прогнозів. Сині клітини позначають спостережувані випадки (у цьому випадку школи). Це дає графічне зображення того, як може виглядати наддисперсія . Зауважте, що є недоліки інтерпретації комірок графіку нижче, але це дає уявлення про те, як може проявлятися наддисперсія.