Я намагаюся придумати метрику для вимірювання нерівномірності розподілу для експерименту, який я виконую. У мене є випадкова змінна, яка повинна бути рівномірно розподілена в більшості випадків, і я хотів би мати можливість визначити (і, можливо, виміряти ступінь) прикладів наборів даних, де змінна не рівномірно розподілена в межах деякої межі.
Приклад трьох серій даних, кожен з 10 вимірювань, що представляють частоту виникнення чогось, що я вимірюю, може бути приблизно таким:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
Я хотів би мати можливість відрізняти розподіли на зразок c від таких, як a і b, і вимірювати відхилення c від рівномірного розподілу. Окрім того, якщо є показник того, наскільки рівномірний розподіл (стд. Відхилення, близьке до нуля?), Я, можливо, можу використовувати його для розрізнення з великою дисперсією. Однак у моїх даних може бути лише одна або дві люди, що переживають, як на прикладі c вище, і я не впевнений, що це буде легко виявити таким чином.
Я можу щось зламати, щоб це зробити в програмному забезпеченні, але шукаю статистичні методи / підходи, щоб виправдати це формально. Я брав заняття років тому, але статистика - це не моя область. Це здається чимось, що повинно мати відомий підхід. Вибачте, якщо що-небудь із цього повністю кісткове. Спасибі заздалегідь!