В оригінальній публікації пропущено пару основних моментів: (1) Жодні "дані" ніколи не можуть бути нормально розповсюджені. Дані обов'язково дискретні. Важливим питанням є: "це процес, який видав дані, як правило, розподілений процес?" Але (2) відповідь на друге питання завжди є "ні", незалежно від того, що дає вам будь-який статистичний тест чи інша оцінка на основі даних. Зазвичай розподілені процеси дають дані з нескінченною безперервністю, досконалою симетрією та точно заданими ймовірностями в межах стандартних діапазонів відхилень (наприклад, 68-95-99.7), жоден з яких ніколи точно не відповідає дійсності процесів, які дають підстави для даних, які ми можемо виміряти будь-якими вимірювальний прилад, який ми можемо використовувати люди.
Таким чином, ви ніколи не можете вважати дані звичайно розповсюдженими, і ви ніколи не можете вважати процес, який виробляв дані, точно нормально розподіленим процесом. Але, як зазначив Glen_b, це може не мати великого значення, залежно від того, що ви намагаєтеся зробити з даними.
Статистика скутості та куртозу може допомогти вам оцінити певні види відхилень від нормальності вашого процесу генерування даних. Однак вони є дуже змінною статистикою. Стандартні помилки, наведені вище, не є корисними, оскільки вони дійсні лише за нормальності, а це означає, що вони корисні лише як перевірка на нормальність, по суті, марна вправа. Було б краще скористатися завантажувальним інструментом, щоб знайти se, хоча великі зразки знадобляться для отримання точних даних.
Також куртоз дуже легко інтерпретувати, всупереч вищенаведеному посту. Це середнє (або очікуване значення) значень Z, кожне прийняте на четверту потужність. Великий | Z | Значення є переживаючими та в значній мірі сприяють куртозу. Малий | Z | Значення, де "пік" розподілу, дають значення Z ^ 4, які є крихітними і не сприяють суттєво куртозу. У своїй статті https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/ я довів, що куртоз дуже добре оцінюється середнім значенням Z ^ 4 * I (| Z |> 1). Отже, куртоз вимірює схильність процесу генерування даних для отримання інших людей.