Відповіді Роберта та Бея дають частину історії (тобто моменти, як правило, розглядаються як основні властивості розподілу, а умовно стандартне відхилення визначається з точки зору другого центрального моменту, а не навпаки), але в тій мірі, в якій ці речі дійсно фундаментальні, залежить частково від того, що ми розуміємо під терміном.
Не було б непереборної проблеми, наприклад, якби наші конвенції пішли іншим шляхом - ніщо не заважає нам умовно визначити якусь іншу послідовність величин замість звичних моментів, скажімо для р = 1 , 2 , 3 , . . . (зауважимо, що μЕ[ ( X- мк )p]1 / ср = 1 , 2 , 3 , . . .мквписується як в послідовність моментів, так і в цей як перший додаток), а потім визначає моменти - і всі способи обчислення по відношенню до моментів - з точки зору них. Зауважимо, що всі ці величини вимірюються в оригінальних одиницях, що є однією перевагою перед моментами (які знаходяться в -й потужності вихідних одиниць і тому їх важче інтерпретувати). Це зробило б стандартне відхилення населення визначеною кількістю та дисперсією, визначеними в його термінах.p
Однак це зробило б такі величини, як функція, що генерує момент (або якась еквівалентна, що стосується нових величин, визначених вище), досить менш "природними", що зробило б дещо незграбніші (але деякі умовності трохи подібні). Є кілька зручних властивостей MGF, які не були б такими зручними, як інакше.
Більш базовим, на мій погляд (але пов'язаним з цим), є те, що існує ряд основних властивостей дисперсії , які зручніше, коли вони записуються як властивості дисперсії, ніж коли записуються як властивості стандартного відхилення (наприклад, дисперсія сум незалежних випадкові змінні - це сума дисперсій).
Ця добавка є властивістю, яку не поділяють інші заходи розсіювання, і вона має ряд важливих наслідків.
[Є аналогічні відносини між іншими кумулянтамі, так що це сенс , в якому ми могли б визначити речі щодо моментів в цілому.]
Усі ці причини, мабуть, є або умовами, або зручністю, але певною мірою це питання точки зору (наприклад, з деяких точок зору моменти є досить важливими величинами, а з інших - це не все так важливо). Можливо, біт "на глибокому рівні" повинен мати на увазі не що інше, як "kjetil" при розробці теорії ".
Я погодився б із думкою kjetil, яку ви порушили у своєму питанні; певною мірою ця відповідь є лише хвилеподібним обговоренням цього.