Оскільки питання можна інтерпретувати багатостороннім способом, я розділю цю відповідь на дві частини.
- A: сім'ї розподілу.
- B: сімейства розподілу в масштабі локації.
Проблему з випадком A можна легко відповісти / продемонструвати багатьма сім'ями з параметром форми.
Проблема з випадком B складніше, оскільки півтора параметрів здається достатнім для визначення місця та масштабу (розташування в та масштабування в ), і проблема стає чи два параметри також можуть бути використані для кодування (декількох) фігур. Це не так банально. Ми можемо легко придумати конкретні двома сімействами шкали розташування параметрів і продемонструвати, що у вас немає різних форм, але це не підтверджує, що це фіксоване правило для будь-якого сімейства шкал розташування двох параметрів.RR>0
Відповідь: Чи можуть два різні розподіли з одного і того ж сімейства розподілів 2-х параметрів однакові середні та дисперсійні?
Відповідь - так, і це вже можна показати, використовуючи один із чітко згаданих прикладів: нормалізований розподіл гамми
Сімейство нормалізованих гамма-розподілів
Нехай з a розподіленою змінною Gamma. (Кумулятивний) розподіл наведено нижче:Z=X−μσXZ
FZ(z;k)={01Γ(k)γ(k,zk−−√+k)ififz<−k−−√z≥−k−−√
де - неповна гамма-функція.γ
Тож тут явно випадок, що різні та (розподіли з сімейства нормалізованих гамма-розподілів) можуть мати однакове середнє значення та дисперсію (а саме та ), але відрізнятися залежно від параметра (часто позначається параметр "форма"). Це тісно пов’язано з тим, що сімейство гамма-розподілів не є сім’єю за місцем розташування.Z1Z2μ=0σ=1k
В: Чи можуть два різні розподіли з однієї сімейства розподілу 2-х параметрів розташування параметрів мати однакове середнє значення та дисперсію?
Я вважаю, що відповідь - ні, якщо ми розглянемо лише гладкі сімейства (гладкі: невелика зміна параметрів призведе до невеликої зміни розподілу / функції / кривої). Але ця відповідь не настільки тривіальна, і коли ми використовуємо більш загальні (негладкі) сім’ї, тоді ми можемо сказати « так» , хоча ці сім’ї існують лише в теорії і не мають практичної актуальності.
Створення сім'ї масштабу локації з одного розподілу шляхом перекладу та масштабування
З будь-якого окремого розподілу ми можемо генерувати сімейство масштабів локації за допомогою перекладу та масштабування. Якщо - функція густини ймовірності одного розподілу, то функцією густини ймовірностей для члена сім'ї будеf(x)
f(x;μ,σ)=1σf(x−μσ)
Для сім'ї масштабу локації, яка може бути створена таким чином, ми маємо:
- для будь-яких двох членів та якщо їхні значення та відхилення рівні, тодіf(x;μ1,σ1)f(x;μ2,σ2)f(x;μ1,σ1)=f(x;μ2,σ2)
Чи може для всіх двох сімей з параметрами розташування їх розподіл членів генеруватися з розподілу одного члена шляхом перекладу та масштабування?
Таким чином, переклад та масштабування можуть перетворити один розподіл у сімейство масштабів місцеположення. Питання полягає в тому, чи відповідає зворотній зв'язок і чи кожне два параметри сімейства масштабів розташування параметрів (де параметри та не обов'язково повинні збігатися з розташуванням та масштаб ) можна описати перекладом та масштабуванням з одного члена з цієї сім'ї.θ1θ2μσ
Зокрема, для двох сімейств розміщення параметрів, таких як сімейство звичайних розподілів, не надто складно показати, що вони можуть бути згенеровані відповідно до вищевказаного процесу (масштабування та переклад єдиного прикладного члена).
Можна задатися питанням, чи можливо для кожної двох сімейств параметрів місцеположення генеруватися з одного члена шляхом перекладу та масштабування. Або суперечливе твердження: "Чи може сім'я з двома параметрами розміщення розташування містити два розподіли різних членів з однаковим середнім значенням та дисперсією?", Для чого було б необхідно, щоб сім'я являла собою об'єднання декількох підсемейств, кожне з яких генерується перекладом та масштабування.
Випадок 1: Родина узагальнених t-розподілів учнів, параметризованих двома змінними
Надуманий приклад виникає, коли ми робимо деяке відображення з в ( кардинальність-mathbbr-і-mathbbr2 ), що дозволяє свободі використовувати два параметри і для опису об'єднання декількох підсімей, які є згенерований перекладом та масштабуванням.R2R3θ1θ2
Скористаємось узагальненим т-розподілом Стьюдента (три параметри):
f(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πν√σ(1+1ν(x−μσ)2)−ν+12
з трьома параметрами, зміненими наступним чином
μσν===tan(θ1)θ2⌊0.5+θ1/π⌋
то ми маємо
f(x;θ1,θ2)=Γ(⌊0.5+θ1/π⌋+12)Γ(⌊0.5+θ1/π⌋2)π⌊0.5+θ1/π⌋√θ2(1+1⌊0.5+θ1/π⌋(x−tan(θ1)θ2)2)−⌊0.5+θ1/π⌋+12
що може вважатися двома параметрами сімейства масштабів розташування (хоч і не дуже корисно), які не можуть бути сформовані за допомогою перекладу та масштабування лише одного члена.
Випадок 2: Сімейства масштабних локацій, породжені негативним масштабуванням одного розподілу за допомогою ненульового перекосу
Менш надуманий приклад, ніж використання цієї загар-функції, надає Вюбер під коментарями відповіді Карла. У нас може бути сім'я де гортання знаку зберігає середнє значення та відхилення незмінними, але, можливо, змінюючи нерівні вищі моменти. Таким чином, це дає трохи легше сімейство з двома параметрами розміщення розташування, де члени з однаковим середнім рівнем та дисперсією можуть мати різні моменти вищого порядку. Цей приклад від Whuber можна розділити на дві підродини, кожна з яких може бути створена з одного члена шляхом перекладу та масштабування.x↦f(x/b+a)b
Гладкі сім’ї
Якщо ми спробуємо зробити єдине плавне сімейство розподілу двох параметрів (гладке: невелика зміна параметрів призведе до невеликої зміни розподілу / функції / кривої), якось створивши композицію з двох або більше сімей, що генеруються перекладом і масштабування, тоді ми стикаємося з проблемами, щоб два параметри охоплювали як варіацію "середнє" та "дисперсію", так і третій параметр "форму". Формальний доказ повинен мати ті ж самі лінії, що й відповідь на запитання: чи є гладка сюжективна функція ? f:R2↦R3(де відповідь є ні у випадку гладких , тобто нескінченно диференційованих, функцій, хоча вони є безперервними функції, які виконали б роботу, наприклад криві Пеано).
Інтуїція: Уявіть, що існують деякі параметри , які описують розподіли в деяких сімействах розподілу в масштабі локації, і за допомогою яких ми можемо змінити середнє значення та дисперсію , а також деякі інші моменти, тоді ми повинні мати можливість виразити , в перерахунку на середню та дисперсіюθ1θ2θ1θ2μσ
θ1θ2==fθ1(μ,σ)fθ2(μ,σ)
але вони повинні бути багатозначними функціями, і вони не можуть здійснювати безперервні переходи, різні значення від для конкретних та не є безперервними, і вони не зможуть моделюють параметр безперервної форми.fθ1(μ,σ)μσ
Я насправді не дуже впевнений у цій заключній частині. Ми могли б використовувати криву заповнення простору (наприклад, криву Пеано, якби тільки ми знали, як виразити координати на кривій до координат гіперкуба), щоб мати єдиний параметр повністю моделювати кілька функцій, таких як середнє значення та дисперсія, без відмова від властивості, що невелика зміна параметра еквівалентна невеликій зміні функції при кожномуθ1θ1f(x;θ1)x