Визначення сім'ї розподілу?


14

Чи має сім'я з розподілу інше визначення статистики, ніж в інших дисциплінах?

Взагалі сімейство кривих - це сукупність кривих, кожна з яких задається функцією або параметризацією, в якій змінюється один або кілька параметрів. Такі сім'ї використовуються, наприклад, для характеристики електронних компонентів .

Для статистики сім'я за одним джерелом є результатом зміни параметру форми. Як тоді ми можемо зрозуміти, що гамма-розподіл має параметр форми та масштабу і лише узагальнений розподіл гами має, крім того, параметр розташування? Це робить сімейство результатом зміни параметра розташування? Згідно @whuber, значення сім'ї неявно "Параметризація" сім'ї - це суцільна карта із підмножини ℝ n , із її звичайною топологією, у простір розподілів, зображенням яких є ця сім'я.n

Що, простою мовою, сім'я для статистичних розподілів?

Питання про співвідношення статистичних властивостей розподілів від однієї сім'ї вже породило чимало суперечок щодо іншого питання, тому здається, що варто вивчити сенс.

Що це не обов'язково просте запитання, що виникає завдяки його використанню у фразі експоненціальної сім'ї , яке не має нічого спільного з сімейством кривих, але пов'язане зі зміною форми PDF-дистрибутива шляхом репараметризації не лише параметрів. , а також підміна функцій незалежних випадкових величин.


1
Під фразою "сім'я розподілу" ви маєте на увазі щось інше "сім'я розподілів"? Експоненціальна сім'я - це сім'я розподілів (з певними властивостями), і інтерпретуючи pdf кожного розподілу як криву, вона навіть відповідає сімейству кривих, тому останні пункти здаються заплутаними.
Juho Kokkala

@JuhoKokkala Це здається заплутаним, оскільки значення "сім'ї" залежить від контексту. Наприклад, нормальний розподіл невідомої середньої та відомих дисперсій є в експоненціальній сім'ї. Нормальний розподіл має нескінченну підтримку (,+) , а експоненціальний розподіл має напівнескінченну підтримку [0,+) , тому не існує сімейства кривих експоненціального розподілу, що охоплює діапазон нормалі розповсюдження, вони ніколи не мають однакової форми ...
Карл

@JuhoKokkala ... і експоненціальний PDF навіть не має параметра розташування, тоді як звичайний розподіл не може обійтися без одного. Перегляньте посилання вище про необхідні заміни та контексті, в якому нормальний pdf знаходиться в експонентній родині.
Карл

1
stats.stackexchange.com/questions/129990/… може бути доречним. "нормальний розподіл невідомої середньої та відомих дисперсій у експоненціальній сім'ї", наскільки мені відомо, є зловживання термінологією (хоча дещо поширеною). Якщо бути точним, експоненціальна сім'я - це сім'я розподілів з певними властивостями. Сімейство нормальних розподілів з невідомою середньою та відомою дисперсією - це експоненціальна сім'я; сім'я експоненціальних розподілів - ще одна експоненціальна сім'я тощо.
Юхо Коккала

1
@JuhoKokkala: Таку "сім'ю" так часто (ab) використовують, в особливому випадку, щоб означати "набір сімей", можливо, варто звернути на іншу відповідь. (Я не можу думати про інших випадках - за якою - то причини, здається , немає схильного до розмови про "не-один в розташуванні масштабі сім'ї».)
Scortchi - відновить Моніка

Відповіді:


14

Статистичні та математичні поняття абсолютно однакові, розуміючи, що "сім'я" - це узагальнений математичний термін з технічними варіаціями, адаптованими до різних обставин:

Параметричне сімейство - це крива (або поверхня чи інше її кінцеве розмірне узагальнення) у просторі всіх розподілів.

У решті цієї публікації пояснюється, що це означає. Як осторонь, я не вважаю, що все це є суперечливим ні математично, ні статистично (крім одного другорядного питання, який зазначено нижче). На підтримку цієї думки я надіслав багато посилань (переважно на статті у Вікіпедії).


Ця термінологія "сімей", як правило, використовується при вивченні функцій класів CY на множині Y або "карти". Враховуючи домен X , сімейство F карт на X параметризоване деяким набором Θ ("параметри"), є функцією

F:X×ΘY

для якої (1) для кожного θΘ функція Fθ:XY задана Fθ(x)=F(x,θ) знаходиться вCY а (2)F має певні "приємні" властивості.

Ідея полягає в тому, що ми хочемо змінювати функції від до Y "гладко" або контрольовано. Властивість (1) означає, що кожен θ позначає таку функцію, тоді як деталі властивості (2) будуть охоплювати сенс, в якому "мала" зміна θ викликає досить "малу" зміну F θ .XYθθFθ

Стандартний математичний приклад, близький до зазначеного у питанні, - це гомотопія . У цьому випадку - категорія безперервних карт з топологічних просторів X в топологічний простір Y ; Θ = [ 0 , 1 ] R 0 до F 1CY XYΘ=[0,1]R одиничний інтервал з його звичайною топологією, а також вимагати , щоб бути безперервне відображенням з топологічного твори X × thetas ; в Y . Це можна розглядати як "безперервну деформацію карти FFX×ΘYF0F1 "Коли є самим інтервалом, такі карти є кривими в Y, а гомотопія - плавною деформацією від однієї кривої до іншої.X=[0,1]Y

Для статистичних застосувань - це сукупність усіх розподілів на R (або, на практиці, на R n на деякий n , але для того, щоб експозиція була простою, я зупинюся на n = 1 ). Ми можемо ототожнити його з набором усіх не спадаючих функцій cddlàg R[ 0 , 1CYRRnnn=1 коли закриття їх діапазону включає як 0, так і 1 : це функціїкумулятивного розподілу,або просто функції розподілу. Таким чином, X = R іR[0,1]01X=R .Y=[0,1]

Сімейство розподілів є будь-яка підмножина . CY Інша назва сім'ї - статистична модель. Він складається з усіх розподілів, які, як ми вважаємо, регулюють наші спостереження, але ми інакше не знаємо, який розподіл є фактичним.

  • Сім'я може бути порожньою.
  • сама - сім'я.CY
  • Сім'я може складатися з одного розподілу або просто кінцевої їх кількості.

Ці абстрактні множинно-теоретичні характеристики представляють порівняно мало інтересу або корисності. Це лише тоді, коли ми розглянемо додаткову (відповідну) математичну структуру на , ця концепція стає корисною. Але які властивості C Y представляють статистичний інтерес? Деякі, які часто з’являються:CYCY

  1. -опуклий набір: з огляду на будь-які два розподіли F , G C Y , ми можемо сформуватирозподіл суміші(1-t) F +t GYдля всіхt[0,CYF,GCY (1t)F+tGY . Це свого роду «гомотопних» від F до G .t[0,1]FG

  2. Великі частини Росії підтримують різні псевдометрії, такі якрозбіжність Кулбека-Лейблераабо тісно пов'язану метрику інформації Фішера.CY

  3. має аддитивну структуру: відповідає будь-яким двом розподіламFіGCYFG є їхньою сумою, .FG

  4. підтримує безліч корисних, природних функцій, які часто називають "властивостями". Сюди входять будь-який фіксований квантил (наприклад, медіана), а такожкумулянти.CY

  5. - це підмножинафункціонального простору. Як такий, він успадковує багато корисних показників, таких якнорма суп( L норма), задана | | F-G | | = sup x R | F(x)CYL

    ||FG||=supxR|F(x)G(x)|.
  6. Природні дії групи на індукують дії на C Y . Найпоширенішими діями є переклади T μ : x x + μ та масштабування S σ : x x σ при σ > 0 . Ефект, який вони мають на розподіл, полягає в надсиланні F на розподіл, заданий F μ , σ ( x ) = F ( ( x - μ )RCY Tμ:xx+μ Sσ:xxσσ>0F . Вони призводять до концепцій локальних сімей та їх узагальнення. (Я не надаю посилання, тому що розширений пошук в Інтернеті виявляє безліч різних визначень: тут, принаймні, може виникнути невелика суперечка.)Fμ,σ(x)=F((xμ)/σ)

Властивості, які мають значення, залежать від статистичної проблеми та від того, як ви плануєте аналізувати дані. Розгляд усіх варіацій, запропонованих попередніми характеристиками, зайняв би занадто багато місця для цього середовища. Давайте зупинимося на одному важливому важливому додатку.

Візьмемо, наприклад, максимальну ймовірність. У більшості програм ви хочете використовувати Calculus для отримання оцінки. Щоб це працювало, ви повинні вміти «брати похідні» в сім’ї.

( Технічна сторона: Звичайним способом цього є вибір домену для d 0 та визначення безперервної, локально перевернутої функції p від Θ в C Y. (Це означає, що для кожного θ Θ існує існує куля B ( θ , ϵ ) , при ϵ > 0, для якої p B ( θ , ϵ ) :ΘRdd0pΘCYθΘB(θ,ϵ)ϵ>0 - один на один. Іншими словами, якщо ми змінимо θ на достатньо невеликій кількості, ми завжди отримаємо різний розподіл.))pB(θ,ϵ):B(θ,ϵ)ΘCYθ

Отже, у більшості застосувань для ML вимагаємо, щоб був безперервним (і, сподіваємось, майже скрізь диференційованим) у складі Θ . (Без безперервності максимізація ймовірності, як правило, стає нерозв'язною проблемою.) Це призводить до наступного визначення імовірнісного визначення параметричного сімейства :pΘ

Параметричне сімейство (одновимірних) розподілів - локально обернена карта з Θ R n , для якої (a) кожен F θ є функцією розподілу і (b) для кожного x R , функція L x : θ [ 0 , 1 ], задана L x ( θ ) =

F:R×Θ[0,1],
ΘRnFθxRLx:θ[0,1]Lx(θ)=F(x,θ) є безперервним і майже скрізь диференційованим.

Зауважимо, що параметричне сімейство - це більше, ніж просто збірка F θFFθ : воно також включає конкретний спосіб, у якому значення параметрів відповідають розподілам.θ

Закінчимо кілька ілюстративних прикладів.

  • Нехай - сукупність усіх нормальних розподілів. Як дано, це не параметрична сім'я: це лише сім'я. Щоб бути параметричним, ми повинні вибрати параметризацію. Один із способів - вибрати Θ = { ( μ , σ ) R 2σ > 0 } і зіставити ( μ , σ ) нормальний розподіл із середнім μ та дисперсієюCYΘ={(μ,σ)R2σ>0}(μ,σ)μ .σ2

  • Безліч Пуассона розподілу(λ) є параметричним сімейством з .λΘ=(0,)R1

  • Сукупність уніфікованих розподілів (яка є чіткою у багатьох вправах підручника) є параметричним сімейством з θ R 1 . У цьому випадку F θ ( x ) = max ( 0 , min ( 1 , x - θ ) ) є диференційованим у θ, за винятком θ { x , x - 1 } .(θ,θ+1)θR1Fθ(x)=max(0,min(1,xθ))θθ{x,x1}

  • Нехай і G - будь-які два розподіли. Тоді F ( x , θ ) = ( 1 - θ ) F ( x ) + θ G ( x ) - параметричне сімейство для θ [ 0 , 1 ] . (Доведення: зображення F - це сукупність розподілів і його часткова похідна в θ дорівнює - F ( x ) + G (FGF(x,θ)=(1θ)F(x)+θG(x)θ[0,1]Fθ що визначено скрізь.)F(x)+G(x)

  • Сім'ї Пірсона є чотиривимірний сім'ї, & , яка включає в себе (серед інших) нормального розподілу, бета розподілу і розподілу зворотної гами. Це ілюструє той факт, що будь-який даний розподіл може належати до багатьох різних сімей розподілу . Це цілком аналогічно спостереженню, що будь-яка точка (достатньо великого) простору може належати до багатьох шляхів, які перетинаються там. Це разом із попередньою побудовою показує нам, що жоден розподіл не визначає однозначно сім'ю, до якої вона належить.ΘR4

  • CYCYp:ΘCYCYΘCY


2
It will take me about a day to digest your answer. I will have to chew slowly. Meanwhile, thank you.
Carl

(+1) OK, I slogged through it. So is F:R×Θ[0,1] a Polish space or not? Can we do a simple answer so people know how to avoid using the word family improperly, please. @JuhoKokkala related, for example, that Wikipedia abused language in their exponential family, that needs clarification.
Carl

1
Doesn't the second sentence of this answer serve that request for simplicity?
whuber

IMHO, however uninformed, no, it does not due to incompleteness, it doesn't say what a family isn't. The concept "in the space of all distributions" seems to relate to statistics only.
Carl

1
I have accepted your answer. You have enough information in it that I could apply it to the question in question.
Carl

1

To address a specific point brought up in the question: "exponential family" does not denote a set of distributions. (The standard, say, exponential distribution is a member of the family of exponential distributions, an exponential family; of the family of gamma distributions, also an exponential family; of the family of Weibull distributions, not an exponential family; & of any number of other families you might dream up.) Rather, "exponential" here refers to a property possessed by a family of distributions. So we shouldn't talk of "distributions in the exponential family" but of "exponential families of distributions"—the former is an abuse of terminology, as @JuhoKokkala points out. For some reason no-one commits this abuse when talking of location–scale families.


0

Thanks to @whuber there is enough information to summarize in what I hope is a simpler form relating to the question from which this post arose. "Another name for a family [Sic, statistical family] is [a] statistical model."

From that Wikipedia entry: A statistical model consists of all distributions that we suppose govern our observations, but we do not otherwise know which distribution is the actual one. What distinguishes a statistical model from other mathematical models is that a statistical model is non-deterministic. Thus, in a statistical model specified via mathematical equations, some of the variables do not have specific values, but instead have probability distributions; i.e., some of the variables are stochastic. A statistical model is usually thought of as a pair (S,P), where S is the set of possible observations, i.e., the sample space, and P is a set of probability distributions on S.

Suppose that we have a statistical model (S,P) with P={Pθ:θΘ}. The model is said to be a Parametric model if Θ has a finite dimension. In notation, we write that ΘRd where d is a positive integer (R denotes the real numbers; other sets can be used, in principle). Here, d is called the dimension of the model.

As an example, if we assume that data arise from a univariate Gaussian distribution, then we are assuming that

P={Pμ,σ(x)12πσexp((xμ)22σ2):μR,σ>0}.
In this example, the dimension, d, equals 2, end quote.

Thus, if we reduce the dimensionality by assigning, for the example above, μ=0, we can show a family of curves by plotting σ=1,2,3,4,5 or whatever choices for σ.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.