Статистичні та математичні поняття абсолютно однакові, розуміючи, що "сім'я" - це узагальнений математичний термін з технічними варіаціями, адаптованими до різних обставин:
Параметричне сімейство - це крива (або поверхня чи інше її кінцеве розмірне узагальнення) у просторі всіх розподілів.
У решті цієї публікації пояснюється, що це означає. Як осторонь, я не вважаю, що все це є суперечливим ні математично, ні статистично (крім одного другорядного питання, який зазначено нижче). На підтримку цієї думки я надіслав багато посилань (переважно на статті у Вікіпедії).
Ця термінологія "сімей", як правило, використовується при вивченні функцій класів CY на множині Y або "карти". Враховуючи домен X , сімейство F карт на X параметризоване деяким набором Θ ("параметри"), є функцією
F:X×Θ→Y
для якої (1) для кожного θ∈Θ функція Fθ:X→Y задана Fθ(x)=F(x,θ) знаходиться вCY а (2)F має певні "приємні" властивості.
Ідея полягає в тому, що ми хочемо змінювати функції від до Y "гладко" або контрольовано. Властивість (1) означає, що кожен θ позначає таку функцію, тоді як деталі властивості (2) будуть охоплювати сенс, в якому "мала" зміна θ викликає досить "малу" зміну F θ .XYθθFθ
Стандартний математичний приклад, близький до зазначеного у питанні, - це гомотопія . У цьому випадку - категорія безперервних карт з топологічних просторів X в топологічний простір Y ; Θ = [ 0 , 1 ] ⊂ R 0 до F 1CY XYΘ=[0,1]⊂R одиничний інтервал з його звичайною топологією, а також вимагати , щоб бути безперервне відображенням з топологічного твори X × thetas ; в Y . Це можна розглядати як "безперервну деформацію карти FFX×ΘYF0F1 "Коли є самим інтервалом, такі карти є кривими в Y, а гомотопія - плавною деформацією від однієї кривої до іншої.X=[0,1]Y
Для статистичних застосувань - це сукупність усіх розподілів на R (або, на практиці, на R n на деякий n , але для того, щоб експозиція була простою, я зупинюся на n = 1 ). Ми можемо ототожнити його з набором усіх не спадаючих функцій cddlàg R → [ 0 , 1CYRRnnn=1 коли закриття їх діапазону включає як 0, так і 1 : це функціїкумулятивного розподілу,або просто функції розподілу. Таким чином, X = R іR→[0,1]01X=R .Y=[0,1]
Сімейство розподілів є будь-яка підмножина . CY Інша назва сім'ї - статистична модель. Він складається з усіх розподілів, які, як ми вважаємо, регулюють наші спостереження, але ми інакше не знаємо, який розподіл є фактичним.
- Сім'я може бути порожньою.
- сама - сім'я.CY
- Сім'я може складатися з одного розподілу або просто кінцевої їх кількості.
Ці абстрактні множинно-теоретичні характеристики представляють порівняно мало інтересу або корисності. Це лише тоді, коли ми розглянемо додаткову (відповідну) математичну структуру на , ця концепція стає корисною. Але які властивості C Y представляють статистичний інтерес? Деякі, які часто з’являються:CYCY
-опуклий набір: з огляду на будь-які два розподіли F , G ∈ C Y , ми можемо сформуватирозподіл суміші(1-t) F +t G ∈Yдля всіхt∈[0,CYF,G∈CY (1−t)F+tG∈Y . Це свого роду «гомотопних» від F до G .t∈[0,1]FG
Великі частини Росії підтримують різні псевдометрії, такі якрозбіжність Кулбека-Лейблераабо тісно пов'язану метрику інформації Фішера.CY
має аддитивну структуру: відповідає будь-яким двом розподіламFіGCYFG є їхньою сумою, .F⋆G
підтримує безліч корисних, природних функцій, які часто називають "властивостями". Сюди входять будь-який фіксований квантил (наприклад, медіана), а такожкумулянти.CY
- це підмножинафункціонального простору. Як такий, він успадковує багато корисних показників, таких якнорма суп( L ∞ норма), задана | | F-G | | ∞ = sup x ∈ R | F(x)CYL∞
||F−G||∞=supx∈R|F(x)−G(x)|.
Природні дії групи на індукують дії на C Y . Найпоширенішими діями є переклади T μ : x → x + μ та масштабування S σ : x → x σ при σ > 0 . Ефект, який вони мають на розподіл, полягає в надсиланні F на розподіл, заданий F μ , σ ( x ) = F ( ( x - μ )RCY Tμ:x→x+μ Sσ:x→xσσ>0F . Вони призводять до концепцій локальних сімей та їх узагальнення. (Я не надаю посилання, тому що розширений пошук в Інтернеті виявляє безліч різних визначень: тут, принаймні, може виникнути невелика суперечка.)Fμ,σ(x)=F((x−μ)/σ)
Властивості, які мають значення, залежать від статистичної проблеми та від того, як ви плануєте аналізувати дані. Розгляд усіх варіацій, запропонованих попередніми характеристиками, зайняв би занадто багато місця для цього середовища. Давайте зупинимося на одному важливому важливому додатку.
Візьмемо, наприклад, максимальну ймовірність. У більшості програм ви хочете використовувати Calculus для отримання оцінки. Щоб це працювало, ви повинні вміти «брати похідні» в сім’ї.
( Технічна сторона: Звичайним способом цього є вибір домену для d ≥ 0 та визначення безперервної, локально перевернутої функції p від Θ в C Y. (Це означає, що для кожного θ ∈ Θ існує існує куля B ( θ , ϵ ) , при ϵ > 0, для якої p ∣ B ( θ , ϵ ) :Θ⊂Rdd≥0pΘCYθ∈ΘB(θ,ϵ)ϵ>0 - один на один. Іншими словами, якщо ми змінимо θ на достатньо невеликій кількості, ми завжди отримаємо різний розподіл.))p∣B(θ,ϵ):B(θ,ϵ)∩Θ→CYθ
Отже, у більшості застосувань для ML вимагаємо, щоб був безперервним (і, сподіваємось, майже скрізь диференційованим) у складі Θ . (Без безперервності максимізація ймовірності, як правило, стає нерозв'язною проблемою.) Це призводить до наступного визначення імовірнісного визначення параметричного сімейства :pΘ
Параметричне сімейство (одновимірних) розподілів - локально обернена карта з Θ ⊂ R n , для якої (a) кожен F θ є функцією розподілу і (b) для кожного x ∈ R , функція L x : θ → [ 0 , 1 ], задана L x ( θ ) =
F:R×Θ→[0,1],
Θ⊂RnFθx∈RLx:θ→[0,1]Lx(θ)=F(x,θ) є безперервним і майже скрізь диференційованим.
Зауважимо, що параметричне сімейство - це більше, ніж просто збірка F θFFθ : воно також включає конкретний спосіб, у якому значення параметрів відповідають розподілам.θ
Закінчимо кілька ілюстративних прикладів.
Нехай - сукупність усіх нормальних розподілів. Як дано, це не параметрична сім'я: це лише сім'я. Щоб бути параметричним, ми повинні вибрати параметризацію. Один із способів - вибрати Θ = { ( μ , σ ) ∈ R 2 ∣ σ > 0 }
і зіставити ( μ , σ ) нормальний розподіл із середнім μ
та дисперсієюCYΘ={(μ,σ)∈R2∣σ>0}(μ,σ)μ .σ2
Безліч Пуассона розподілу(λ) є параметричним сімейством з .λ∈Θ=(0,∞)⊂R1
Сукупність уніфікованих розподілів (яка є чіткою у багатьох вправах підручника) є параметричним сімейством з
θ ∈ R 1 . У цьому випадку F θ ( x ) = max ( 0 , min ( 1 , x - θ ) ) є диференційованим у θ, за винятком
θ ∈ { x , x - 1 } .(θ,θ+1)θ∈R1Fθ(x)=max(0,min(1,x−θ))θθ∈{x,x−1}
Нехай і G - будь-які два розподіли. Тоді F ( x , θ ) = ( 1 - θ ) F ( x ) + θ G ( x ) - параметричне сімейство для θ ∈ [ 0 , 1 ] . (Доведення: зображення F - це сукупність розподілів і його часткова похідна в θ дорівнює - F ( x ) + G (FGF(x,θ)=(1−θ)F(x)+θG(x)θ∈[0,1]Fθ що визначено скрізь.)−F(x)+G(x)
Сім'ї Пірсона є чотиривимірний сім'ї, & , яка включає в себе (серед інших) нормального розподілу, бета розподілу і розподілу зворотної гами. Це ілюструє той факт, що будь-який даний розподіл може належати до багатьох різних сімей розподілу . Це цілком аналогічно спостереженню, що будь-яка точка (достатньо великого) простору може належати до багатьох шляхів, які перетинаються там. Це разом із попередньою побудовою показує нам, що жоден розподіл не визначає однозначно сім'ю, до якої вона належить.Θ⊂R4
CYCYp:Θ→CYCYΘCY