(Відповідь нижче лише вводить і констатує теорему, доведену в роботі [0]. Краса в цій роботі полягає в тому, що більшість аргументів викладені з точки зору основної лінійної алгебри. Для відповіді на це питання достатньо вказати основні результати, але загалом, перейдіть на перевірку першоджерела).
У будь-якій ситуації, коли багатоваріантний малюнок даних може бути описаний еліптичним розподілом змінної , статистичний висновок за визначенням зводиться до проблеми примірності (та характеристики) вектора розташування k змінних (скажімо, θ ) і k до k симетрична напівпозитивна визначена матриця (скажімо Σ ) до даних. З причин, які я пояснюю нижче (але які ви вже вважаєте за приміщення), часто буде більш доцільним розкласти Σ на компонент фігури (SPSD-матриця такого ж розміру, як Σ ), враховуючи форму контурів щільності вашого багатофакторного розподілу і скаляр σ SккθккΣΣΣσS виражаючи масштаб цих контурів.
У одновимірних даних ( ), Σ , матриця коваріації ваших даних є скалярною, і, як випливатиме з обговорення нижче, компонент форми Σ дорівнює 1, так що Σ дорівнює його масштабній складовій Σ = σ S завжди і ніякої неоднозначності неможливо.k = 1ΣΣΣΣ= σS
У багатовимірних даних можливе багато варіантів масштабування функцій Один зокрема ( σ S = | ΣσS ) виділяється ключовою бажаною власністю. Це повинно зробити його кращим вибором коефіцієнта масштабування в контексті еліптичних сімей.σS= | ΣΣ|1 / к
Багато проблем статистики МВ передбачають оцінку матриці розсіювання, визначеної як функція (al)
симетричного напівпозитивного у R k × k і задовольняє:ΣRk × k
(для не сингулярних матриць A і векторів b ). Наприклад, класична оцінка коваріації задовольняє (0), але вона аж ніяк не єдина.
( 0 )Σ( А X+ b ) = A Σ( X) А⊤
Аб
За наявності еліптичних розподілених даних, де всі контури щільності є еліпсами, визначеними однаковою матрицею форми, аж до множення на скаляр, природно розглядати нормовані версії форми:Σ
VS= Σ/ S( Σ)
де - 1-гоногенна функція, що задовольняє:S
( 1 )S( λ Σ) = λ S( Σ)
для всіх . Потім, V S називається форма компонент матриці розсіювання (в короткій матриці форми) і σ S = S 1 / 2 ( Σ ) називається масштабний компонент матриці розсіювання. Приклади задач багатоваріантної оцінки, коли функція втрат залежить лише від Σ через компонент форми V S, включають тести сферичності, PCA та CCA серед інших.λ > 0VSσS=S1/2(Σ)ΣVS
Звичайно, існує багато можливих функцій масштабування, тому це все ще залишає відкритим питання про те, що (якщо є) з декількох варіантів функції нормалізації в деякому сенсі є оптимальним. Наприклад:S
- (наприклад, той, який запропонував @amoeba у своєму коментарі під питанням про ОП. Див. Також [1], [2], [3])S=tr(Σ)/k
- ([4], [5], [6], [7], [8])S=|Σ|1/k
- (перший запис матриці коваріації)Σ11
- (перше власне значення Σ )λ1(Σ)Σ
Однак - єдина функція масштабування, для якої матриця інформації Фішера для відповідних оцінок масштабу та форми в локально асимптотично нормальних сімействах є діагональною блоком (тобто компоненти масштабу та форми задачі оцінки є асимптотично ортогональними) [0 ]. Це означає, серед іншого, що масштаб функціональний S = | Σ | 1 / K є єдиним вибором з S , для яких не специфікація сг S не викликає якийсь - або втрати ефективності при виконанні на висновок V S .S=|Σ|1/kS=|Σ|1/kSσSVS
Я не знаю жодної порівняно сильної характеристики оптимальності для будь-якого з безлічі можливих варіантів які задовольняють (1).S
- [0] Paindaveine, D., Канонічне визначення форми, Статистика та ймовірнісні листи, Том 78, Випуск 14, 1 жовтня 2008 р., Сторінки 2240-2247. Необ’єднане посилання
- [1] Дамбген, Л. (1998). Про М-функціонал Тайлера розсіювання у високих розмірах, Енн. Інст. Статист. Математика. 50, 471–491.
- [2] Ollila, E., TP Hettmansperger, H. Oja (2004). Афіні еквівалентні багатоваріантні знакові методи. Препринт, Університет Юваскіла.
- [3] Тайлер, DE (1983). Властивості стійкості та ефективності матриць розсіювання, Biometrika 70, 411–420.
- [4] Дамбген, Л. та Д.Є. Тайлер (2005). Про властивості розбиття деяких багатоваріантних M-функціоналів, Scand. J. Statist. 32, 247–264.
- [5] Холлін, М. та Д. Пейндавейн (2008). Оптимальні рангові тести на однорідність розсіювання, Енн. Статист., З'являтися.
- [6] Салібіян-Баррера, М., С. Ван Аельст і Г. Віллемс (200 6). Аналіз основних компонентів на основі багатоваріантних ММ-оцінок із швидким та надійним завантажувальним пристроєм, Дж. Амер. Статист. Доц. 101, 1198–1211.
- [7] Таскінен, С., К. Крю, А. Канкайнен, Е. Олліла та Х. О дже (2006). Функції впливу та ефективність канонічної кореляції та векторних оцінок на основі матриць розсіювання та форми, Ж. Багатоваріантний анал. 97, 359–384.
- [8] Тацуока, К. С. та Д.Є. Тайлер (2000). Про унікальність S-функціоналів та М-функціоналів при ненеліптичних розподілах, Енн. Статист. 28, 1219–1243.