Розподіл відстані махаланобіса на рівні спостереження


23

Якщо у мене є багатоваріантний нормальний зразок iid X1,,XnNp(μ,Σ) , і визначити (яка є різновидом відстані махаланобіса [в квадраті] від вибіркової точки до вектора використовуючи матрицю для зважування), який розподіл (відстань махаланобіса до вибірки середнє значення використанням матриці коваріації вибірки )?a A

di2(b,A)=(Xib)A1(Xib)
aA ˉ X Sdi2(X¯,S)X¯S

Я дивлюся на папір, який стверджує, що це , але це, очевидно, неправильно: розподіл був би отриманий для використовуючи (невідомий) середній вектор сукупності і коваріаційна матриця. Коли підключаються аналоги зразків, потрібно отримати розподіл Hotelling або масштабований розподіл або щось подібне, але не . Я не міг знайти точного результату ні в Мюрхеді (2005) , ні в Андерсоні (2003) , ні в Мардії, Кенті та Біббі (1979, 2003) χ 2 p d 2 i ( μ , Σ ) T 2 F ( ) χ 2 pχp2χp2di2(μ,Σ)T 2F()χp2. Мабуть, ці хлопці не переймалися зовнішньою діагностикою, оскільки багатоваріантний нормальний розподіл є ідеальним і легко отримується щоразу, коли збирається багатоваріантні дані: - /.

Речі можуть бути складнішими за це. Результат розподілу Hotelling заснований на припущенні незалежності між векторною частиною та матричною частиною; така незалежність не має для і , але це вже не має для і .T 2X¯SXiS


Визначаючи , ви все ще розглядаєте X i як випадкову величину чи тепер ви трактуєте її як фіксований вектор? Включення підписки говорить про останнє, але це здається трохи дивним. di2Xi
whuber

1
Лише невелика сторонна примітка, але зауважте, що є допоміжною щодо μ і i d 2 i ( ˉ X , S ) дорівнює фіксованій постійній (повинна бути n - p , чи подібне, я думаю) майже напевно. XiX¯μidi2(X¯,S)np
кардинал

1
@whuber - можливо, підкреслити, що він обчислюється за допомогою спостереження з вибірки, а не нового спостереження?
jbowman

1
@whuber, приблизно за принципами сказаного jbowman - щоб вказати, що це статистика на рівні спостереження (на відміну від статистики рівня вибірки, як середнє значення вибірки).
Стаск

1
Розподіл - бета, n / ( n - 1 ) 2 d 2 i ( ˉ X , S ) B ( p / 2 , ( n - p - 1 ) / 2 ) , але я все ще шукаю розподілу d 2 i ( μ , S )di2(X¯,S)n/(n1)2di2(X¯,S)B(p/2,(np1)/2)di2(μ,S). Розподіли 's не є незалежними. di2

Відповіді:


18

Перевірте моделювання суміші Гаусса, використовуючи відстань махаланобіса ( альтернативне посилання ). Див. Сторінку № 13, друга колонка. Автори також дали певні докази для отримання розподілу. Розподіл масштабується бета-версія. Будь ласка, дайте мені знати, якщо це не працює для вас. Інакше я міг би завтра перевірити будь-яку підказку в книзі SS Wilks.


4
The answer given in the paper is: n(n1)2di2(X¯,S)B(p2,np12)

9

df=p

n(d2)(n1)2Beta(p2,(np1)2).
However, if the observation xi is independent of the parameter estimates, then the distribution is proportional to a Fisher's F-ratio distribution:
(nd2(np)(p(n1)(n+1))F(p,np)

Welcome to the site, @JoeSullivan. I took the liberty of using LATEX to make your equations easier to read. Please make sure they still say what you want.
gung - Reinstate Monica

can you give a reference for the F formula?
eyaler

1
one related reference, section 3 in Hardin, Johanna, and David M. Rocke. 2005. “The Distribution of Robust Distances.” Journal of Computational and Graphical Statistics 14 (4): 928–46. doi:10.1198/106186005X77685.
Josef
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.