Показники коваріаційних матриць: недоліки та сильні сторони


11

Які "найкращі" показники для матриць коваріації та чому? Мені зрозуміло, що Frobenius & c не підходять, і параметризації кутів також мають свої проблеми. Інтуїтивно можна отримати компроміс між цими двома, але я також хотів би знати, чи є інші аспекти, які слід пам’ятати і, можливо, добре встановлені стандарти.

Загальні показники мають різні недоліки, оскільки вони не є природними для коваріаційних матриць, наприклад, вони часто не особливо штрафують матриці, що не належать до PSD, або не ведуть себе добре wrt-рейтингом (розглянемо два обертові еліпсоїди коваріації низького рангу: я б хотів однаковий -провести проміжне обертання, щоб мати менші відстані, ніж середньокомпонентне середнє, що не стосується і, можливо, Frobenius, будь ласка, виправте мене тут). Також опуклість не завжди гарантується. Добре було б побачити ці та інші проблеми, вирішені "хорошим" показником.L1

Ось хороше обговорення деяких питань, один приклад оптимізації мережі та один із комп’ютерного зору . І ось подібне запитання - отримання інших показників, але без обговорення.


2
Яку мету ви шукаєте? Чому метрика Фробеніуса недоречна?
whuber

1
@whuber: Я хотів би отримати загальний огляд, перш ніж накладати занадто багато обмежень. Моє поле - це кількісне фінансування, де більшість людей дотримуються Фробеніуса для простоти. Поширені показники мають різні недоліки, оскільки вони не є природними для коваріаційних матриць, наприклад, вони особливо не штрафують матриці, що не належать до PSD, і не ведуть себе добре wrt-рейтингом (подумайте про два обертових еліпсоїдах коваріації низького рангу: я б хотів однорядного проміжного обертання мати менші відстані, ніж середньокомпонентне середнє, що не стосується і, можливо, Фробеніуса, якщо я не помиляюся). Додано кілька посилань. L1
Кварц

Як це останнє запитання, яке ви посилаєтесь на "більш обмежене"? Зрештою, всі матриці коваріації є симетричними. Здається, це ідеальний дублікат.
whuber

1
Це гарна критика іншого питання. Можна запропонувати вам відредагувати своє запитання (та назву), щоб відобразити зміст останнього коментаря? Це чітко відрізнятиме це від очевидного дубліката та допоможе респондентам дати більш відповідні відповіді. (І не турбуйтеся про правок на своє питання: що , як очікується, мета - нитка в першу чергу про співтоваристві редагування.)
whuber

1
@kjetilbhalvorsen Це провокаційний вирок! Чи можете ви розширити відповідь? Або надати посилання на статтю?
Sycorax каже, що повернеться до Моніки

Відповіді:


2

Ну, я не думаю, що існує хороший показник чи "найкращий спосіб" аналізу матриць Коваріації. Аналіз повинен завжди відповідати вашій меті. Скажімо, C - моя коваріаційна матриця. Діагональ містить дисперсію для кожного обчисленого параметра. Тож якщо ви зацікавлені у значенні параметрів, то trace (C) - це хороший початок, оскільки це ваша загальна продуктивність.

Якщо побудувати ваш параметр та його значення, ви можете побачити щось подібне:

x1 =  1.0 ±  0.1 
x2 = 10.0 ±  5.0
x3 =  5.0 ± 15.0 <-- non-significant parameter

Якщо ви зацікавлені в їх взаємозв'язку, така таблиця може дати щось цікаве:

x1  1.0
x2  0.9  1.0
x3 -0.3 -0.1  1.0
    x1    x2   x3

Кожен елемент - коефіцієнт кореляції між параметрами xi та xj. З прикладу видно, що параметри x1 і x2 сильно корелюються.


1

Цікаве питання, я зараз стикаюся з тим же питанням! Це залежить від того, як ви визначаєте "кращий", тобто чи шукаєте ви якесь середнє одиничне значення для розвороту або для співвідношення даних тощо. Я знайшов у Press, SJ (1972): Прикладний багатофакторний аналіз, с. 108, що узагальнена дисперсія, визначена як детермінанта матриці коваріації, є корисною в якості єдиної міри для поширення. Але якщо ви після цього будете співвідношенням, мені потрібно буде думати далі. Дай мені знати.


3
Довідка, будь ласка.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.