Я, як правило, чую, що зазвичай 3 найбільші власні значення є найважливішими, тоді як ті, близькі до нуля, - шум
Ви можете протестувати на це. Докладніше дивіться у папері, пов’язаному в цій публікації. Знову ж таки, якщо ви маєте справу з серіями фінансових періодів, ви, можливо, спершу хочете виправити лептокуртичність (тобто врахуйте серію прибутків, скоригованих на garch, а не необроблені прибутки).
Я бачив декілька наукових робіт, які досліджують, чим природно виникаючі власні значення розподілу відрізняються від розрахованих за матрицями випадкової кореляції (знову ж таки, відрізняючи шум від сигналу).
Едвард:> Зазвичай, це можна зробити і навпаки: подивіться на багатоваріантний розподіл власних значень (кореляційних матриць), що надходять із потрібної програми. Після того, як ви визначили надійного кандидата на розповсюдження власних цінностей, їх генерувати досить легко.
Найкраща процедура того, як визначити багатоваріантний розподіл власних значень, залежить від того, скільки активів ви хочете врахувати одночасно (тобто які розміри вашої кореляційної матриці). Існує акуратний трюк, якщо ( p - кількість активів).p ≤ 10p
Редагувати (коментарі Shabbychef)
чотиришарова процедура:
- Припустимо , у вас є підразки багатоваріантних даних. Вам потрібен оцінювач дисперсійно-коваріаційної матриці ˜ C j для кожної підпроби j (ви можете використовувати класичний оцінювач або надійну альтернативу, таку як швидкий MCD , який добре реалізований у matlab, SAS, S, R ,. ..). Як завжди, якщо ви маєте справу з серіями фінансових періодів, ви б хотіли врахувати серію прибутків, скоригованих на garch, а не необроблені.J = 1 , . . . , JС~jj
- Для кожного підрозділу обчисліть ˜ Λ j = log ( ˜ λ j 1 ) , ..., log ( ˜ λ j p ) , власні значення ˜ C j .jΛ~j= журнал( λ~j1)журнал( λ~jp)С~j
- Обчисліть , опуклий корпус матриці J × p , j-й запис якого ˜ Λ j (знову ж таки, це добре реалізовано в Matlab, R, ...).СV( Λ~)J× рΛ~j
- Намалюйте навмання точки зсередини (це робиться шляхом додавання ваги w i до кожного з ребер C V ( ˜ Λ ), де w i = γ iСV( Λ~)шiСV( Λ~) , деγi- виведення з одиничного експоненціального розподілу (детальнішетут).шi= γi∑pi = 1γiγi
Обмеженням є те, що швидке обчислення опуклого корпусу ряду точок стає надзвичайно повільним, коли кількість розмірів більше 10. J≥ 2