Якщо у нас є 2 нормальних, некоррельовані випадкові величини ми можемо створити 2 корельовані випадкові величини за формулою
і тоді матиме кореляцію з .
Чи може хтось пояснити, звідки береться ця формула?
Якщо у нас є 2 нормальних, некоррельовані випадкові величини ми можемо створити 2 корельовані випадкові величини за формулою
і тоді матиме кореляцію з .
Чи може хтось пояснити, звідки береться ця формула?
Відповіді:
Припустимо, ви хочете знайти лінійну комбінацію і такою, що
Зауважте, що якщо ви помножите і і β на одну і ту ж (ненульову) константу, кореляція не зміниться. Таким чином, ми додамо умову збереження дисперсії: var ( α X 1 + β X 2 ) = var ( X 1 )
Це еквівалентно
Якщо припустити, що обидві випадкові величини мають однакову дисперсію (це важливе припущення!) ( ), отримаємо
Існує багато рішень цього рівняння, тому настав час згадати умову збереження дисперсії:
І це веде до нас
UPD . Щодо другого питання: так, це відомо як відбілювання .
Рівняння - це спрощена двоваріантна форма розкладу Холеського . Це спрощене рівняння іноді називають алгоритмом Кайзера-Дікмана (Kaiser & Dickman, 1962).
Зауважте, що для правильного роботи цього алгоритму і X 2 повинні мати однакову дисперсію. Також алгоритм зазвичай використовується із звичайними змінними. Якщо X 1 або X 2 не є нормальними, Y може не мати такої ж форми розподілу, як X 2 .
Список літератури:
Кайзер, Х. Ф., і Дікман, К. (1962). Матриці оцінки вибірки та сукупності та матриці кореляції вибірки з довільної матриці кореляції сукупності. Психометріка, 27 (2), 179-182.
Коефіцієнт кореляції - це між двома рядами, якщо їх розглядати як вектори (з n t h точкою даних буде n t h розмірність вектора). Вищенаведена формула просто створює розклад вектора на його компоненти cos θ , s i n θ (стосовно X 1 , X 2 ).
якщо ρ = c o s θ , то √
.
Оскільки, якщо є некорельованими, кут між ними є прямим кутом (тобто їх можна розглядати як ортогональні, хоч і ненормовані, базисні вектори).