Оскільки є досить загальним, а зміна косинусної подібності залежить від конкретних і та їх відношення до , жодна визначена формула неможлива. Однак існують практично обчислювальні межі того, наскільки може змінитися подібність косинусу . Їх можна знайти, екстремізуючи кут між і враховуючи, що схожість косинуса між і є заданим значенням, скажімо, (де - кут між і ). Відповідь повідомляє нам, скільки кутМАБММАМБАБcos( 2 ϕ )2 ϕАБ2 ϕможливо , може бути зігнутий перетворенням .М
Розрахунки загрожують безладно. Деякі розумні варіанти позначення, а також деякі попередні спрощення, зменшують зусилля. Виявляється, рішення в двох вимірах розкриває все, що нам потрібно знати. Це відстежувана проблема, залежна лише від однієї реальної змінної , яка легко вирішується за допомогою методів обчислення. Простий геометричний аргумент поширює це рішення на будь-яку кількість вимірів .θн
Математичні передумови
За визначенням косинус кута між будь-якими двома векторами і отримують шляхом нормалізації їх до одиничної довжини та взяття їх добутку. Таким чином,АБ
А'Б(А'А )(Б'Б )----------√= cos( 2 ϕ )
і, записуючи , косинус кута між зображеннями і при перетворенні дорівнюєΣ =М'МАБМ
( МА)'( МБ )( ( МА)'( МА ) )( ( МБ)'( МБ ) )-----------------------√=А'Σ B(А'Σ A ) (Б'Σ B )------------√.(1)
Зауважте, що в аналізі мають значення лише , аΣ не самТаким чином, ми можемо скористатися сингулярною декомпозицією величини (SVD) для спрощення проблеми. Нагадаємо, що це виражає як добуток (справа наліво) ортогональної матриці , діагональної матриці та іншої ортогональної матриці :МММV'DU
М= UDV'.
Іншими словами, існує основа привілейованих векторів (стовпці ), на які діє, змінюючи масштаб кожного окремо за допомогою діагонального запису (який я називатиму ) , а потім застосовуючи обертання (або анти-обертання) до результату. Це остаточне обертання не змінить жодної довжини чи кутів, тому не повинно впливати на . Ви можете переконатися, що це формально з розрахункоме1, … ,енVМеiiгоDгiUΣ
Σ =М'М= ( UDV')'( UDV') = VD (U'U) DV'= VD2V'.
Отже, для вивчення ми можемо вільно замінити будь-якою іншою матрицею, яка створює однакові значення в . Замовивши так що зменшення розміру (і припускаючи не тотожне дорівнює нулю), вибір хороший з єΣМ( 1 )еiгiММ
М=1г1DV'.
Діагональні елементи є( 1 /г1) D
1 =г1/г1≥λ2=г2/г1≥λ3=г3/г1≥ ⋯ ≥λн=гн/г1≥ 0.
Зокрема, вплив (будь то в його первісному чи зміненому вигляді) на всі кути повністю визначається тим, щоМ
Меi=λiеi.
Аналіз окремого випадку
Нехай . Оскільки зміна довжин векторів не змінює кут між ними, ми можемо вважати, що і є одиничними векторами. У площині всі такі вектори можуть бути позначені кутом, який вони роблять з , що дозволяє нам писатиn = 2АБе1
A = cos( θ - ϕ )е1+ гріх( θ - ϕ )е2.
Тому
B = cos( θ + ϕ )е1+ гріх( θ + ϕ )е2.
(Дивіться рисунок нижче.)
Застосувати просто: він фіксує перші координати і і їх другі координати на . Тому кут від до дорівнюєМАБλ2МАМБ
f( θ ) = арктан(λ2засмага( θ + ϕ ) ) - арктан(λ2засмага( θ - ϕ ) ) .
Оскільки - неперервна функція, ця різниця кутів є безперервною функцією . Насправді він диференційований. Це дозволяє нам знайти крайні кути, перевіривши нулі похідної . Це похідне просто обчислити: це відношення тригонометричних функцій. Нулі можуть зустрічатися лише серед нулів його чисельника, тому не будемо намагатися обчислити знаменник. Ми отримуємоМθf'( θ )
f'( θ ) =λ2( 1 -λ2) (λ2+ 1 ) гріх( 2 θ ) гріх( 2 ϕ )∗.
Особливі випадки , і легко зрозуміти: вони відповідають ситуаціям, коли має знижений ранг (і так розбиває всі вектори на лінію); де є кратним матриці ідентичності; і де і паралельні (звідки кут між ними не може змінюватися, незалежно від ). Випадок виключається умовою .λ2= 0λ2= 1ϕ = 0ММАБθλ2= - 1λ2≥ 0
Крім цих особливих випадків, нулі трапляються лише там, де : тобто або . Це означає, що лінія, визначена розтинає кут . Тепер ми знаємо, що крайні значення кута між і повинні лежати серед значень , тому давайте обчислимо їх:гріх( 2 θ ) = 0θ = 0θ =π/ 2е1А БMАМБf( θ )
f( 0 )f( π/ 2)=arctan(λ2засмага( ϕ ) ) -arctan(λ2засмага( - ϕ ) ) = 2 арктану(λ2засмага( ϕ ) ) ;= арктан(λ2засмага( π/2+ϕ))−arctan(λ2tan(π/2−ϕ))=2arctan(λ2cot(−ϕ)).
Відповідні косинуси є
cos(f(0))=1−λ22tan(ϕ)21+λ22tan(ϕ)2(2)
і
cos(f(π/2))=1−λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2−λ22tan(ϕ)2+λ22.(3)
Часто достатньо зрозуміти, як спотворює прямі кути. У цьому випадку , що веде до , який ви можете підключити до попередніх формул.M2ϕ=π/2tan(ϕ)=cot(ϕ)=1
Зауважте, що чим менше стає, тим стають ці кути і тим більше спотворення.λ2
На цьому малюнку показано чотири конфігурації векторів і розділених кутом . Одиничне коло та його еліптичне зображення під затінені для відліку (з дією рівномірно змінено масштаб, щоб зробити ). На малюнку заголовки вказують значення , середню точку і . Найближчі будь-які такі і можуть прийти при перетворенні - конфігурація, подібна до лівої зAB2ϕ=π/3MMλ1=1θABABMθ=0. Найбільш віддаленою від них може бути конфігурація на зразок тієї, що знаходиться праворуч з . Показано дві проміжні можливості.θ=π/2
Рішення для всіх вимірів
Ми бачили, як діє, розширюючи кожен вимір на коефіцієнт . Це спотворить одиничну сферу в еліпсоїд. У визначення його головних осей. В відстань від початку координат, уздовж цих осей, до еліпсоїда. Отже, найменша, , - найкоротша відстань (у будь-якому напрямку) від початку до еліпсоїда, а найбільша - найдальша відстань (у будь-якому напрямку) від початку від еліпсоїда.Miλi{A|A′A=1}eiλiλnλ1
У більш високих розмірах , і є частиною двовимірного підпростору. відображає одиничне коло в цьому підпросторі на перетин еліпсоїда з площиною, що містить та . Цей перетин, будучи лінійним викривленням кола, є еліпсом. Очевидно, що найдальша відстань до цього еліпса не більше а найкоротша відстань - не менше .n>2АБММАМБλ1= 1λн
Як ми спостерігали в кінці попереднього розділу, найбільш екстремальною є можливість, коли і розташовані в площині, що містить два з для яких співвідношення відповідних є якомога меншим. Це станеться в площині . У нас вже є рішення для цієї справи.АБеiλiе1,ен
Висновки
Крайності косинусної подібності, які можна досягти, застосувавши до двох векторів, що мають схожість на косинус , задаються формулами та . Вони досягаються, розміщуючи і під рівними кутами до напрямку, в якому максимально подовжує будь-який вектор (наприклад, напрямок ) і відокремлює їх у напрямку, в якому мінімально подовжує будь-який вектор ( наприклад, напрямок ).Мcos(2ϕ)(2)(3)ABΣ=M′Me1Σen
Ці крайнощі можуть бути обчислені в термінах СВД з .M