Як змінюється подібність косинусу після лінійного перетворення?


9

Чи є математичний зв’язок між:

  • косинусна схожість ім'я двох векторів і , іsim(A,B)AB
  • косинус подібності з і , неоднорідне масштабується з допомогою даної матриці ? Тут - задана діагональна матриця з нерівними елементами по діагоналі.sim(MA,MB)ABMM

Я намагався пройти обчислення, але не зміг досягти простого / цікавого посилання (вираз). Цікаво, чи є такий.


Наприклад, кути не зберігаються при нерівномірному масштабуванні, але яка залежність між початковими кутами та кутами після нерівномірного масштабування? Що можна сказати про зв’язок між набором векторів S1 та іншим набором векторів S2 - де S2 отримується шляхом нерівномірного масштабування S1?


@whuber, дякую! Так, M - задана матриця (матриця масштабування - таким чином, діагональна матриця, інших обмежень немає). У певному сенсі я хотів знати, що відбувається (з точки зору подібності косинусу для будь-якої пари векторів) з векторним простором, який зазнає нелінійного масштабування.
turdus-merula

2
Можливо, варто відзначити, що якщо всі масштабні чинники є негативними (як можна було б вважати, природно), то всі симетричні позитивно-визначені матриці можна вважати "масштабуючими" матрицями. Відносини, які ви шукаєте, широко використовуються, зокрема , при вивченні та описі спотворень у картографічних прогнозах. Там цікавлять центри максимального та мінімального кутів на земній поверхні, які були б пов'язані з двома перпендикулярними напрямками на карті. Між цими кутами та співвідношеннями двох масштабних факторів існує пряма залежність.
whuber

Відповіді:


8

Оскільки є досить загальним, а зміна косинусної подібності залежить від конкретних і та їх відношення до , жодна визначена формула неможлива. Однак існують практично обчислювальні межі того, наскільки може змінитися подібність косинусу . Їх можна знайти, екстремізуючи кут між і враховуючи, що схожість косинуса між і є заданим значенням, скажімо, (де - кут між і ). Відповідь повідомляє нам, скільки кутMABMMAMBABcos(2ϕ)2ϕAB2ϕможливо , може бути зігнутий перетворенням .M

Розрахунки загрожують безладно. Деякі розумні варіанти позначення, а також деякі попередні спрощення, зменшують зусилля. Виявляється, рішення в двох вимірах розкриває все, що нам потрібно знати. Це відстежувана проблема, залежна лише від однієї реальної змінної , яка легко вирішується за допомогою методів обчислення. Простий геометричний аргумент поширює це рішення на будь-яку кількість вимірів .θn

Математичні передумови

За визначенням косинус кута між будь-якими двома векторами і отримують шляхом нормалізації їх до одиничної довжини та взяття їх добутку. Таким чином,AB

AB(AA)(BB)=cos(2ϕ)

і, записуючи , косинус кута між зображеннями і при перетворенні дорівнюєΣ=MMABM

(1)(MA)(MB)((MA)(MA))((MB)(MB))=AΣB(AΣA)(BΣB).

Зауважте, що в аналізі мають значення лише , аΣ не самТаким чином, ми можемо скористатися сингулярною декомпозицією величини (SVD) для спрощення проблеми. Нагадаємо, що це виражає як добуток (справа наліво) ортогональної матриці , діагональної матриці та іншої ортогональної матриці :MMMVDU

M=UDV.

Іншими словами, існує основа привілейованих векторів (стовпці ), на які діє, змінюючи масштаб кожного окремо за допомогою діагонального запису (який я називатиму ) , а потім застосовуючи обертання (або анти-обертання) до результату. Це остаточне обертання не змінить жодної довжини чи кутів, тому не повинно впливати на . Ви можете переконатися, що це формально з розрахункомe1,,enVMeiithDdiUΣ

Σ=MM=(UDV)(UDV)=VD(UU)DV=VD2V.

Отже, для вивчення ми можемо вільно замінити будь-якою іншою матрицею, яка створює однакові значення в . Замовивши так що зменшення розміру (і припускаючи не тотожне дорівнює нулю), вибір хороший з єΣM(1)eidiMM

M=1d1DV.

Діагональні елементи є(1/d1)D

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

Зокрема, вплив (будь то в його первісному чи зміненому вигляді) на всі кути повністю визначається тим, щоM

Mei=λiei.

Аналіз окремого випадку

Нехай . Оскільки зміна довжин векторів не змінює кут між ними, ми можемо вважати, що і є одиничними векторами. У площині всі такі вектори можуть бути позначені кутом, який вони роблять з , що дозволяє нам писатиn=2ABe1

A=cos(θϕ)e1+sin(θϕ)e2.

Тому

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(Дивіться рисунок нижче.)

Застосувати просто: він фіксує перші координати і і їх другі координати на . Тому кут від до дорівнюєMABλ2MAMB

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

Оскільки - неперервна функція, ця різниця кутів є безперервною функцією . Насправді він диференційований. Це дозволяє нам знайти крайні кути, перевіривши нулі похідної . Це похідне просто обчислити: це відношення тригонометричних функцій. Нулі можуть зустрічатися лише серед нулів його чисельника, тому не будемо намагатися обчислити знаменник. Ми отримуємоMθf(θ)

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

Особливі випадки , і легко зрозуміти: вони відповідають ситуаціям, коли має знижений ранг (і так розбиває всі вектори на лінію); де є кратним матриці ідентичності; і де і паралельні (звідки кут між ними не може змінюватися, незалежно від ). Випадок виключається умовою .λ2=0λ2=1ϕ=0MMABθλ2=1λ20

Крім цих особливих випадків, нулі трапляються лише там, де : тобто або . Це означає, що лінія, визначена розтинає кут . Тепер ми знаємо, що крайні значення кута між і повинні лежати серед значень , тому давайте обчислимо їх:sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)

f(0)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

Відповідні косинуси є

(2)cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2

і

(3)cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.

Часто достатньо зрозуміти, як спотворює прямі кути. У цьому випадку , що веде до , який ви можете підключити до попередніх формул.M2ϕ=π/2tan(ϕ)=cot(ϕ)=1

Зауважте, що чим менше стає, тим стають ці кути і тим більше спотворення.λ2

Малюнок, що показує чотири конфігурації

На цьому малюнку показано чотири конфігурації векторів і розділених кутом . Одиничне коло та його еліптичне зображення під затінені для відліку (з дією рівномірно змінено масштаб, щоб зробити ). На малюнку заголовки вказують значення , середню точку і . Найближчі будь-які такі і можуть прийти при перетворенні - конфігурація, подібна до лівої зAB2ϕ=π/3MMλ1=1θABABMθ=0. Найбільш віддаленою від них може бути конфігурація на зразок тієї, що знаходиться праворуч з . Показано дві проміжні можливості.θ=π/2

Рішення для всіх вимірів

Ми бачили, як діє, розширюючи кожен вимір на коефіцієнт . Це спотворить одиничну сферу в еліпсоїд. У визначення його головних осей. В відстань від початку координат, уздовж цих осей, до еліпсоїда. Отже, найменша, , - найкоротша відстань (у будь-якому напрямку) від початку до еліпсоїда, а найбільша - найдальша відстань (у будь-якому напрямку) від початку від еліпсоїда.Miλi{A|AA=1}eiλiλnλ1

У більш високих розмірах , і є частиною двовимірного підпростору. відображає одиничне коло в цьому підпросторі на перетин еліпсоїда з площиною, що містить та . Цей перетин, будучи лінійним викривленням кола, є еліпсом. Очевидно, що найдальша відстань до цього еліпса не більше а найкоротша відстань - не менше .n>2ABMMAMBλ1=1λn

Як ми спостерігали в кінці попереднього розділу, найбільш екстремальною є можливість, коли і розташовані в площині, що містить два з для яких співвідношення відповідних є якомога меншим. Це станеться в площині . У нас вже є рішення для цієї справи.ABeiλie1,en

Висновки

Крайності косинусної подібності, які можна досягти, застосувавши до двох векторів, що мають схожість на косинус , задаються формулами та . Вони досягаються, розміщуючи і під рівними кутами до напрямку, в якому максимально подовжує будь-який вектор (наприклад, напрямок ) і відокремлює їх у напрямку, в якому мінімально подовжує будь-який вектор ( наприклад, напрямок ).Mcos(2ϕ)(2)(3)ABΣ=MMe1Σen

Ці крайнощі можуть бути обчислені в термінах СВД з .M


Це фантастична відповідь! Дуже дякую за цю детальну дискусію! Я вважаю, що ви маєте помилку в знаку в eqn (3), де ви просто повинні мати загальний знак мінус.
LFH

Мене цікавить випадок, коли кут наближається до нуля, і я хотів би отримати нерівність між і . Чи правда, що виходячи з ваших обчислень, мені просто потрібно знайти найбільш крайні (що найменші) і в цьому випадку асимптотичну нерівність як ? 2ϕ2ϕfλn2λnϕf2λn1ϕϕ0
LFH

6

Вас, мабуть, цікавить:

(MA,MB)=AT(MTM)B,

Ви можете діагоналізувати (або, як ви його називаєте, PCA), що говорить про те, що подібність при перетворенні поводиться, проектуючи на основні компоненти, а згодом обчислення подібності в цьому новому просторі. Щоб розібрати це трохи більше, нехай головні компоненти будуть з власними значеннями . ТодіMTM=UΣUTA,BMA,Buiλi

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

що дає вам:

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

Зауважте, що тут відбувається масштабування: розтягуються / скорочуються. Коли - одиничні вектори, і якщо кожен , то відповідає обертанню, і ви отримуєте: , що є рівнозначно тому, що внутрішні продукти є інваріантними при обертаннях. Взагалі кут залишається таким же, коли - конформна трансформація, яка в цьому випадку вимагає, щоб було зворотним, а полярне розкладання задовольняло з , тобто .λiA,Bλi=1Msim(MA,MB)=sim(A,B)MMMM=OPP=aIMTM=a2I


1
Ваша початкова постановка проблеми нехтує нормалізацією векторів , , та необхідних для обчислення схожості косинусів. Не видається, що наступний аналіз також стосується цієї нормалізації. Зазначимо, зокрема, що схожість косинусу зберігається навіть тоді, коли всі власні значення знаходяться на рівні (позитивного) значення, що відрізняється від . Це навіть показує, що в цьому простому випадку можна сказати набагато більше. ABMAMB1
whuber

@whuber: подібність косинусу зберігається саме тоді, коли - конформна трансформація, яка в цьому випадку еквівалентна необхідності бути зворотним, а кратним тотожності. Іншим способом полярне розкладання задовольняє , де . Ви маєте рацію по приводу нормалізації , але, здається , безглуздо говорити про косинус схожості з не нормованими векторами . MMMTM=a2IMM=OPP=aIA,B
Алекс Р.

2
Зовсім не дурно! Оскільки ця «подібність» задана косинусом кута між векторами, має сенс будь-які два ненульові вектори. Що я мав в виду «набагато більше , можна сказати , " є те , що ефективні обмеження на кут між зображеннями і можуть бути отримані в термінах кута між і і власних . ABABM
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.