Який мінімум для всіх розподілів одиничних векторів дисперсії крапкового добутку векторів?


10

Я намагаюся знайти розподіл по випадкових векторів, скажімо , на -вимірній сфері одиниці (де ), яка мінімізує умови обмеження \ mathbb {E} [x_i ^ Tx_j] = 0 .nx1,,xnkn>kE [ x T i x j ] = 0maxijVar(xiTxj)E[xiTxj]=0

Я спробував деякі дистрибуції, і майже всі вони мають дисперсію 1/k . Наприклад, як розподіл, у якому кожна координата кожного xi незалежно і рівномірно вибирається з {1/k,1/k} і розподіл, у якому кожен xi є незалежним рівномірним вектором на k -вимірній кулі одиниці мають дисперсію 1/k .

Чи є 1/k мінімальна дисперсія серед усіх розподілів?


Наскільки щільна обв’язка вас цікавить? Тобто, чи буде цікава нижня межа 1 / 100k, яка працює лише для n> 100k, чи ні?
daniello

@daniello, ти маєш на увазі нижню межу 1 / ck для n> ck, де c деяка константа? Як це довести?
пенг

Щось я не розумію у питанні: на початку ви говорите про розподіл по одиничних векторах, але не всі дистрибутиви, які ви кажете, що ви намагалися генерувати одиничні вектори ... Ви маєте на увазі це для всіх , ? E [ | х i | ] = 1xiE[|xi|]=1
daniello

@deniello, я мав намір зробити всі вектори "одиничними". Вибачте, я забув зробити нормалізацію на "гауссовому" векторі, після нормалізації це буде те саме, що і рівномірний вектор. Дякую, що вказали на цю помилку.
пенг

Відповіді:


8

Я представлю рівнозначну, але простішу формулювання задачі та покажу нижню межу ( n / k - 1) / ( n −1). Я також показую зв’язок із відкритою проблемою у квантовій інформації. [Редагувати у версії 3: У попередніх редакціях я стверджував, що точна характеристика випадків, у яких досягається нижня межа, показана нижче, ймовірно, буде складною, оскільки аналогічне запитання у складному випадку включає відкриту проблему щодо SIC-POVM у квантова інформація. Однак цей зв'язок із SIC-POVM був неправильним. Докладніше див. У розділі "Неправильне підключення до SIC-POVM в квантовій інформації" нижче.]

Еквівалентна рецептура

По-перше, як уже вказувалося у відповіді Даніелло, зауважте, що Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Тож у решті відповіді ми забуваємо про дисперсію і замість цього мінімізуємо max ij E [( x i T x j ) 2 ].

Далі, як тільки ми вирішимо, що наша мета - мінімізувати max ij E [( x i T x j ) 2 ], ми можемо ігнорувати обмеження, що E [ x i T x j ] = 0. Це тому, що якщо у нас є випадкові одиничних векторів x 1 ,…, x n , тоді ми можемо заперечити кожен з них незалежно з ймовірністю 1/2, щоб задовольнити E [ x i T x j ] = 0, не змінюючи значення цільової функції max ij E [( x i T x j) 2 ].

Крім того, зміна цільової функції з max ij E [( x i T x j ) 2 ] на (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] не змінює оптимальне значення. Остання є щонайбільше першою, оскільки середня максимальна. Однак ми завжди можемо зробити значення E [( x i T x j ) 2 ] для різних варіантів ( i , j ) ( ij ) дорівнює перестановці n векторів x 1 ,…, x n випадковим чином.

Отже, для будь-яких n та k оптимальне значення розглянутої задачі дорівнює мінімуму (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ], де x 1 ,…, x n - випадкові величини, які приймають одиничні вектори в ℝ k як значення.

Однак за лінійністю очікування ця цільова функція дорівнює очікуваному значенню E [(1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 ]. Оскільки мінімум становить максимум середній показник, більше не потрібно розглядати розподіл ймовірностей. Тобто, оптимальне значення вищезазначеної задачі дорівнює оптимальному значенню наступного:

Виберіть одиничні вектори x 1 ,…, x n ∈ ℝ k, щоб мінімізувати (1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 .

Нижня межа

Використовуючи цю еквівалентну рецептуру, ми доведемо, що оптимальне значення становить щонайменше ( n / k - 1) / ( n −1).

Для 1≤ in , нехай X i = x i x i T є проектором рангу 1, відповідним одиничному вектору x i . Тоді справедливо, що ( x i T x j ) 2 = Tr ( X i X j ).

Нехай Y = ∑ i X i . Тоді встановлено, що ∑ ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .

З нерівності Коші-Шварца випливає, що Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , а отже ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) - nn 2 / к - н . Ділячи на n ( n −1), отримуємо, що об'єктивне значення принаймні ( n / k - 1) / ( n −1).

Зокрема, коли n = k +1, відповідь Даніелло знаходиться в коефіцієнті 2 від оптимального значення.

Коли ця нижня межа досяжна?

Досягнувши цей нижню межу ( п / K - 1) / ( п -1) еквівалентно роблячи Y = ( п / к ) Я . Я не знаю точної характеристики, коли вона досяжна, але існують наступні умови:

  • Коли n = k +1, це можна досягти, розглядаючи k +1 одиничні вектори, які утворюють правильний k -простий з центром у початку, покращуючись від 2 / ( k ( k +1)) у відповіді Даніелло на оптимальний 1 / k 2 .
  • При п кратно до , то, очевидно , можна досягти шляхом фіксації ортогонального базису ℝ до і присвоєння кожному з базисних векторів в п / к в про 1 , ..., V н .
  • Більш загально, ніж остання точка кулі, якщо вона досяжна з деяким вибором k і обох n = n 1, так і n = n 2 , то вона також досяжна для того ж k і n = n 1 + n 2 . Зокрема, це можна досягти, якщо n = a k + b, де a і b цілі числа, що задовольняють ab ≥0.

Хоча я ще не перевіряв деталі, здається, що будь-яка сферична 2-конструкція дає рішення для досягнення цієї нижньої межі.

Неправильне підключення до SIC-POVM в квантовій інформації

У попередніх редакціях я заявляв:

Я підозрюю, що відповісти на це повністю - важке питання. Причина полягає в тому, що якщо ми замість цього розглянемо складний векторний простір ℂ k , це питання пов'язане з відкритою проблемою у квантовій інформації.

Але це відношення було неправильним. Я поясню, чому.

Точніше, розглянемо таку проблему:

Виберіть одиничні вектори x 1 ,…, x n ∈ ℂ k, щоб мінімізувати (1 / ( n ( n −1))) ∑ ij | x i * x j | 2 .

Нижня межа вище однаковою мірою є у цій складній версії. Розглянемо випадок, коли n = k 2 у складному варіанті. Тоді нижня межа дорівнює 1 / ( k +1).

Поки це було правильно.

Набір k 2 одиничних векторів x 1 ,…, x k 2 ∈ ℂ k, що досягають нижньої межі, називається SIC-POVM в розмірі k ,

Ця частина була неправильною. SIC-POVM - сукупність k 2 одиничних векторів x 1 ,…, x n ∈ ℂ k, для яких | x i * x j | 2 = 1 / ( k +1) для всіх ij . Зауважимо, що тут вимога повинна дотримуватися для всіх пар ij , а не лише середнього рівня для всіх пар ij . У розділі «Еквівалентна рецептура» ми показали еквівалентність між мінімізацією максимуму та мінімізацією середнього, але це було можливим, оскільки x 1,…, X n були випадковими змінними, що приймали туди одиничні вектори. Тут x 1 ,…, x n - просто одиничні вектори, тому ми не можемо використовувати один і той же трюк.


5

Швидка і брудна відповідь на питання "ні, дисперсія може бути меншою": Нехай є стандартною базою, і розглянемо наступний випадковий процес: виберіть пару різних цілих чисел i, j від і встановіть . Для інших векторів (для ) призначте їх однозначно. Тоді для кожного або збережіть таким, яким він є, або переверніть його (на ) з ймовірністю .v1,v2,,vk{1,2,,k+1}xi=xj=v1xtt{i,j}v2,,vkt{1,,k+1}xixi12

Неважко помітити, що - або і є ортогональними, або вони вказують в одному / протилежному напрямку з ймовірністю кожен.x a x b 1E[xaxb]=0xaxb12

З іншого боку, у нас . Маємо це якщо і лише тоді, коли що відбувається з імовірністю . Інакше . Таким чином, ми маємо, що для кожного , : ( x ax b ) 2 = 1 { a , b } = { i , j }Var[xaxb]=E[(xaxb)2](xaxb)2=1{a,b}={i,j} (xaxb)2=0abVar[xaxb]=E[(xaxb)2]=11(k+12)(xaxb)2=0ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

Моя інтуїція полягає в тому, що це так само погано (мало), як це стає, але я не маю доказів. Більш цікавим є те, що ця конструкція, здається, руйнується при n >> k, а також тоді, коли доводиться вибирати самостійно (можливо, з різних розподілів).xi

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.