Чи можливо прискорити генерацію вагової матриці за допомогою квантового алгоритму?


9

У цій роботі [1] на сторінці 2 вони згадують, що вони генерують матрицю зважування наступним чином:

W=1Md[m=1m=Mx(m)(x(m))T]Idd

де 'є -вимірні навчальні зразки (тобто де ), і є загалом навчальних зразків. Таке покоління зважувальної матриці, що використовує множення матриці з подальшим сумою на термінів, здається, є дорогою операцією за часовою складністю, тобто я думаю, що навколо (?).x(m)dx:={x1,x2,...,xd}Txi{1,1}  i{1,2,...,d}MMO(Md)

Чи існує який-небудь квантовий алгоритм, який може запропонувати істотне прискорення для генерації матриці зважування? Я вважаю, що їх основна швидкість походить від алгоритму інверсії квантової матриці (про який згадується пізніше у статті), але вони, схоже, не враховували цей аспект генерації зважувальної матриці.

[1]: Квантова нейронна мережа Хопфілда Ллойд та ін. (2018)

Відповіді:


5

Беручи матрицю щільності багато деталей містяться в наступному параграфі на сторінці 2:

ρ=W+Idd=1Mm=1M|x(m)x(m)|,

Важливим для квантових адаптацій нейронних мереж є класичне зчитування моделей активації від квантового кванту. У нашому налаштуванні читання за схемою активації означає підготовку квантового стану . Це, в принципі, може бути досягнуто за допомогою розвиваючих методів квантової пам'яті з випадковим доступом (qRAM) [33] або ефективної підготовки квантового стану, для якої існують обмежені, засновані на оракулі результати [34]. В обох випадках обчислювальні накладні є логарифмічними з точки зоруx|xd. Можна альтернативно адаптувати повністю квантову перспективу і приймати схеми активації безпосередньо з квантового пристрою або як вихід квантового каналу. Для перших, час нашої підготовки є ефективним, коли квантовий пристрій складається з кількох воріт масштабування максимум поліноміально з кількістю кубітів. Натомість для останнього ми зазвичай розглядаємо канал як деяку форму взаємодії з фіксованою системою та середовищем, яка не потребує обчислювальних накладних витрат.|x

Посилання у вищенаведеному:

[33]: В. Джованнетті, С. Ллойд, Л. Маккоун, Квантова пам'ять з випадковим доступом, Фізичні оглядові листи 100, 160501 (2008) [ PRL посилання , посилання arXiv ]

[34]: А. Н. Соклаков, Р. Шак, Ефективна підготовка держави до реєстру квантових бітів, Фізичний огляд A 73, 012307 (2006). [ АРП посилання , Arxiv посилання ]


Не вдаючись до деталей того, як обидва вищезазначені дійсно є схемами відповідно до реалізації ефективної qRAM; та ефективна підготовка держави, яка відтворює державу|x вчасно O(log2d).

Однак це дістається нам лише поки: це можна використовувати для створення держави ρ(m)=|x(m)x(m)|, тоді як ми хочемо суму за все можливе m's.

Принципово важливо, ρ=mρ(m)/M є змішаним, тому не може бути представлений єдиним чистим станом, тому друга з вищезгаданих двох посилань на відтворення чистих станів не застосовується, а перша вимагає, щоб стан вже було в qRAM.

Автори роблять одне з трьох можливих припущень:

  1. У них є пристрій, який так відбувається, щоб дати їм правильний стан введення

  2. Вони або мають штати ρ(m) в qRAM,

  3. Вони здатні створити ці стани за бажанням, використовуючи другу з вищезазначених посилань. Потім змішаний стан створюється за допомогою квантового каналу (тобто повністю позитивної карти збереження слідів (CPTP)).

Забувши на даний момент про перші два з перерахованих вище варіантів (перший все-таки магічно вирішує проблему), канал може бути:

  • інженерно розроблена система, в якій вона буде створена для конкретного примірника у чомусь подібному до аналогового моделювання. Іншими словами, у вас є фізичний канал, який займає фізичний проміжок часуt(на відміну від певної часової складності). Це "взаємодія з фіксованою системою та середовищем, яка не потребує здійснення обчислювальних витрат".

  • Сам канал моделюється. Про це є декілька статей, наприклад, приблизне моделювання квантових каналів Бені та Орешкова ( посилання arXiv - це виглядає як ретельний документ, але я не міг знайти тверджень про складність часу), Lu et. експериментальне моделювання квантових каналів ін. (здається, що версія arXiv не існує) та додрук археїв Вей, Сіна та Лонга. Ефективне універсальне моделювання квантових каналів у хмарному квантовому комп'ютері IBM , яке (для кількості кубітівn=log2d) дає часову складність O((8n3+n+1)42n). Можна застосовувати також розширювальну стрічку, складність якої становитьO(27n343n).


Тепер, розглядаючи варіант 2 1 , одним з можливих більш ефективних методів було б перенесення станів з адресного регістра в регістр даних звичайним методом: для адрес в регістріa, jψj|ja, перенесення цього до реєстру даних дає стан у регістрі даних d як jψj|ja|Djd. Потрібно мати можливість просто прикрасити адресу та реєстр даних, щоб перетворити це в змішаний стан, надаючи невеликі накладні витрати, хоча без додаткових обчислювальних складностей накладні витрати, що дають значно покращену складність виробництваρ, заданий qRAM зі станами |x(m), оф O(n). У цьому полягає і складність створення держав|x(m) в першу чергу, даючи потенційну (значно покращену) складність виробництва ρ з O(n).

1 Дякуємо @glS за вказівку цієї можливості у чаті


Ця матриця щільності потім подається в 'qHop' (квантовий Хопфілд), де вона використовується для імітації eiAt для

A=(WγIdPP0)
відповідно до підрозділу " Ефективне гамільтонове моделювання A " на сторінці 8.

так само невелика примітка про вашу редагування: вам не потрібно «декорувати» адресний реєстр або робити щось взагалі насправді. Простий факт його використання робить вміст реєстру даних невідрізним від суміші різних|Dj
glS
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.