Безплідні плато в квантових ландшафтах навчань нейронної мережі


9

Тут автори стверджують, що зусилля по створенню масштабованої квантової нейронної мережі за допомогою набору параметризованих воріт вважаються невдалими для великої кількості кубітів. Це пов'язано з тим, що завдяки лемі Леві градієнт функції у просторових просторах скрізь майже дорівнює нулю.

Мені було цікаво, чи можна цей аргумент застосувати і до інших гібридних методів квантово-класичної оптимізації, таких як VQE (Variational Quantum Eigensolver) або QAOA ( Algorithm Quantum приблизної оптимізації).

Як ти гадаєш?


"з використанням набору параметризованих воріт" Який набір? Чи випадково це випадково?
rrtucci

Статтю написав Джаррод МакКлін, який також є піонером VQE. Я думаю, Jarrod не вірить, що VQE вважається невдалим для більшої кількості кубітів. Я думаю, що ваш опис леми Леві трохи відрізняється від того, що пропонує документ. Ви говорите, що "градієнт функції у просторах високих розмірів скрізь майже дорівнює нулю", але в статті йдеться лише про те, що це стосується конкретного контексту QNN, описаного в роботі.
користувач1271772

Щоб детальніше зупинитися на моєму останньому коментарі: можна просто побудувати функцію великого розміру, яка дуже швидко змінюється скрізь, вона не матиме градієнта «майже нуля» скрізь. Висновок, що ґрунтується на лемі Леві в роботі, полягає в тій конкретній функції, яку вони оптимізують, а не для "будь-якої" функції у просторовому просторі.
користувач1271772

1
@asdf: Провівши більшу частину дня, дивлячись на папери, я нарешті придумав відповідь для вас. Поглянь.
користувач1271772

Відповіді:


4

По-перше : у статті згадуються [ 37 ] леми Леві, але ви не знайдете згадки про «лему Леві» в [37]. Ви виявите , що називається «Нерівність Леві», який називається леммой Леві в цьому , який НЕ цитується в статті ви згадуєте.

По-друге : Існує простий доказ того, що ця вимога є хибною для VQE. У квантовій хімії ми оптимізуємо параметри ансацу хвилі|Ψ(p)щоб отримати найнижчу (тобто найбільш точну) енергію. Енергія оцінюється:

Еp=Ψ(p)|Н|Ψ(p)Ψ(p)|Ψ(p).

VQE просто означає, що ми використовуємо квантовий комп'ютер для оцінки цієї енергії, а класичний комп'ютер для вибору способів покращення параметрів p щоб енергія була нижчою при наступній квантовій ітерації.

Тож чи буде "градієнт" чи ні, буде 0 майже скрізь, коли кількість параметрів у pвеликий ", зовсім не залежить від того, ми використовуємо VQE (на квантовому комп'ютері) або просто запускаємо стандартну програму квантової хімії (наприклад, Гауссана ) на класичному комп'ютері. Квантові хіміки, як правило, варіативно оптимізують вищезазначену енергію до1010 параметри в p, і єдина причина, що ми не виходимо за рамки цього, це тому, що у нас закінчується оперативна пам’ять, а не тому, що енергетичний пейзаж починає ставати рівним. У цій роботі ви бачите в кінці реферату, що вони обчислили енергію для хвильової функції з про1012параметри , де параметри є коефіцієнтами детермінантних схилів. Загальновідомо, що енергетичний ландшафт не настільки рівний (як це було б, якби градієнт був майже 0 скрізь), навіть коли є трильйон параметрів або навіть більше.

Висновок : застосування леми Леві залежатиме від конкретного енергетичного ландшафту, який у вас є, і залежатиме від обох Н і твій ансац |Ψ(p). У випадку їх конкретного впровадження QNN вони знайшли застосування леми Леві доцільним. У випадку з VQE ми маємо контрприклад твердження про те, що лема Леві "завжди" застосовується. Приклад зустрічного, коли лема Леві не застосовується - це колиНє молекулярним гамільтонієм і|Ψє хвильовою функцією CI .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.