Поясніть тензорну інтерпретацію статті Деолілікара Гурвіца


20

[Примітка. Я вважаю, що це питання жодним чином не залежить від правильності чи некоректності статті Деолалікара.]

У блозі Скотта Ааронсона Shtetl Optimized , під час дискусії про недавню спробу Деолалікара на П проти НП, Леонід Гурвіц зробив наступний коментар :

Я намагався зрозуміти / переформулювати підхід, і ось моя, можливо, дуже мінімалістична спроба: дискретні ймовірнісні розподіли в роботі можуть розглядатися як тензори, або дуже спеціальні багатолінійні многочлени. Припущення "P = NP" якимось чином дає (полінома?) Верхню межу тензорного рангу. І нарешті, використовуючи відомі ймовірнісні результати, він отримує незрівнянну (експоненціальну?) Нижню межу того ж рангу. Якщо я маю рацію, то цей підхід є дуже розумним, в хорошому сенсі елементарним, способом просунути попередні алгебраїко-геометричні підходи.

Незважаючи на підозрювані / відомі вади у доказі Деолікаліка, мені цікаво:

Яким способом можна розглядати розподіли, обговорені в статті Деолікаліка, як тензори, і як твердження про його результати (незалежно від їх правильності) перетворюються на твердження про тензорні ранги?


Щойно це побачив. Чому б не запитати самого Гурвіца? ...
Райан Вільямс

1
@Ryan: Я так і зробив :). Він швидко відповів, що зараз зайнятий, але напевно дістанеться до цього врешті. Минув час, і я сподівався, що хтось тут зможе швидше з'ясувати це зауваження.
Джошуа Грохов

Відповіді:


10

[Я читав щось, що мені здавалося абсолютно не пов'язаним, а потім мав "ага момент", тому я думаю, що я зрозумів принаймні частину відповіді. Я не впевнений, що це на увазі Гурвітс, але це має для мене сенс.]

Розподіл на n двійкових змінних можна розглядати як елемент тензорного добутку (n факторів) ( насправді пов'язаний проективний простір, але ми дістанемося до цього). Якщо ми позначимо основні елементи кожної копії за таR 2R 2 R 2 | 0 | 1 х1,...,хнR2R2R2|0|1, то основа цього простору тензорного продукту задається набором усіх n-бітних рядків. Якщо у нас є елемент цього тензорного добутку, коефіцієнти якого дорівнюють 1, то ми можемо інтерпретувати коефіцієнт будь-якого заданого n-бітного рядка як ймовірність виникнення цієї рядки - звідси, розподіл ймовірності! Тепер, оскільки ми хочемо лише розподілу ймовірностей (коефіцієнти, що дорівнюють 1), ми можемо нормалізувати будь-який вектор тензорного добутку, щоб мати цю властивість. Розглядаючи лише нормалізовані тензори, ми дійсно лише розглядаємо елементи проективного простору цього тензорного добутку.

Тепер ми повинні підключити тензор-рангову до поняття Деолікаліка про полілогічну параметризаційність. Відповідно до цієї сторінки Террі Тао, схоже, що поняття Деолікарика щодо полілогічно-параметризованості полягає в тому, що розподіл може бути "враховано в потенціалах" як де pa (i) - це набір змінних polylog (n), визначених як "батьки i" та - це розподіл на який залежить лише від цих батьківських змінних. Більше того, спрямований графік батьків повинен бути ациклічним.ц ( х 1 , . . . , х п ) = Π п я = 1 р я ( х я ; х р ( я ) ) р я ( - ; х р ( я ) ) х ямкмк(х1,...,хн)=i=1нpi(хi;хpа(i))pi(-;хpа(i))хi

Почнемо з дуже простого типу розподілу. Припустимо, задовольняє для деяких розподілів (де залежить лише від ). Тоді, сподіваємось, зрозуміло, що відповідним тензором є тензор рангу 1: .ц ( х 1 , . . . , х п ) = Π п я = 1 р я ( х я ) р я р я х я ( р 1 ( 0 ) | 0 + р 1 ( 1 ) | 1 ) ( p n ( 0 ) | 0мкмк(х1,...,хн)=i=1нpi(хi)pipiхi(p1(0)|0+p1(1)|1)(pн(0)|0+pн(1)|1)

Для трохи складнішого розподілу, припустимо, ми хочемо розглянути рівномірний розподіл по рядках, де (вони є запереченням один одного) для всіх . У інтерпретації Дао деолалікарською мовою Дао це був би параметризаційний розподіл . Тоді це відповідає тензору (потребує нормалізації). Якщо ми випишемо це повністю, він містить термінів, і тому тензорний ранг має щонайбільше над . Однак, над я Про ( 1 ) ( | 0 | 1 + | 1 | 0 ) ( | 0 | 1 + | 1 | 0 ) 2 п / 2 2 п / 2х2i=1-х2i+1iО(1)(|0|1+|1|0)(|0|1+|1|0)2н/22н/2R2R2R2 , він має тензор-ранг 1! Я вважаю, що останній факт відповідає тому, що факторизація може бути описана числами - для кожної пари сусідніх біт, для кожної з сусідніх пар. Значно менші, ніж дійсних чисел, необхідних теоретично для довільного розподілу mu на булевій кубі.О(н)О(1)О(н)2н

У мене все ще виникають проблеми з формулюванням двох питань, і я буду вдячний за подальші відповіді на них:

  • Зробити останню кореспонденцію точною
  • Списання формул для тензора, що відповідає полілогічно-параметризованому розподілу, та отримання верхньої межі його ранжу.

ви коли-небудь поверталися до цього?
Т ....
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.