Теорема Адлемана про нескінченні півріччя?


13

Адлеман показав у 1978 році, що : якщо булева функція f з n змінних може бути обчислена імовірнісною булевою схемою розміром M , то f також може бути обчислена детермінованою булевою схемою розміру многочлен в M і n ; насправді, розміром O ( n M ) . BPPP/polyfnMfMnO(nM)

Загальне запитання: Над якими іншими (крім булевими) піврізами проводиться BPPP/poly ?

Якщо бути більш конкретним, імовірнісний ланцюг над семіруванням ( S , + , , 0 , 1 ) використовує свої операції "додавання" ( + ) та "множення" ( ) як ворота. Вхідні дані є вхідними змінними x 1 , ... , х п , і , можливо , деяка кількість додаткових випадкових величин, які приймають значення 0 і 1 незалежно один від одного з ймовірністю 1 / 2 ; тутC(S,+,,0,1)(+)()x1,,xn011/2 і 1 є, відповідно, адитивною та мультиплікативною тотожностями семірінгу. Така схема З обчислюєзадану функцію F : S пS , якщо для кожного х S п , Р г [ З ( х ) = е ( х ) ] 2 / 3 . 01C f:SnSxSnPr[C(x)=f(x)]2/3

Функція голосування від т змінних є частковою функцією, значення якого у якщо елемент у з'являється більш м / 2 рази серед у 1 , ... , у м , а не визначене , якщо такого елемента y не існує. Просте застосування меж Черноффа та союзу дає наступне.Maj(y1,,ym)myym/2y1,,ymy

Більшість Пастка: Якщо імовірнісний контур обчислює функцію F : S пS на кінцеве безлічі X S п , тобто м = O ( журнал | X | ) реалізації З 1 , ... , С м про З таким чином, що f ( x ) = M a j ( C 1 ( x ) , Cf:SnSXSnm=O(log|X|)C1,,CmC виконується для всіх х Х . f(x)=Maj(C1(x),,Cm(x))xX

Упродовж булевого семірування функція голосування є функцією більшості та має невеликі (навіть монотонні) кола. Отже, теорема Адлемана випливає, приймаючи X = { 0 , 1 } n . MajX={0,1}n

А як щодо інших (особливо нескінченних) піврічок? Що з арифметичним семіруванням (із звичайним складанням і множенням)?(N,+,,0,1)

Питання 1: Чи утримується над арифметичним семіруванням? BPPP/poly

Хоча я ставлю на "так", я не можу цього показати.

Зауваження: мені відомий цей документ, де автори стверджують, що над реальним полем ( R , + , , 0 , 1 ) . Вони мають справу з немонотонними арифметичними ланцюгами, а також надходять (у теоремі 4) до ланцюгів з функцією голосування M a j як вихідний затвор. Але як імітувати цей M a j -гайт арифметичним ланцюгом (будь він монотонним чи ні)? Тобто як отримати їх слідство 3?BPPP/poly(R,+,,0,1)MajMaj

Власне, наступний простий аргумент, який мені розповів Сергій Гашков (з Московського університету), здається, показує, що це неможливо (принаймні для схем, здатних обчислити лише поліноми ). Припустимо, ми можемо виразити як многочлен f ( x , y , z ) = a x + b y + c z + h ( x , y , z ) . Тоді f (Maj(x,y,z)f(x,y,z)=ax+by+cz+h(x,y,z) означає c = 0 , f ( x , y , x ) = x означає b = 0 , а f ( x , y , y ) = y означає a = 0 . Це справедливо тому, що над полями нульової характеристики рівність поліном-функцій означає рівність коефіцієнтів. Зауважимо, що у питанні 1 діапазон ймовірнісних схем, а значить, і область Mf(x,x,z)=xc=0f(x,y,x)=xb=0f(x,y,y)=ya=0 -gate єнескінченним. Тому у мене складається враження, що зв'язаний документ має справу лише з обчислювальними функціями арифметичних схем f : R nY з невеликими кінцевими діапазонами Y , як Y = { 0 , 1 } . Тоді M a j : Y mY насправді легко обчислити арифметичним контуром. Але що робити, якщо Y = R ? Majf:RnYYY={0,1}Maj:YmYY=R


Виправлення [6.03.2017]: Паскаль Койран (один з авторів цього документу) вказував мені, що їх модель є більш потужною, ніж просто арифметичні схеми: вони дозволяють вхідні ворота (виводити або 1 залежно від того, чи вхід негативний ні). Отже, функцію голосування Майж можна моделювати в цій моделі, і я повертаю свою «плутанину».01


( N{ - } , max , + , - , 0 )(N{+},min,+,+,0)(N{},max,+,,0)

Питання 2: Чи зберігає тропічні піврінги? BPPP/poly

Утримувати у цих двох семирінгах, це означатиме, що випадковість не може прискорити так звані "чисті" алгоритми динамічного програмування! Ці алгоритми використовують лише операції Min / Max та Sum у своїх рекурсіях; Беллмана-Форд, Флойд-Воршалл, утримувані Карпи, і багато інших алгоритми видатним DP є чистими. BPPP/poly

Поки що я можу відповісти на запитання 2 (ствердно) лише за сценарієм односторонньої помилки, коли ми додатково вимагаємо протягом min- плюс семірінг (мінімізація) або за семімінг max-plus (максимізація). Тобто зараз ми вимагаємо, щоб рандомізований тропічний контур ніколи не міг отримати кращого за оптимальне значення; однак це може помилитися, подавши деякі гірші, ніж оптимальні значення. Мої запитання, однак, під сценарієм двосторонньої помилки .P r [ C ( x ) > f ( x ) ] = 0Pr[C(x)<f(x)]=0Pr[C(x)>f(x)]=0


PS [додано 27.02.2017]: Ось моя спроба відповісти на питання 1 (ствердно). Ідея полягає у поєднанні найпростішої версії "комбінаторного Nullstellensatz" з оцінкою проблеми Заранкевича для n-партійних гіперграпів, завдяки Ердосу та Спенсеру. Модулюючи цей останній результат, весь аргумент елементарний.

Зауважимо, що питання 2 все ще залишається відкритим: "наївний Nullstellensatz" (принаймні у формі, яку я використав) не втримується в тропічних півколах.


nit: BPP - це рівномірний клас, визначений за допомогою PTM, не схем.
Каве

@Kaveh: так, в цьому сенсі результат Адлемана ще трохи сильніший, він справедливий навіть для BPP / poly.
Стасіс

Не бачите, як простий аргумент показує неможливість ... це здається, що коефіцієнти одночленів x, y і z повинні бути нульовими ... що я пропускаю? Крім того, якщо многочлен не може обчислити Maj, як ще можна представити обчислення через семімінг? (Що ще, крім полінома над семіруванням?) Інтуїтивно, над нескінченним доменом кожне обмеження на деякий y (примушуючи, що на> m / 2 y ви повинні вивести y) здається "незалежним" від інших (жоден підмножина обмежень не передбачає інший), тому здається, що жоден "кінцевий" поліном не міг би задовольнити нескінченно багато незалежних обмежень.
Райан Вільямс

@Ryan: так, це показує лише, що f = Maj означає h = Maj. Але h має ступінь> 1, тому h (x, x, z) = x неможливо. І ви маєте рацію: схеми над півколами не можуть обчислити нічого іншого як поліноми. Отже, вони не можуть обчислити майстер. Але автори цього документу мають справу з ланцюгами {+, x, -, /} з дозволеними всіма польовими операціями. Можливо, тоді Майж ще можна якось обчислити? (Я, однак, не бачу, як.) Btw замість того, щоб намагатися імітувати сам Maj, можна було відповісти на Q1 і Q2, показавши, що один Maj-gate не може істотно зменшити розмір схеми (що цілком правдоподібно).
Стасіс

@ Ryan: PS Ігор Сергєєв зауважив, що Maj "може" бути ймовірним для обчислення (R, +, x, -, /). Наприклад, Maj (x, y, z) обчислюється по f (x, y, z) = (xy + xz-2yz) / (2x-yz) для всіх входів з | {x, y, z} | = 2. Зауважимо, що простий аргумент, викладений вище, означає, що вже на таких входах це неможливо зробити надто (R, +, x, -). Отже, поділ може допомогти. Але ми стикаємося з розділенням по 0 випуску ...
Стасіс

Відповіді:


3

Це лише часткова відповідь на ваше загальне запитання (я не впевнений, якою була б цілком загальна формулювання), але це дозволяє припустити, що робота над досить приємними нескінченними семирінками при обмеженні випадковості до кінцевої області може фактично тривілізувати питання про те Теорема Адлемана справедлива.

Припустимо, ви працюєте над складними числами , щоб схеми обчислити поліноми над цим полем, і припустимо, що функція сама обчислюється деяким многочленом (хоч і складним) з змінних . Тоді виявляється, що вже для деякого фіксованого , . Причина полягає в тому, що для кожного множина з визначає замкнутий Заріскі підмножина , і таким чином повинно бути все , інакше підмножина міри нуль. Якщо б усі ці множини мали міру нуля, то, оскільки є лише кінцево багато f x r C ( x , r ) = f ( x ) r x C ( x , r ) = f ( x ) C n C n r x r : C ( x , r ) = f ( x ) C f З нCfxrC(x,r)=f(x)rxC(x,r)=f(x)CnCnrЗважаючи на те, множина де , також мала б міру нуля. З іншого боку, припущення, що обчислює означає це, що множина повинна бути всім , тому воно не може мати міру нуля.xr:C(x,r)=f(x)CfCn


Цікаво. Більш загально, ймовірнісна схема розміру M - деяка випадкова величина C, що приймає її значення у множині всіх схем (цього типу), що мають щонайбільше M воріт. [Btw, що папір Cucker у співавт. дозволяє C довільно розподілятися. Стиль "хитрість більшості" працює.] Чи можу я зробити висновок із вашого аргументу, що якщо діапазон С є кінцевим, то теорема Адлемана тривіальна, коли закриті підмножини Зарінського є тривіальними (самі множини) або мають нульову міру? Чи маємо ми це - "все чи нічого" - ефект у тропічних піврічках? (Мене вони в основному цікавлять.)
Стасіс

Я не знаю, як і чи узагальнився б аргумент на інші півріччя, вибачте. Одне головне, чого не вистачає (для мене) - це геометрична інтуїція, схожа на те, як "многочлени, які не згодні", перекладаються на "підмножини вимірювання-нуль ". Зокрема, для тропічних півколів операції здаються настільки відмінними від звичайних многочленів, що важко навіть здогадатися, якою має бути відповідна адаптація. Cn
Ендрю Морган
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.