Міцність розщеплення хунти


16

Ми говоримо, що булева функція є -junta, якщо має максимум впливає на змінні.f : { 0 , 1 } n{ 0 , 1 } f:{0,1}n{0,1}k kf fkk

Нехай - -'юнта. Позначимо змінні через . Виправити Зрозуміло, що існує такий, що містить принаймні впливних змінних .f : { 0 , 1 } n{ 0 , 1 } f:{0,1}n{0,1}2 k 2kf fx 1 , x 2 , , x n x1,x2,,xnS 1 = { x 1 , x 2 , , x n2 },S 2 = { x n2 +1,xn2 +2,,xn}.

S1={x1,x2,,xn2},S2={xn2+1,xn2+2,,xn}.
S{S1,S2}S{S1,S2}SSkkff

Тепер нехай , і припустимо, що f: \ {0,1 \} ^ n \ to \ {0,1 \} є \ epsilon -далеко від кожного 2k -junta (тобто треба змінити частку принаймні \ epsilon значень f для того, щоб зробити його 2k -junta). Чи можемо ми зробити «надійну» версію заяви вище? Тобто чи є універсальна константа c , а безліч S \ in \ {S_1, S_2 \} така, що f є \ frac {\ epsilon} {c} -далеч від кожної функції, яка містить щонайбільше k змінних змінних у S ?ϵ > 0 ϵ>0f : { 0 , 1 } n{ 0 , 1 } f:{0,1}n{0,1}ϵ ϵ2 k 2kϵ ϵf f2 k 2kc cS { S 1 , S 2 } S{S1,S2}f fϵcϵc kkSS

Примітка. У початковій постановці питання було зафіксовано як . Приклад Ніла показує, що такого значення недостатньо. Однак, оскільки при тестуванні власності ми зазвичай не надто переймаємося константами, я трохи полегшив стан.cc22cc


Чи можете ви уточнити свої умови? Чи змінна "впливає", якщо значення f завжди не залежить від змінної? Чи означає "зміна значення ", чи змінює одне із значень для якогось конкретного ? fff(x)f(x)xx
Ніл Янг

Звичайно, змінна впливає, якщо існує бітна рядок така, що , де - рядок y з перевернутою i 'й координатою. Зміна значення f означає змінити його таблицю істинності. xixinnyyf(y)f(y)f(y)f(y)yyyif

Відповіді:


17

Відповідь - так. Доказ - протиріччя.

Для наочної зручності позначимо першу n / 2n/2 змінної через x,x а другу n / 2n/2 змінну yy . Припустимо , що п ( х , у )f(x,y) є δδ -блізко до функції F 1 ( х , у )f1(x,y) , яке залежить тільки від Kk координат хx . Позначимо його впливові координати через T 1T1 . Аналогічно припустимо, що f ( x , y )f(x,y) єδδ -закрийте функцію f 2 ( x , y ),f2(x,y) яка залежить лише від kk координат yy . Позначимо його впливові координати за допомогою T 2T2 . Нам потрібно довести, що ff дорівнює 4 δ4δ - близький до 2 k2k -junta ˜ f ( x , y )f~(x,y) .

Скажемо, що ( x 1 , y 1 ) ( x 2 , y 2 ),(x1,y1)(x2,y2) якщо x 1x1 і x 2x2 узгоджуються всі координати в T 1,T1 а y 1y1 і y 2y2 узгоджуються з усіма координатами в T 2T2 . Ми вибираємо рівномірно випадкового представника з кожного класу еквівалентності. Нехай ( ˉ x , ˉ y )(x¯,y¯) є представником для класу ( x ,у )(x,y) . Визначте ˜ ff~ так: ˜ f ( x , y ) = f ( ˉ x , ˉ y ) .

f~(x,y)=f(x¯,y¯).

Очевидно, що ˜ ff~ - 2 k2k -junta (це залежить лише від змінних у T 1T 2 )T1T2) . Доведемо, що воно на відстані 4 δ4δ від ff в очікуванні.

Хочемо довести, що Pr ˜ f ( Pr x , y ( ˜ f ( x , y ) f ( x , y ) ) ) = Pr ( f ( ˉ x , ˉ y ) f ( x , y ) ) 4 δ , де x і y вибираються рівномірно випадково. Розглянемо випадковий вектор

Prf~(Prx,y(f~(x,y)f(x,y)))=Pr(f(x¯,y¯)f(x,y))4δ,
xy˜ x, отриманий зx, зберігаючи всі біти вT1і випадковим чином перевертаючи всі біти не вT1, а вектор ˜ y визначений аналогічно. Зауважимо, що Pr( ˜ f (x,y)f(x,y))=Pr(f( ˉ x , ˉ y )f(x,y))=Prx~xT1T1y~( f ( ˜ x , ˜ y ) f ( x , y ) ) .
Pr(f~(x,y)f(x,y))=Pr(f(x¯,y¯)f(x,y))=Pr(f(x~,y~)f(x,y)).

Маємо, Pr ( f ( x , y ) f ( ˜ x , y ) ) Pr ( f ( x , y ) f 1 ( x , y ) ) + Pr ( f 1 ( x , y ) f 1 ( ˜ x , y ) ) + Pr ( f1 ( ˜ x , y ) f ( ˜ x , y ) ) δ + 0 + δ = 2 δ .

Pr(f(x,y)f(x~,y))Pr(f(x,y)f1(x,y))+Pr(f1(x,y)f1(x~,y))+Pr(f1(x~,y)f(x~,y))δ+0+δ=2δ.

Аналогічно, Pr ( f ( ˜ x , y ) f ( ˜ x , ˜ y ) ) 2 δ . Маємо Pr ( f ( ˉ x , ˉ y ) f ( x , y ) ) 4 δ . QEDPr(f(x~,y)f(x~,y~))2δ

Pr(f(x¯,y¯)f(x,y))4δ.

"Дерадонімізувати" цей доказ легко. Для кожного ( x , y ) , нехай ˜ f ( x , y ) = 1, якщо f ( x , y ) = 1 для більшості ( x , y ) у класі еквівалентності ( x , y ) та ˜ f ( x , y ) = 0 , інакше.(x,y)f~(x,y)=1f(x,y)=1(x,y)(x,y)f~(x,y)=0


12

Найменший c , для якого виконується пов'язана, - c = 1c2 -12,41.c=1212.41

З лемм 1 і 2 видно, що для цієї с . З леми 3 видно, що ця межа є тісною.c

(Для порівняння, елегантний ймовірнісний аргумент Юрі дає c = 4. )c=4

Нехай c = 12 -1. Лема 1 дає верхню межу дляk=0.c=121k=0

Лемма 1: Якщо ф поза й г -near функції г , що не має впливає на змінних в S 2 , і F є ε ч -near функції ч , яка не впливає змінні в S 1 , то ф поза ε -near функції постійної , де ϵ ( ϵ g + ϵ h ) / 2fϵggS2fϵhhS1fϵc .ϵ(ϵg+ϵh)/2c

Доказ. Нехай ϵ - відстань від f до постійної функції. Припустимо, для протиріччя, що ϵ не задовольняє заявленої нерівності. Нехай y = ( x 1 , x 2 , , x n / 2 ) і z = ( x n / 2 + 1 , , x n ) і записуємо f , g і h як f ( yϵfϵy=(x1,x2,,xn/2)z=(xn/2+1,,xn)fgh, z ) , g ( y , z ) і h ( y , z ) , тому g ( y , z ) не залежить від z, а h ( y , z ) незалежно від y .f(y,z)g(y,z)h(y,z)g(y,z)zh(y,z)y

(I find it helpful to visualize ff as the edge-labeling of the complete bipartite graph with vertex sets {y}{y} and {z}{z}, where gg gives a vertex-labeling of {y}{y}, and hh gives a vertex-labeling of {z}{z}.)

Let g0g0 be the fraction of pairs (y,z)(y,z) such that g(y,z)=0g(y,z)=0. Let g1=1g0g1=1g0 be the fraction of pairs such that g(y,z)=1g(y,z)=1. Likewise let h0h0 be the fraction of pairs such that h(y,z)=0h(y,z)=0, and let h1h1 be the fraction of pairs such that h(y,z)=1h(y,z)=1.

Without loss of generality, assume that, for any pair such that g(y,z)=h(y,z)g(y,z)=h(y,z), it also holds that f(y,z)=g(y,z)=h(y,z)f(y,z)=g(y,z)=h(y,z). (Otherwise, toggling the value of f(y,z)f(y,z) allows us to decrease both ϵgϵg and ϵhϵh by 1/2n1/2n, while decreasing the ϵϵ by at most 1/2n1/2n, so the resulting function is still a counter-example.) Say any such pair is ``in agreement''.

The distance from ff to gg plus the distance from ff to hh is the fraction of (x,y)(x,y) pairs that are not in agreement. That is, ϵg+ϵh=g0h1+g1h0ϵg+ϵh=g0h1+g1h0.

The distance from ff to the all-zero function is at most 1g0h01g0h0.

The distance from ff to the all-ones function is at most 1g1h11g1h1.

Further, the distance from ff to the nearest constant function is at most 1/21/2.

Thus, the ratio ϵ/(ϵg+ϵh)ϵ/(ϵg+ϵh) is at most min(1/2,1g0h0,1g1h1)g0h1+g1h0,

min(1/2,1g0h0,1g1h1)g0h1+g1h0,
where g0,h0[0,1]g0,h0[0,1] and g1=1g0g1=1g0 and h1=1h0h1=1h0.

By calculation, this ratio is at most 12(21)=c/212(21)=c/2. QED

Lemma 2 extends Lemma 1 to general kk by arguing pointwise, over every possible setting of the 2k2k influencing variables. Recall that c=121c=121.

Lemma 2: Fix any kk. If ff is ϵgϵg-near a function gg that has kk influencing variables in S2S2, and ff is ϵhϵh-near a function hh that has kk influencing variables in S1S1, then ff is ϵϵ-near a function ˆff^ that has at most 2k2k influencing variables, where ϵ(ϵg+ϵh)/2cϵ(ϵg+ϵh)/2c.

Proof. Express ff as f(a,y,b,z)f(a,y,b,z) where (a,y)(a,y) contains the variables in S1S1 with aa containing those that influence hh, while (b,z)(b,z) contains the variables in S2S2 with bb containing those influencing gg. So g(a,y,b,z)g(a,y,b,z) is independent of zz, and h(a,y,b,z)h(a,y,b,z) is independent of yy.

For each fixed value of aa and bb, define Fab(y,z)=f(a,y,b,z)Fab(y,z)=f(a,y,b,z), and define GabGab and HabHab similarly from gg and hh respectively. Let ϵgabϵgab be the distance from FabFab to GabGab (restricted to (y,z)(y,z) pairs). Likewise let ϵhabϵhab be the distance from FabFab to HabHab.

By Lemma 1, there exists a constant cabcab such that the distance (call it ϵabϵab) from FabFab to the constant function cabcab is at most (ϵhab+ϵgab)/(2c)(ϵhab+ϵgab)/(2c). Define ˆf(a,y,b,z)=cabf^(a,y,b,z)=cab.

Clearly ˆff^ depends only on aa and bb (and thus at most kk variables).

Let ϵˆfϵf^ be the average, over the (a,b)(a,b) pairs, of the ϵabϵab's, so that the distance from f to ˆf is ϵˆf.

Likewise, the distances from f to g and from f to h (that is, ϵg and ϵh) are the averages, over the (a,b) pairs, of, respectively, ϵgab and ϵhab.

Since ϵab(ϵhab+ϵgab)/(2c) for all a,b, it follows that ϵˆf(ϵg+ϵh)/(2c). QED

Lemma 3 shows that the constant c above is the best you can hope for (even for k=0 and ϵ=0.5).

Lemma 3: There exists f such that f is (0.5/c)-near two functions g and h, where g has no influencing variables in S2 and h has no influencing variables in S1, and f is 0.5-far from every constant function.

Proof. Let y and z be x restricted to, respectively, S1 and S2. That is, y=(x1,,xn/2) and z=(xn/2+1,,xn).

Identify each possible y with a unique element of [N], where N=2n/2. Likewise, identify each possible z with a unique element of [N]. Thus, we think of f as a function from [N]×[N] to {0,1}.

Define f(y,z) to be 1 iff max(y,z)12N.

By calculation, the fraction of f's values that are zero is (12)2=12, so both constant functions have distance 12 to f.

Define g(y,z) to be 1 iff y12N. Then g has no influencing variables in S2. The distance from f to g is the fraction of pairs (y,z) such that y<12N and z12N. By calculation, this is at most 12(112)=0.5/c

Similarly, the distance from f to h, where h(y,z)=1 iff z12N, is at most 0.5/c.

QED


First of all, thanks Neal! This indeed sums it up for k=0, and sheds some light on the general problem. However in the case of k=0 the problem is a bit degenerate (as 2k=k), so I'm more curious regarding the case of k1. I didn't manage to extend this claim for k>0, so if you have an idea on how to do it - I'd appreciate it. If it simplifies the problem, then the exact constants are not crucial; that is, ϵ/2-far can be replaced by ϵ/c-far, for some universal constant c.

2
I've edited it to add the extension to general k. And Yuri's argument below gives a slightly looser factor with an elegant probabilistic argument.
Neal Young

Sincere thanks Neal! This line of reasoning is quite enlightening.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.