Обмежується розміром найменшого NFA для L_k-виразних

Розглянемо мову $L_{k-distinct}$ що складається з усіх $k$ -рядних рядків над $\Sigma$ таким чином, що жодна дві літери не дорівнює:

L k - d i s t i n c t : = {w = σ 1 σ 2 . . . σ k ∣ \forall i \in [k] : σ i \in Σ and \forall j \neq i : σ j \neq σ i}

$L_{k-distinct} :=\{w = \sigma_1\sigma_2...\sigma_k \mid \forall i\in[k]: \sigma_i\in\Sigma ~\text{ and }~ \forall j\ne i: \sigma_j\ne\sigma_i \}$

Ця мова є кінцевою і тому регулярною. Зокрема, якщо $\left|\Sigma\right|=n$ , тоді. $\left|L_{k-distinct}\right| = \binom{n}{k} k!$

Який найменший недетермінований кінцевий автомат, який приймає цю мову?

На даний момент у мене є такі верхні та нижні межі:

Найменший NFA, який я можу побудувати, має станів. $4^{k(1+o(1))}\cdot polylog(n)$
Наступна лема передбачає нижню межу станів : $2^k$

Нехай $L ⊆ Σ^*$ - звичайна мова. Припустимо, є $n$ пар $P = \{ (x_i, w_i) \mid 1 ≤ i ≤ n \}$ такі, що $x_i\cdot w_j \in L$ якщо і лише якщо $i=j$ . Тоді будь-який NFA, що приймає L, має принаймні n станів.

Ще одна (тривіальна) нижня межа - це $log$ $n\choose k$ , що є журналом розміру найменшої DFA для мови.

Мене також цікавлять НФА, які приймають лише фіксовану дріб ( $0<\epsilon<1$ ) $L_{k-distinct}$ , якщо розмір автомата менший, ніж $\epsilon\cdot 4^{k(1+o(1))}\cdot polylog (n)$ .

Редагувати: Я щойно розпочав щедрості, яка помилилась у тексті.

Я мав на увазі, що ми можемо вважати, що $k=polylog(n)$ поки я написав $k=O(log(n))$ .

Edit2:

Баунті скоро закінчиться, тому, якщо когось цікавить, що, можливо, є простішим способом заробити, врахуйте наступну мову:

$L_{(r,k)-distinct} :=\{w : w$ містить $k$ різних символів, і жоден символ не з'являється більше $r$ разів $\}$ .

(тобто $L_{(1,k)-distinct} = L_{k-distinct}$ ).

Аналогічна конструкція, як і в коментарях, дає автоматичний розмір для . $O(e^k\cdot 2^{k\cdot log(1+r)}\cdot poly(n))$ $L_{(r,k)-distinct}$

Чи можна це покращити? Яку найкращу нижню межу ми можемо показати для цієї мови?

— РБ
джерело

Чи можете ви описати свою верхню межу NFA?

— mjqxxxx

Я не можу про це ще писати, оскільки ми все ще працюємо над цим і не завершив підтвердження. Натомість я опишу набагато простіший автомат розміром : Візьміть -досконале сімейство хесів . Кожен такий хеш - функція . Це означає, що для кожного підмножини розміру не більше існує функція така, що вона відображає кожен елемент підмножини на інше число. Після хешування отриманий алфавіт має букв, отже, осінь розміром може прийняти мову .

O((2e)k∗2O(log(k))∗log(n)) $O((2e)^k * 2^{O(log(k))} * log(n))$

(n,k) $(n,k)$

H $H$

h:[n]→[k] $h: [n] \to [k]$

[n] $[n]$

k $k$

h∈H $h\in H$

k $k$

2k $2^k$

Lk−distinct $L_{k-distinct}$

— RB

Нижня межа дає просто підрахунок кількості станів, в яких може бути NFA після рівно кроків. Я не думаю, що мені відомо про будь-який метод доказування, який дає значно кращі межі для загального розміру, ніж те, що можна отримати, ніж просто дивлячись на те, що відбувається після кроків, для деяких . Але тут для кожного існує NFA, який може знаходитися лише в одному з станів після рівно станів.

(2−o(1))k $(2-o(1))^k$

k/2 $k/2$

t $t$

(2+o(1))k $(2+o(1))^k$

t $t$

— Ноам

Доказ (з моєї попередньої претензії): Найважчий випадок - ; виберіть різні випадкові підмножини (з символів алфавіту) розміром рівно кожну і побудуйте NFA, який має стан для кожного з деяким шляхом, що веде до нього, якщо перший символи всі різні і містяться в , і має приймаючи шлях від нього, якщо наступні символи всі різні і містяться в доповненнях . Аргумент підрахунку покаже, що whp (над випадковим вибором

t=k/2 $t=k/2$

2k⋅poly(k,logn) $2^k \cdot poly(k, \log n)$

Si $S_i$

n $n$

t $t$

i $i$

t $t$

Si $S_i$

k−t $k-t$

Si $S_i$

Si $S_i$ s) цей NFA дійсно прийме всі бажані мови.

— Ноам

У попередній побудові найпростіший спосіб побудови NFA матиме стан для кожного можливого префікса довжини та для кожного можливого суфікса довжиною . Натомість частина префікса та частина суфікса NFA можуть бути побудовані рекурсивно, використовуючи ту саму рандомізовану конструкцію (але тепер лише у межах та її доповнення відповідно), і це дало б загальний розмір .

j<t $j < t$

j>k−t $j > k-t$

Si $S_i$

(4+o(1))k $(4+o(1))^k$

— Ноам

Відповіді:

Це не відповідь, а метод, який, на мою думку, дозволить змінити нижню межу. Розріже проблему після букву читається. Позначимо сімейство елемент множин по і сімейство елементів з безлічі з допомогою . Позначте стани, до яких можна дійти після зчитування елементів (у будь-якому порядку) і стани, з яких може бути досягнутий стан приймання після зчитування елементів (у будь-якому порядку) . Нам потрібен якщо і тільки якщо $a$ $a$ $[n]$ $\mathcal A$ $b=k-a$ $[n]$ $\mathcal B$ $A$ $S_A$ $B$ $T_B$ $S_A\cap T_B\ne \emptyset$ $A\cap B=\emptyset$ . Це вже дає нижню межу для необхідної кількості штатів, і я думаю, що це може дати щось нетривіальне.

Ця проблема по суті задає нижню межу кількості вершин гіперграфа, лінійний графік якого (частково) відомий. Подібні проблеми вивчалися, наприклад, Болобасом, і існує кілька відомих методів доказування, які можуть бути корисними.

Оновлення 2014.03.24: Фактично, якщо вищезгаданий гіперграф можна реалізувати на вершинах , тоді ми також отримаємо недетермінований протокол складності зв’язку довжини для встановленої неперервності з наборами входів розмірами і (насправді два проблеми рівнозначні). Вузьке місце, звичайно, коли , для цього я міг знайти лише таке в книзі Ейал та Ноама: $s$ $\log s$ $a$ $b$ $a=b=k/2$ доведено стандартним імовірнісним аргументом. На жаль, я не зміг (ще) знайти досить хороші нижні межі щодо цієї проблеми, але якщо припустити, що вищесказання є гострим, це дасть нижню межуоб'єднує дві нижню межу, яку ви згадали. $N^1(DISJ_a)\le \log \big(2^k \log_e {n\choose a}\big)$ $\Omega(2^k\log n)$

— домоторп
джерело

Дякую @domotorp за вашу відповідь. Це здається чимось схожим на доказ леми, яку я використав для нижньої межі в оригінальному питанні, але без зазначення фактичних

's та

' s, і, отже, не обмежуваного числа. Ваш коментар до вищезазначеного питання говорить про те, що

межа не може бути покращена цим методом, ви вважаєте, що це може зробити краще? xi $x_i$

yi $y_i$

2k $2^k$

— RB

Весь сенс мого коментаря вище в тому, що ці методи не можуть дати нижню межу вище

. Це дійсно те, що робить цю проблему цікавою для мене. (2+o(1))k $(2+o(1))^k$

— Ноам

@Noam: Нехай k = 2, a = b = 1. Вже тоді ми отримуємо нижню мету

оскільки кожен

має бути різним. logn $\log n$

SA $S_A$

— domotorp

@domotorp:

приховує

фактор: Тут аналіз для найгіршого випадку , коли

: Пуск з фіксованим

і забрати в довільному порядку підмножина

з в

букв , то ми маємо

o(1) $o(1)$

O(klogn) $O(k\log n)$

a=b=k/2 $a=b=k/2$

A $A$

B $B$

S $S$

n $n$

. Тепер виберіть

таких множин навмання, тоді ймовірність того, що принаймні для одного з них це стане, є

. Якщо ми виберемо

Pr[A⊆SandB⊆Sc]=2−k $Pr[A \subseteq S \:and\: B \subseteq S^c]=2^{-k}$

r2k $r2^k$

$1-exp(-r)$

тоді ми отримуємо, що whp це так для ВСІх непересічних множин

(розміром

). Загальна кількість таких

в цій конструкції становить

. $r = O(\log {n \choose k}) = O(k \log n)$

$A$

$B$

$k/2$

$S$

$O(2^k k \log n)$

— Ноам

@Noam: Я шкодую , але я ніколи не бачив

прихований в

, тим більше , що ця проблема також цікава имхо для

. Але ви праві, що Р.Б. запитав про

. $\log n$

$o(1)$

$k<<\log n$

$k=polylog n$

— domotorp

Деякі незавершені роботи:

Я намагаюся довести нижню межу в . Ось питання, яке я впевнений, що дасть таку нижню межу: знайдіть мінімум таким, щоб існувала функція що зберігає непересічність, тобто iff $4^k$ $t$ $f:\{S \subseteq [n], |S|=k/2 \} \rightarrow \{0,1\}^t$ $S_1 \cap S_2 = \emptyset$ . Я впевнений, що нижня межа майже одразу означатиме нижню межу для нашої проблеми. приблизно відповідає безлічі вузлів МКІ можна отриматищоб після прочитання перших символів на вході, коли безліч цих символів . $f(S_1) \cap f(S_2) = \emptyset$ $t \ge 2k$ $2^{2k}=4k$ $f(S)$ $k/2$ $k/2$ $S$

Я думаю, що рішення цього питання може бути вже відоме, або в літературі про складність комунікації (особливо в роботах, що стосуються проблеми непричетності; можливо, допоможуть деякі аргументи матричного ранжування), або в літературі про кодування (наприклад, подібне ).

— mobius пельмені
джерело

Мої коментарі вище показують, що такий підхід не може перемогти

$(2+o(1))^n$

— Noam