Обмежується розміром найменшого NFA для L_k-виразних


18

Розглянемо мову L k - d i s t i n c t,Lkdistinct що складається з усіх kk -рядних рядків над ΣΣ таким чином, що жодна дві літери не дорівнює:

L k - d i s t i n c t : = { w = σ 1 σ 2 . . . σ ki [ k ] : σ iΣ  і  j i : σ jσ i }  

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

Ця мова є кінцевою і тому регулярною. Зокрема, якщо | Σ | = n|Σ|=n , тоді.| L k - d i s t i n c t | = ( nк ) к!|Lkdistinct|=(nk)k!

Який найменший недетермінований кінцевий автомат, який приймає цю мову?

На даний момент у мене є такі верхні та нижні межі:

  • Найменший NFA, який я можу побудувати, має станів.4 k ( 1 + o ( 1 ) )p o l y l o g ( n )4k(1+o(1))polylog(n)

  • Наступна лема передбачає нижню межу станів :2 к2k

Нехай L ΣLΣ - звичайна мова. Припустимо, є нn пар P = { ( x i , w i ) 1 i n }P={(xi,wi)1in} такі, що x iw jLxiwjL якщо і лише якщо i = ji=j . Тоді будь-який NFA, що приймає L, має принаймні n станів.

  • Ще одна (тривіальна) нижня межа - це л о г ( нlogк )(nk) , що є журналом розміру найменшої DFA для мови.

Мене також цікавлять НФА, які приймають лише фіксовану дріб ( 0 < ϵ < 10<ϵ<1 ) L k - d i s t i n c tLkdistinct , якщо розмір автомата менший, ніж ϵ 4 k ( 1 + o ( 1 ) )p o l y l o g ( n )ϵ4k(1+o(1))polylog(n) .


Редагувати: Я щойно розпочав щедрості, яка помилилась у тексті.

Я мав на увазі, що ми можемо вважати, що k = p o l y l o g ( n )k=polylog(n) поки я написав k = O ( l o g ( n ) )k=O(log(n)) .

Edit2:

Баунті скоро закінчиться, тому, якщо когось цікавить, що, можливо, є простішим способом заробити, врахуйте наступну мову:

L ( r , k ) - d i s t i n c t : = { w : wL(r,k)distinct:={w:w містить кk різних символів, і жоден символ не з'являється більше rr разів }} .

(тобто L ( 1 , k ) - d i s t i n c t = L k - d i s t i n c tL(1,k)distinct=Lkdistinct ).

Аналогічна конструкція, як і в коментарях, дає автоматичний розмір для .O ( e k2 k l o g ( 1 + r )p o l y ( n ) ) L ( r , k ) - d i s t i n c tO(ek2klog(1+r)poly(n))L(r,k)distinct

Чи можна це покращити? Яку найкращу нижню межу ми можемо показати для цієї мови?


2
Чи можете ви описати свою верхню межу NFA?
mjqxxxx

Я не можу про це ще писати, оскільки ми все ще працюємо над цим і не завершив підтвердження. Натомість я опишу набагато простіший автомат розміром : Візьміть -досконале сімейство хесів . Кожен такий хеш - функція . Це означає, що для кожного підмножини розміру не більше існує функція така, що вона відображає кожен елемент підмножини на інше число. Після хешування отриманий алфавіт має букв, отже, осінь розміром може прийняти мову . O ( ( 2 e ) k2 O ( l o g ( k ) )l o g ( n ) ) ( n , k ) H h : [ n ] [ k ] [ n ] k h H k 2 k L k - d i s t i n cO((2e)k2O(log(k))log(n))(n,k)Hh:[n][k][n]khHk2kтLkdistinct
RB

4
Нижня межа дає просто підрахунок кількості станів, в яких може бути NFA після рівно кроків. Я не думаю, що мені відомо про будь-який метод доказування, який дає значно кращі межі для загального розміру, ніж те, що можна отримати, ніж просто дивлячись на те, що відбувається після кроків, для деяких . Але тут для кожного існує NFA, який може знаходитися лише в одному з станів після рівно станів. ( 2 - o ( 1 ) ) k k / 2 t t t ( 2 + o ( 1 )(2o(1))kk/2ttt)k(2+o(1))ktt
Ноам

3
Доказ (з моєї попередньої претензії): Найважчий випадок - ; виберіть різні випадкові підмножини (з символів алфавіту) розміром рівно кожну і побудуйте NFA, який має стан для кожного з деяким шляхом, що веде до нього, якщо перший символи всі різні і містяться в , і має приймаючи шлях від нього, якщо наступні символи всі різні і містяться в доповненнях . Аргумент підрахунку покаже, що whp (над випадковим виборомt=k/2t=k/22kpoly(k,logn)2kpoly(k,logn)SiSinnttiittSiSiktktSiSiSiSis) цей NFA дійсно прийме всі бажані мови.
Ноам

3
У попередній побудові найпростіший спосіб побудови NFA матиме стан для кожного можливого префікса довжини та для кожного можливого суфікса довжиною . Натомість частина префікса та частина суфікса NFA можуть бути побудовані рекурсивно, використовуючи ту саму рандомізовану конструкцію (але тепер лише у межах та її доповнення відповідно), і це дало б загальний розмір . j<tj<tj>ktj>ktSiSi(4+o(1))k(4+o(1))k
Ноам

Відповіді:


2

Це не відповідь, а метод, який, на мою думку, дозволить змінити нижню межу. Розріже проблему після букву читається. Позначимо сімейство елемент множин по і сімейство елементів з безлічі з допомогою . Позначте стани, до яких можна дійти після зчитування елементів (у будь-якому порядку) і стани, з яких може бути досягнутий стан приймання після зчитування елементів (у будь-якому порядку) . Нам потрібен якщо і тільки якщоaaaa[n][n]AAb=kab=ka[n][n]BBAASASABBTBTBSATBSATBAB=AB= . Це вже дає нижню межу для необхідної кількості штатів, і я думаю, що це може дати щось нетривіальне.

Ця проблема по суті задає нижню межу кількості вершин гіперграфа, лінійний графік якого (частково) відомий. Подібні проблеми вивчалися, наприклад, Болобасом, і існує кілька відомих методів доказування, які можуть бути корисними.

Оновлення 2014.03.24: Фактично, якщо вищезгаданий гіперграф можна реалізувати на вершинах , тоді ми також отримаємо недетермінований протокол складності зв’язку довжини для встановленої неперервності з наборами входів розмірами і (насправді два проблеми рівнозначні). Вузьке місце, звичайно, коли , для цього я міг знайти лише таке в книзі Ейал та Ноама: N 1 ( D I S J a ) log ( 2 k log e ( nsslogslogsaabba=b=k/2a=b=k/2а ) )доведено стандартним імовірнісним аргументом. На жаль, я не зміг (ще) знайти досить хороші нижні межі щодо цієї проблеми, але якщо припустити, що вищесказання є гострим, це дасть нижню межуΩ(2klogn), щооб'єднує дві нижню межу, яку ви згадали.N1(DISJa)log(2kloge(na))Ω(2klogn)


1
Дякую @domotorp за вашу відповідь. Це здається чимось схожим на доказ леми, яку я використав для нижньої межі в оригінальному питанні, але без зазначення фактичних x i 's та y i ' s, і, отже, не обмежуваного числа. Ваш коментар до вищезазначеного питання говорить про те, що 2- метрова межа не може бути покращена цим методом, ви вважаєте, що це може зробити краще? xiyi2k
RB

3
Весь сенс мого коментаря вище в тому, що ці методи не можуть дати нижню межу вище ( 2 + o ( 1 ) ) k . Це дійсно те, що робить цю проблему цікавою для мене. (2+o(1))k
Ноам

@Noam: Нехай k = 2, a = b = 1. Вже тоді ми отримуємо нижню мету журналу n, оскільки кожен S A має бути різним. lognSA
domotorp

1
@domotorp: Про ( 1 ) приховує висновок ( до лог - п ) фактор: Тут аналіз для найгіршого випадку , коли = Ь = K / 2 : Пуск з фіксованим А і Б і забрати в довільному порядку підмножина S з в п букв , то ми маємо P г [ So(1)O(klogn)a=b=k/2ABSna n dB S c ] = 2 - k . Тепер виберіть r 2 k таких множин навмання, тоді ймовірність того, що принаймні для одного з них це стане, є 1 - e x p ( - r ) . Якщо ми виберемо r = O ( log ( n)Pr[ASandBSc]=2kr2kk ) )=O(klogn),тоді ми отримуємо, що whp це так для ВСІх непересічних множинAіB(розміромk/2). Загальна кількість такихSв цій конструкції становитьO(2kklogn).
Ноам

2
@Noam: Я шкодую , але я ніколи не бачив журнал п прихований в O ( 1 ) , тим більше , що ця проблема також цікава имхо для до < < увійти п . Але ви праві, що Р.Б. запитав про k = p o l y l o g n .
domotorp

0

Деякі незавершені роботи:

Я намагаюся довести нижню межу в 4 к . Ось питання, яке я впевнений, що дасть таку нижню межу: знайдіть мінімум t таким, щоб існувала функція f : { S [ n ] , | S | = k / 2 } { 0 , 1 } t, що зберігає непересічність, тобто S 1S 2 = iff f ( S 1 ) f (S 2 ) = . Я впевнений, що нижня межа t 2 k майже одразу означатиме нижню межу 2 2 k = 4 k для нашої проблеми. е ( S ) приблизно відповідає безлічі вузлів МКІ можна отриматищоб після прочитання перших K / 2 символів на вході, коли безліч цих K / 2 символів S .

Я думаю, що рішення цього питання може бути вже відоме, або в літературі про складність комунікації (особливо в роботах, що стосуються проблеми непричетності; можливо, допоможуть деякі аргументи матричного ранжування), або в літературі про кодування (наприклад, подібне ).


2
Мої коментарі вище показують, що такий підхід не може перемогти ( 2 + o ( 1 ) ) n
Noam
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.