мінімізація розміру регулярного вираження для кінцевих множин


15

Відомо, що мінімізація розміру регулярного виразу є повною PSPACE, навіть якщо у нас є специфікація DFA .

Які результати, якщо мова кінцева?

Цю проблему можна розглядати у двох моделях:

  1. Вхід - це всі рядки в мові, і розмір введення вимірюємо за сумою довжини всіх рядків.
  2. Вхід є DFA, і ми вимірюємо розмір вхідного сигналу за кількістю станів DFA.

Зірка Клейна не є корисною у кінцевому випадку, тому лише ,і (конкатенація) використовуються в виразі. Звичайно, довжина регулярного виразу здається довільною. Натомість можна надати вагу кожній операції (включаючи додавання дужок) і попросити мінімізувати вагу регулярного виразу.()|

Редагувати: Як відмітив AdrianN, це пов'язано з кодами на основі граматики. Це NP-завершення, щоб створити вільну граматику мінімальної довжини контексту для опису скінченного набору. Незрозуміло, чому контекст мінімальної величини вільної граматики може означати багато про регулярне вираження мінімального розміру. Можливо, розумне правило переписання може пов’язати ці два і довести, що в першій моделі проблема полягає в NP.


3
Це здається пов'язаним з граматичними кодами .
adrianN

припустимо, розмір вводу обмежений. тоді клейнова зірка може бути дійсною. тому має сенс визначити, чи розмір вводу (природно) обмежений найдовшою строкою на кінцевій мові. & також, якщо в цьому випадку зірка клеїну все ще виключена. також, як (очевидно?) евристичний, мінімізуючи DFA та будуючи RE з цього - це одна стратегія ... також зауважте, що RE (із змінною підстановою) мають структуру, схожу на DAG, і не так багато (сильних) thms відомих про мінімізацію DAG-подібних структур .... REs без змінної підстановки є деревоподібними (формулами), і може бути простіше працювати з ....
vzn

інший кут. RE «похідні» , введені Бжозовським , як відомо, бути корисним для перетворення УЕ безпосередньо в ДКА дивись , наприклад , похідні регулярних виразів переглядаються по Оуенс, Reppy, Турон. можливо, є якийсь спосіб використовувати ту саму структуру для зворотної задачі. все-таки, хоча загалом це видається відкритою проблемою ....
vzn

Відповіді:


4

Σ2Пк

Я вважаю, що ніяких подальших результатів щодо ваших проблем не відомо. Для аналогічної проблеми оптимізації, де мета - знайти мінімальний еквівалентний недетермінований кінцевий автомат замість регулярного виразу, відомі такі результати:

  • DПDП
  • NП
  • L{0,1}мNП

Остерігайтеся: на відміну від встановлення нескінченних мов, я не бачу прямого скорочення від випадку мінімізації NFA до проблем вашого запитання.

Список літератури:

(1) Герман Грубер та Маркус Хольцер. Обчислювальна складність мінімізації NFA для кінцевих і одинарних мов . У: Перша міжнародна конференція з теорії та застосувань мови та автоматів (LATA 2007), стор 261-272, 2007.

(2) Герман Грубер та Маркус Хольцер. Непристосованість недетермінованого стану та складності переходу, припускаючи P <> NP . У: 11 Міжнародна конференція з розвитку мовної теорії (DLT 2007), LNCS 4588, с. 205-216, 2007.

L={ш}ш


-6

мабуть, не вистачає точної відомої відповіді або кращої, ніж ця, ось недалекий / недавній відгук на дослідження конкретно щодо суб-мінімуму мінімізації РЗ (що, очевидно, незвичайний кут):

Мінімізація NFA та регулярних виразів (2005) Gregor Gramlich, Georg Schnitger

Ми показуємо результати невідповідності щодо мінімізації недетермінованих кінцевих автоматів (nfa), а також регулярних виразів щодо заданих nfa, регулярних виразів або детермінованих кінцевих автоматів (dfa). Ми показуємо, що неможливо ефективно мінімізувати заданий nfa або регулярний вираз з n станами, переходами, респ. символів у межах коефіцієнта o (n), якщо P = PSPACE. Наші результати невідповідності для даного dfa з n станами ґрунтуються на криптографічних припущеннях, і ми показуємо, що будь-який ефективний алгоритм матиме коефіцієнт наближення принаймні poly (log n). Наша настройка також дозволяє проаналізувати мінімальну послідовну проблему dfa.


4
Це запитання було задано спеціально, оскільки ця стаття не стосується того, що відбувається, коли мова обмежена.
Чао Сю

1
штрафом, тоді він служить як [відповідне / неод] bkg. але зауважте, що якщо на інше питання немає [опублікованої] відповіді, це, звичайно, не дивно, що це теж не відповідає, близький варіант кута може не дуже допомогти. Також [ mea culpa ] не помітив, що MdB цитує папір у іншому питанні.
vzn
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.