Я маю на увазі наступну проблему: я хочу знайти регулярний вираз, який відповідає певному набору рядків (наприклад, дійсні адреси електронної пошти) і не відповідає іншим (недійсні адреси електронної пошти).
Припустимо, що під регулярним виразом ми маємо на увазі деяку чітко визначену машину з кінцевим станом, я не знайомий з точною термінологією, але давайте погодимось про якийсь клас дозволених виразів.
Замість того, щоб вручну складати вираз, я хочу надати йому набір позитивних та набір негативних прикладів.
Тоді слід створити вираз, що відповідає + +, відкидає - і є мінімальним у певному чітко визначеному сенсі (кількість станів в автоматах?).
Мої запитання:
- Чи була розглянута ця проблема, як її можна визначити дещо конкретнішим способом і чи можна її ефективно вирішити? Чи можемо ми розв’язати це в поліном час? Чи завершено НП, чи можемо ми його якось наблизити? Для яких класів виразів він би працював? Буду вдячний за будь-який вказівник на підручники, статті чи подібне, що обговорюють цю тему.
- Чи пов’язано це якимось чином зі складністю Колмогорова?
- Чи пов’язано це з будь-яким способом навчання? Якщо регулярний вираз узгоджується з моїми прикладами, в силу того, що він мінімальний, чи можемо ми сказати щось про його узагальнюючу силу на ще небачених прикладах? Який критерій мінімальності був би придатний для цього? Який із них був би більш ефективним? Чи має це зв’язок із машинним навчанням? Знову будь-які вказівки будуть корисні ...
Вибачте за безладне запитання ... Наведіть мене в правильному напрямку, щоб зрозуміти це. Дякую !