Асимптотика кількості слів у звичайній мові заданої довжини


28

Для звичайного мови , нехай , як число слів в довжини . Використовуючи канонічну форму Йордану (застосовану до неозначеної матриці переходу деякої DFA для ), можна показати, що для досить великих , де - складні многочлени, а - складні "власні значення". (Для малих ми можемо мати додаткові умови форми , де дорівнює якщо іc n ( L ) L n L n c n ( L ) = k i = 1 P i ( n ) λ n i , P i λ i n C k [ n = k ] [ n = k ] 1 n = k 0Lcn(L)LnLn

cn(L)=i=1kPi(n)λin,
PiλinCk[n=k][n=k]1n=k0інакше. Вони відповідають іорданським блокам розміром принаймні із власним значенням )0k+10

Це уявлення означає, що якщо нескінченно, тоді асимптотично для деякого . Однак це явно хибно: для мови понад всіх слів рівної довжини, але . Це говорить про те, що для деякого і для всіх або для достатньо великих або . Це доведено у Flajolet & Sedgewickc n ( L ) C n k λ n C , λ > 0 L { 0 , 1 } c 2 n ( L ) = 2 2 n c 2 n + 1 ( L ) = 0 d a { 0 , , d - 1 } c d m + a (Lcn(L)CnkλnC,λ>0L{0,1}c2n(L)=22nc2n+1(L)=0da{0,,d1}m c d mcdm+a(L)=0mcdm+aCa(dm+a)kaλadm+a (Теорема V.3), який приписує доказ Берстелю.

Доказ, який надають Флайолет та Седжвік, є дещо технічним; насправді настільки технічні, що вони лише замальовують це. Я спробував більш елементарний доказ, використовуючи теорію Перрона-Фробеніуса. Графік переходу DFA ми можемо розглядати як диграф. Якщо диграф примітивний, то результат випливає майже безпосередньо з теореми Перрона-Фробеніуса. Якщо диграф непридатний, але непримітний з індексом , то, розглядаючи " ту потужність" DFA (кожен перехід відповідає символам), ми отримуємо той самий результат. Важкий випадок, коли диграф зменшується. Ми можемо звести до випадку шляху сильно з’єднаних компонентів, і тоді отримаємо результат, оцінивши суми форми r r m 1 + + m k = m k i = 1 λrrr

m1++mk=mi=1kλimi.
(Кожна така сума відповідає певному способу прийняття слова, певним чином проходячи різні компоненти.) Цю суму, у свою чергу, можна оцінити, визначивши найбільший термін, який відповідає . Для кожного власного значення, яке повторюється разів, ми отримуємо додатковий коефіцієнт . r ΘmilogλirΘ(mr1)

Доказ має грубі краї: у зворотному випадку нам потрібно переходити від термінів асимптотичних до до зазначеної вище суми, а потім нам потрібно оцінити суму.Cλim

Доказ Флайолета та Седжевіка, можливо, простіший, але менш елементарний. Його вихідною точкою є раціональна генеруюча функція , і вона передбачає індукцію на кількість полюсних величин (!). Основна ідея полягає в тому, що всі власні значення максимального модуля є корінням єдності (якщо нормалізувати їх модуль), завдяки (помірно легкій) теоремі Берстеля. Вибираючи відповідне і переглядаючи слова довжини , всі ці власні значення стають справжніми. Розглядаючи часткове розширення дробу, отримуємо, що якщо власне значення максимального модуля "виживає", то воно визначає асимптотики, що мають виглядd d m + a C n kcn(L)ddm+a dCnkλn. В іншому випадку ми знаходимо нову раціональну функцію генерування, яка відповідає лише словам такої довжини (використовуючи добуток Адамара), і повторюємо аргумент. Вищезазначена кількість постійно зменшується, і, врешті-решт, ми знаходимо бажані асимптотики; можливо, доведеться зростати в процесі, щоб відображати все, що відбувається в індуктивних кроках.d

Чи є простий і елементарний доказ асимптотичної властивості ?cn(L)


Яку "асимптотичну властивість" ви маєте на увазі, ту, що знаходиться вгорі?
Рафаель

Саме це майно.
Yuval Filmus

Чи не є простими комбінаторними межами (можливо, отриманими, враховуючи підмножини шляхів та багатонарізки шляхів)?
Андраш Саламон

Існують легкі межі, але ви, мабуть, там втрачаєте поліноміальні фактори. Існує сума з поліноміально багато термінів, і ми можемо оцінити її, використовуючи найбільший термін. Однак це не дасть нам правильної асимптотики, оскільки інші умови занепадають досить швидко. Можливо, оцінка з інтегралом можлива, але це вже стає трохи безладним.
Yuval Filmus

1
Взагалі, пошук альтернативних чи більш елементарних доказів проблем може бути дуже важким і, в основному, є теоретичним вправою ... Чи є додаткова мотивація / кг / додаток? пропонують мігрувати в категорію.
vzn

Відповіді:


3

Аргумент, який ви накреслили, схоже, відповідає трактуванню Річардом Стенлі методом Перенесення-матриця в переліку комбінаторики, Том 1 (посилання: с. 573; друк: С. 500).

Він починає з функції, що генерує, і розпаковує її, розглядаючи графіки та допустимі та заборонені фактори. Потім він резюмує безкоштовні моноїди, де використовує вдосконалену версію сум, які ви дали для доведення:

BABB(λ)=(IB(λ))1

Опрацювавши деякі програми, він також закриває розділ, обговорюючи продукти Адамара стосовно горизонтально-опуклих поліоміно.


Чи можете ви вказати на теорему в тексті Стенлі, що дає асимптотичні оцінки?
Yuval Filmus

У Стенлі я не можу знайти жодного негайного явного посилання, але Флайолет та Седжевік визнають його вплив на їхнє лікування методом передачі матриці в розділі V.6. Зокрема, наслідок V.1 поширює попередні теореми (V.7, V.8), які, здається, слідують вашій міркуванню. Вони також здаються, що вони слідують контурам Стенлі, починаючи з підрозділу V.5, де пропозиція V.6 відповідає теоремі Стенлі 4.7.2 та наслідку 4.7.3
JSS

Що я конкретно шукаю - це асимптотичний аналіз. Точна формула для кількості слів заданої довжини, що задається методом матриці передачі, - це те, що я сприймаю як належне.
Yuval Filmus
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.