Концептуально прості конструкції дерев суфікса лінійного часу


13

У 1973 році Вайнер дав першу лінійну конструкцію дерев із суфіксом. Алгоритм був спрощений у 1976 році МакКрейтом, а в 1995 році - Укконеном. Тим не менш, я вважаю, що алгоритм Укконена відносно концептуально задіяний.

Чи були спрощення алгоритму Укконена з 1995 року?


4
Farach et el 1998. Я думаю, що це хороше місце, щоб почати читати: scilar.google.co.uk/…
Radu GRIGо

Відповіді:


9

Я не впевнений, чи були якісь нові результати, що безпосередньо спрощують побудову дерев суфіксів. Однак був принаймні один результат, що дає дуже простий алгоритм побудови масивів суфіксів у лінійному часі.

O(1)

O(nlgn)


1
Чи можете ви дати вказівник на простіший спосіб побудови масивів суфіксів за час O (N lg N)?
Randomblue

1
Позначте всі суфікси довжиною 2 ^ k цілим числом, таким чином, щоб мітки відповідали порядку відношення між суфіксами. Перший крок (k = 0) очевидний. Щоб обчислити мітки на етапі k, використовуйте мітки з кроку k-1 і зробіть сортування радіації. Цей документ повинен бути легким для розуміння: webglimpse.net/pubs/suffix.pdf
zotachidil

7

На додаток до того, що було згадано ( Kärkkäinen & Sanders, 2003 ), я думаю, ви оцінили б "новішу" версію Kärkkäinen, Sanders та Burkhard, 2006 . Алгоритм в основному відповідає структурі алгоритму Фараха. Це, мабуть, концептуально простіше, але справжнім бонусом є те, що вони забезпечують читача реалізацією алгоритму. Це лише близько 50 рядків C ++, тому прихованих деталей дійсно немає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.