Запитання з тегом «strings»

Питання щодо послідовностей символів, їх наборів та їх властивостей, а також використання.

2
Ефективні структури даних для побудови швидкої перевірки орфографії
Я намагаюся написати перевірку орфографії, яка повинна працювати з досить великим словником. Я дуже хочу, щоб ефективний спосіб індексувати мої словникові дані, використовуючи відстань Дамерау-Левенштейн, щоб визначити, які слова найближчі до неправильно написаного слова. Я шукаю структуру даних, яка б дала мені найкращий компроміс між складністю простору та складністю виконання. …


1
Чи існує структура даних "стек рядків", яка підтримує ці рядкові операції?
Я шукаю структуру даних, яка зберігає набір рядків над набором символів , здатним виконувати наступні операції. Позначимо , в якості структури даних , що зберігає безліч рядків .D ( S ) SΣΣ\SigmaD (S)D(S)\mathcal{D}(S)SSS Add-Prefix-Seton : заданий деякий набір (можливо, порожніх) рядків, розмір яких обмежений постійною, а довжина рядків обмежена постійною, …

1
Найдовший повторний (розсіяний) наступ у струні
Неформальна постановка проблеми: Враховуючи рядок, наприклад , ми хочемо пофарбувати деякі букви в червоний колір, а деякі - в синій (а деякі зовсім не такі), щоб читати лише червоні ліворуч зліва направо - такий же результат, як і читання лише синіх літер.А ССА Б В А ВACCABBABACCABBAB У прикладі ми …

2
Ефективна структура даних карт, що підтримує приблизний пошук
Я шукаю структуру даних, яка підтримує ефективні приблизні пошуки ключів (наприклад, відстань Левенштейна для рядків), повертаючи найближчу можливу відповідність ключа введення. Найкраща структура даних, яку я знайшов поки що, - це дерева Беркхард-Келлера , але мені було цікаво, чи існують інші / кращі структури даних для цієї мети. Редагувати: ще …

1
Стиснення доменних імен
Мені цікаво, як можна дуже компактно стиснути домен довільного імені хоста IDN (як визначено RFC5890 ) і підозрювати, що це може стати цікавою проблемою. Ім'я хоста або доменного імені Unicode (U-label) складається з рядка символів Unicode, як правило, обмежених однією мовою залежно від домену верхнього рівня (наприклад, грецькі літери під …

1
Чи має кожен достатньо великий рядок повтори?
Нехай - деякий кінцевий набір символів фіксованого розміру. Нехай - деякий рядок над . Будеш говорити , що непорожня подстрока з є повторенням , якщо для деякого рядка .α Σ β α β = γ γ γΣΣ\Sigmaαα\alphaΣΣ\Sigmaββ\betaαα\alphaβ=γγβ=γγ\beta = \gamma \gammaγγ\gamma Тепер моє питання полягає в тому, чи справедливо таке: Для …

1
Яким чином час виконання алгоритму Укконена залежить від розміру алфавіту?
Мене хвилює питання про асимптотичний час роботи алгоритму Укконена , можливо, найпопулярнішого алгоритму побудови дерев суфіксів у лінійному (?) Часі. Ось цитата з книги "Алгоритми про струни, дерева та послідовності" Дена Гусфілда (розділ 6.5.1): "... алгоритми Aho-Corasick, Weiner, Ukkonen та McCreight або вимагають простору , або обмежений час O ( …

3
динамічні вправи програмування на різанні струн
Я працюю над наступною проблемою з цієї книги . Певна мова обробці рядків пропонує примітивну операцію, яка розбиває рядок на дві частини. Оскільки ця операція передбачає копіювання початкового рядка, то на рядок довжиною n потрібно n одиниць часу, незалежно від місця розрізу. Припустимо, тепер ви хочете розірвати рядок на багато …

7
Як перевірити, чи два рядки перестановки один одного, використовуючи додатковий простір O (1)?
Дано два рядки, як ви можете перевірити, чи є вони перестановкою один одного, використовуючи пробіл O (1)? Змінювати рядки не дозволяється жодним чином. Примітка: пробіл O (1) стосовно довжини рядка ТА розміру алфавіту.

1
Відредагуйте відстань списку унікальними елементами
Відстань редагування Левенштайн-Відстань між списками - добре вивчена проблема. Але я не можу знайти багато можливих вдосконалень, якщо відомо, що жоден елемент не зустрічається більше одного разу у кожному списку . Припустимо також, що елементи порівнянні / сортувані (але списки для порівняння для початку не відсортовані). Зокрема, мене цікавить, чи …

2
Порівняння між алгоритмом Ахо-Корасіка та алгоритмом Рабіна-Карпа
Я працюю над алгоритмами пошуку рядків, які підтримують пошук декількох шаблонів. Я знайшов два алгоритми, які здаються найсильнішими кандидатами з точки зору часу роботи, а саме Ахо-Корасик та Рабін-Карп . Однак я не зміг знайти жодного всебічного порівняння між двома алгоритмами. Який алгоритм є більш ефективним? Також, який з них …

5
Частота слів із замовленням у складності O (n)
Під час співбесіди на посаду розробника Java мене попросили: Напишіть функцію, яка займає два парами: a Рядок, що представляє текстовий документ і ціле число, що забезпечує кількість повернених елементів. Реалізуйте функцію таким чином, що вона повертає список рядків, упорядкованих за частотою слова, першим найчастіше зустрічається слово. Ваше рішення має виконуватися …

1
Складність наївного алгоритму пошуку найдовшого підрядка Фібоначчі
Давши два символи і b , давайте визначимо k - ту рядок Фібоначчі так:аa\text{a}бb\text{b}кkk Ж( k ) = ⎧⎩⎨баЖ( k - 1 ) ⋆ F( k - 2 )якщо k=0якщо k=1щеF(k)={bif k=0aif k=1F(k−1)⋆F(k−2)else F(k) = \begin{cases} \text{b} &\mbox{if } k = 0 \\ \text{a} &\mbox{if } k = 1 \\ …

2
Алгоритм відповідності рядків швидкого невідповідності
Я шукаю швидкий алгоритм відповідності рядків k-невідповідності. З огляду на рядок шаблону P довжиною m та текстовий рядок T довжиною n, мені потрібен швидкий (лінійний час) алгоритм, щоб знайти всі позиції, де P відповідає підрядку T з не більше k невідповідностей. Це відрізняється від проблеми k-відмінності (відстань редагування). Невідповідність має …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.