Ефективні алгоритми для проблеми вертикальної видимості

Під час роздумів над однією проблемою я зрозумів, що мені потрібно створити ефективний алгоритм для вирішення наступного завдання:

Проблема: нам дається двовимірне квадратне поле зі сторони , сторони якого паралельні осям. Ми можемо заглянути в нього через верх. Однак є і горизонтальних сегментів. Кожен сегмент має ціле число -координат ( ) і -координати ( ) і з'єднує точки та (дивіться на малюнок нижче). $n$ $m$ $y$ $0 \le y \le n$ $x$ $0 \le x_1 < x_2 \le n$ $(x_1,y)$ $(x_2,y)$

Ми хотіли б знати, для кожного сегмента у верхній частині коробки, наскільки глибоко ми можемо виглядати вертикально всередині коробки, якщо переглянемо цей сегмент.

Формально для ми хочемо знайти . $x \in \{0,\dots,n-1\}$ $\max_{i:\ [x,x+1]\subseteq[x_{1,i},x_{2,i}]} y_i$

Приклад: задані $n=9$ і $m=7$ сегментів, розташованих як на малюнку нижче, результат $(5, 5, 5, 3, 8, 3, 7, 8, 7)$ . Подивіться, як глибоке світло може потрапити в коробку.

Сім сегментів; затінена частина вказує область, до якої можна дістатися світлом

До щастя для нас, як $n$ і $m$ є досить малі , і ми можемо зробити обчислення офф-лайн.

Найпростіший алгоритм вирішення цієї проблеми - груба сила: для кожного сегмента пройдіть весь масив і оновіть його, де необхідно. Однак це дає нам не дуже вражаючий $O(mn)$ .

Велике вдосконалення полягає у використанні сегментного дерева, яке здатне максимізувати значення на сегменті під час запиту та читати кінцеві значення. Я не опишу його далі, але ми бачимо, що часова складність становить . $O((m+n) \log n)$

Однак я придумав більш швидкий алгоритм:

Контур:

Сортуйте відрізки у порядку зменшення -координати (лінійний час, використовуючи варіацію сортування підрахунку). Тепер зауважте, що якщо будь- який сегмент -одиниці раніше був охоплений будь-яким сегментом, жоден наступний сегмент вже не може зв'язати промінь світла, що проходить через цей сегмент -одиниці. Тоді зробимо підмітання лінії зверху до нижньої частини коробки. $y$ $x$ $x$
Тепер введемо кілька визначень: -одиничний сегмент - це уявний горизонтальний відрізок на розгортці, -координати якого є цілими числами, а довжина - 1. Кожен сегмент під час процесу розгортання може бути або немаркованим (тобто, промінь світла, що йде від У верхній частині поля може бути досягнутий цей відрізок) або позначений (навпроти випадку). Розглянемо відрізок -одиниці з , завжди без позначення. Введемо також множини . Кожен набір буде містити цілу послідовність послідовно позначених сегментів -unit (якщо такі є) із наступним немаркованим позначенням $x$ $x$ $x$ $x_1=n$ $x_2=n+1$ $S_0=\{0\}, S_1=\{1\}, \dots, S_n=\{n\}$ $x$ сегмент.
Нам потрібна структура даних, яка здатна працювати на цих сегментах та встановлювати ефективно. Ми будемо використовувати структуру find-union, розширену полем, що містить максимальний індекс сегмента -unit (індекс немаркованого сегмента). $x$
Тепер ми можемо ефективно обробляти сегменти. Скажімо, зараз ми розглядаємо порядок -го сегмента (називаємо його "запит"), який починається з і закінчується в . Нам потрібно знайти всі немарковані сегменти -одиниці, які містяться всередині -го сегмента (саме такі сегменти, на яких промінь світла закінчиться). Ми зробимо наступне: по-перше, ми знаходимо перший немаркований сегмент всередині запиту ( Знайдіть представника набору, в якому міститься , і отримаємо максимум індексу цього набору, який є неозначеним сегментом за визначенням ). Тоді цей показник $i$ $x_1$ $x_2$ $x$ $i$ $x_1$ $x$ знаходиться всередині запиту, додайте його до результату (результат для цього сегмента ) і позначте цей індекс ( набори об'єднань, що містять і ). Потім повторіть цю процедуру, поки ми не знайдемо всі немарковані сегменти, тобто наступний пошук знайде нам індекс . $y$ $x$ $x+1$ $x \ge x_2$

Зауважте, що кожна операція пошуку об'єднання буде виконана лише у двох випадках: або ми починаємо розглядати сегмент (що може статися разів), або ми лише позначили сегмент -unit (це може статися разів). Таким чином, загальна складність становить ( - обернена функція Акермана ). Якщо щось не зрозуміло, я можу детальніше зупинитися на цьому. Можливо, я зможу додати кілька фотографій, якщо матиму час. $m$ $x$ $n$ $O((n+m)\alpha(n))$ $\alpha$

Тепер я досяг «стіни». Я не можу придумати лінійний алгоритм, хоча, здається, він повинен бути. Отже, у мене є два питання:

Чи існує алгоритм лінійного часу (тобто ), що вирішує задачу про видимість горизонтального сегмента? $O(n+m)$
Якщо ні, що є доказом того, що проблема видимості - ? $\omega(n+m)$

— mnbvmar
джерело

Як швидко ви сортуєте свої m сегменти?

— babou

@babou, питання визначає сортування підрахунку, який, як йдеться в запитанні, працює в лінійний час ("лінійний час з використанням варіації підрахунку сортування").

— DW

Ви спробували підмітати зліва направо? Все, що вам потрібно, - це сортування на та як у кроках

і щоб піти праворуч. Отже, загалом .

x 1

$x1$

x 2

$x2$

O (m)

$O(m)$

O (m)

$O(m)$

O (m)

$O(m)$

— invalid_id

@invalid_id Так, я спробував. Однак у цьому випадку лінія розгортки повинна реагувати належним чином, коли вона відповідає початку сегмента (іншими словами, додайте число, рівне -координату відрізка до мультисети), відповідає кінці сегмента (видаліть виникнення -координація) і вивести найвищий активний сегмент (максимальне значення виводу в мультисеті). Я не чув жодної структури даних, яка дозволила б нам це робити (амортизований) постійний час.

y

$y$

y

$y$

— mnbvmar

@mnbvmar, можливо, німа пропозиція, але як щодо масиву розміру

, ви змітаєте та зупиняєте кожну клітинку

. Для осередку evry ви знаєте max

і можете вводити його в матрицю, крім того, ви можете відстежувати загальний максимум за допомогою змінної.

n

$n$

O (n)

$O(n)$

y

$y$

— invalid_id

Відповіді:

Сортувати обидва і координат ліній в двох окремих масивах і . $x1$ $x2$ $A$ $B$ $O(m)$
Ми також підтримуємо допоміжний бітовий масив розміром для відстеження активних сегментів. $n$
Почніть підмітати зліва направо:
для $(i=0,i<n,i++)$
{
..якщо з значення $\exists x1=i$ $y$ $c$ $O(1)$
.. {
.... знайти ( ) $\max$
.... магазин ( ) $\max$ $O(1)$
..}
..якщо з значення $\exists x2=i$ $y$ $c$ $O(1)$
.. {
.... знайти ( ) $\max$
.... магазин ( ) $\max$ $O(1)$
..}
}

find ( ) може бути реалізований за допомогою бітового масиву з бітами. Тепер, коли ми видаляємо або додаємо елемент до ми можемо оновити це ціле число, встановивши відповідно біт на true або false. Тепер у вас є два варіанти в залежності від використовуваної мови програмування, і припущення порівняно невелике, тобто менше, ніж що становить принаймні 64 біт або фіксовану кількість цих цілих чисел: $\max$ $n$ $L$ $n$ $long long int$

Отримання найменш значущого біта за постійний час підтримується деяким обладнанням та gcc.
Перетворивши на ціле число ви отримаєте максимум (не безпосередньо, але ви можете його отримати). $L$ $O(1)$

Я знаю, що це досить хак, тому що він передбачає максимальне значення для і, отже, може розглядатися як константа тоді ... $n$ $n$

— invalid_id
джерело

Як я бачу, якщо припустити, що у вас 64-розрядний процесор x86, ви можете обробляти лише

. Що робити, якщо

в порядку мільйонів?

n \leq 64

$n \le 64$

n

$n$

— mnbvmar

Тоді вам знадобиться більше цілих чисел. З двома цілими числами ви можете обробити

до 128 і т.д. Отже, максимальний крок пошуку

прихований у кількості необхідних цілих чисел, які ви все одно можете оптимізувати, якщо

невеликий. Ви згадали у своєму питанні, що

порівняно мало, тому я здогадався, що це не в порядку мільйонів. До речі, довгий int завжди є щонайменше 64 біт за визначенням навіть на 32-бітному процесорі.

n

$n$

O (m)

$O(m)$

m

$m$

n

$n$

— invalid_id

Звичайно, це правда, стандарт C ++ визначає long long intяк принаймні 64-бітний цілочисельний тип. Однак чи не так, що якщо

величезна, і розмір слова позначаємо як

(як правило,

), то кожен буде приймати

n

$n$

w

$w$

w = 64

$w=64$ find

час? Тоді ми б закінчилися сумарним

O (\frac{n}{w})

$O\left(\frac{n}{w}\right)$

O (\frac{m n}{w})

$O\left(\frac{mn}{w}\right)$

— mnbvmar

Так, на жаль, для великих значень

це так. Тож зараз мені цікаво, яка велика

буде у вашому випадку та чи обмежена вона. Якщо це дійсно в порядку мільйонів, цей злом більше не працюватиме, але якщо

при низьких значеннях

він буде швидким і практично

. Тож найкращий вибір алгоритму - як завжди, залежить від введення. Наприклад, для

сортування вставки зазвичай швидше, ніж сортування, навіть із часом роботи

порівняно з

n

$n$

n

$n$

c \cdot w \geq n

$c\cdot w\geq n$

c

$c$

O (n + m)

$O(n+m)$

n \leq 100

$n\leq 100$

O (n^{2})

$O(n^2)$

O (n \log n)

$O(n \log n)$

— invalid_id

Мене бентежить ваш вибір форматування. Ви знаєте, що тут можна ввести код, правда?

— Рафаель

У мене немає лінійного алгоритму, але цей здається O (m log m).

Сортуйте відрізки на основі першої координати та висоти. Це означає, що (x1, l1) завжди виникає раніше (x2, l2), коли x1 <x2. Крім того, (x1, l1) на висоті y1 передує (x1, l2) на висоті y2, коли y1> y2.

Для кожного підмножини з однаковою першою координатою робимо наступне. Нехай перший відрізок буде (x1, L). Для всіх інших сегментів підмножини: Якщо сегмент довший першого, то змініть його з (x1, xt) на (L, xt) і додайте його до L-підмножини у відповідному порядку. Інакше киньте його. Нарешті, якщо наступний підмножина має першу координату менше L, то розділіть (x1, L) на (x1, x2) і (x2, L). Додайте (x2, L) до наступного підмножини у правильному порядку. Ми можемо це зробити, тому що перший сегмент у підмножині вищий і охоплює діапазон від (x1, L). Цей новий сегмент може бути тим, що охоплює (L, x2), але ми цього не будемо знати, поки не подивимось на підмножину, яка має першу координату L.

Після проходження всіх підмножин у нас з'явиться набір сегментів, які не перетинаються. Щоб визначити, що значення Y для даного X, нам залишиться пропустити лише всі інші сегменти.

Тож у чому полягає складність: Сорт - O (m log m). Прокручування через підмножини - O (m). Пошук також є O (m).

Отже, здається, що цей алгоритм не залежить від n.

— Ніхто в окремому
джерело