Різка концентрація для відбору шляхом випадкового розподілу?


11

Звичайний простий алгоритм знаходження серединного елемента в масиві з чисел:нAn

  • Зразок елементів з із заміною на Бn3/4AB
  • Сортування і знайти ранг елементів і про| Б | ± B lrB|B|±nlrB
  • Переконайтеся, що і знаходяться на протилежних сторонах медіани і що в між та є не більше елементів для деякої відповідної постійної . Не вдасться, якщо цього не відбудеться.r A C lrA AlrC>0CnAlrC>0
  • В іншому випадку знайдіть медіану, відсортувавши елементи між таl rAlr

Не важко зрозуміти, що це працює в лінійний час і що це досягає високої ймовірності. (Усі погані події - це великі відхилення від очікування бінома.)

Альтернативний алгоритм цієї ж проблеми, який природніше навчити студентам, які побачили швидке сортування, є описаним тут: Випадковий вибір

Неважко також помітити, що цей має лінійний очікуваний час роботи: скажіть, що "раунд" - це послідовність рекурсивних викликів, яка закінчується, коли дається розділення 1 / 4-3 / 4, а потім спостерігайте, що очікувана тривалість круглий максимум 2. (У першому розіграші раунду ймовірність отримати хороший розкол становить 1/2, а потім після того, як насправді збільшується, як алгоритм був описаний, так що довга кругла переважає геометрична випадкова величина.)

Отже, тепер питання:

Чи можливо показати, що рандомізований вибір проходить у лінійний час з високою ймовірністю?

У нас є раунди, і кожен раунд має довжину принаймні з вірогідністю не більше , тому зв'язане з'єднання дає, що час запуску - з ймовірністю .k 2 - k + 1 O ( n log log n ) 1 - 1 / O ( log n )O(logn)k2k+1O(nloglogn)11/O(logn)

Це свого роду незадовільно, але чи це насправді правда?


Поясніть, до якого алгоритму стосуються ваших питань.
Рафаель

Ви запитуєте, чи правильно ви застосували свій союз, чи є краща, більш задовольняюча межа?
Джо

@Joe Останній. Справа в тому, що круглі - це артефакт, щоб отримати, що довга круглої форми переважає геометричну. Тоді аналізи «забувають», чи алгоритм попереду чи позаду того, який завжди отримує 1 / 4-3 / 4 розкол на носі, щоб зробити геометрію незалежною. Мене запитують, чи все-таки це "обман", як Юваль висловився нижче.
Луї

Відповіді:


5

Θ(n)G(1/2)p(n)0Ω ( п вході 2 р ( п ) - 1 ) = ω ( п )Pr[G(1/2)log2p(n)1]=p(n)Ω(nlog2p(n)1)=ω(n)

(Існує деяка обман, оскільки тривалість першого раунду насправді не . Більш ретельний аналіз може відповісти або не підтвердити цю відповідь.)G(1/2)

Правка: Грюбель та Рослер довели, що очікувана кількість порівнянь, поділених на тенденцій (у певному сенсі) до деякого граничного розподілу, що не є необмеженим. Дивіться, наприклад, статтю Грюбеля "Алгоритм вибору Хоара: ланцюговий підхід Маркова", де посилається на їх оригінальний документ.n


Ось річ, яка мене турбує. Як я вже говорив у своєму коментарі вище, раунди - це лише спосіб аналізу «уповільненої» версії алгоритму, який чекає, поки він отримає достатньо хороший шар для продовження. Що ви показуєте, це те, що для будь-якого фіксованого ймовірність першого раунду потребує більше, ніж поворотів . Але, в принципі, довгий перший раунд може бути компенсований порожнім 2-м раундом, в тому сенсі, що в кінці кінця алгоритм "не уповільнений" наздогнав той, який завжди отримує розрив 1 / 4-3 / 4 . C > 0C>0C>0
Луї

1
Це неправда, якщо перший раунд довгий, то весь час бігу довгий, оскільки подальший раунд не може скоротити час виконання. Справа в тому, що для будь-якого перший тур потребує часу щонайменше з деякою постійною ймовірністю . C n p C > 0CCnpC>0
Yuval Filmus

Зараз я щасливіший, оскільки кругла довжина не набагато менша, ніж геометрична, яка використовується для верхньої межі. Я думаю, що це те, що G&R робить небезпечними. Гарна відповідь.
Луї
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.