Чому Radix Sort ?

23

У сортуванні radix ми спочатку сортуємо за найменш значущою цифрою, потім сортуємо за другою найменш значущою цифрою тощо, і закінчуємо сортованим списком.

Тепер, якщо у нас є список з чисел, нам потрібно розрядів, щоб розрізняти це число. Так кількість поразрядной сортування проходить ми робимо буде . Кожен прохід займає час, а значить, час роботи сортування radix становить $n$ $\log n$ $\log n$ $O(n)$ $O(n \log n)$

Але добре відомо, що це лінійний алгоритм часу. Чому?

algorithms sorting

— Pratik Deoghare
джерело

Ось чому зазвичай лінійні сорти часу вимагають, щоб вхід був цілими числами за деякий фіксований діапазон. Для сортування Radix потрібен фіксований діапазон цифр. У вашому прикладі ви припускали, що діапазон був , але будь-який цілий діапазон можливий для цифр; наприклад, ви могли обрати

[0, 1]

$[0,1]$

[0, \sqrt{n}]

$[0, \sqrt{n}]$

— Джо

19

якщо у нас є список з чисел, нам потрібно бітів $n$ $\log n$

Ні: якщо у нас є список чисел від до , нам потрібно біт. Немає взаємин між і загалом. $0$ $2^k - 1$ $k$ $k$ $\log n$

Якщо цифри всі виразні, то , і сортування radix на окремі числа, отже, має складність у часі . Загалом, складність сортування радіокси є де - кількість елементів для сортування, а - кількість бітів у кожному елементі. $\log n \ge k$ $\Omega(n \log n)$ $\Theta(n \, k)$ $n$ $k$

Сказати, що складність сортування radix дорівнює означає прийняття фіксованого розміру бітів для чисел. Це означає, що для досить великого буде багато повторюваних значень. $O(n)$ $n$

Існує загальна теорема про те, що метод сортування масиву чи списку, який працює, порівнюючи два елементи за один раз, не може працювати у швидшому випадку, ніж . Сортування Radix не працює, порівнюючи елементи, але працює той самий метод підтвердження. Сортування Radix - це процес прийняття рішення для визначення, яку перестановку застосувати до масиву; єперестановки масиву і сортування radix приймають бінарні рішення, тобто він вирішує, замінювати два елементи чи ні на кожному етапі. Після бінарних рішень сортировка radix може визначати перестановки . Щоб досягтиможливі перестановки, необхідно, щоб . $\Theta(n \log n)$ $n!$ $m$ $2^m$ $n!$ $m \ge \log (n!) = \Theta(n \log n)$

Припущення в доказі того, що я не писав вище, полягає в тому, що алгоритм повинен працювати в тому випадку, коли елементи відрізняються. Якщо апріорі відомо, що елементи не всі виразні, то кількість потенційних перестановок менше повного. При сортуванні -бітових чисел можливе лише різних елементів, коли ; у цьому випадку складність сортування радіасів дійсно є . Для більших значень повинні бути зіткнення, що пояснює, як сортування радіокси може мати складність, меншу ніж коли . $n!$ $k$ $n$ $n \le 2^k$ $\Omega(n \log n)$ $n$ $\Theta(n \log n)$ $n \gt 2^k$

— Жил "ТАК - перестань бути злим"
джерело

1

Альтернативною точкою зору є модель вартості слова RAM: наша машина може працювати з цілими числами біт у постійному часі. (Поточні машини, що мають ) Таким чином, один крок сортування з відрами можна зробити за час, безпосередньо звернувшись до відповідного елемента масиву. Таким чином, сортування radix є лінійним для цілих чисел бітів кожне.

w

$w$

w = 64

$w=64$

2^{w}

$2^w$

O (1)

$O(1)$

n

$n$

w = O (\log n)

$w=O(\log n)$

— Себастьян

9

Будьте обережні зі своїм аналізом: як ви вважаєте, щоб зробити сортування за час? Це відбувається тому, що кожна ваша цифра знаходиться в діапазоні від до , тобто ваші цифри можуть приймати можливих значень. Вам потрібен стабільний алгоритм сортування, так що ви можете, наприклад, вибрати сортування підрахунку. Підрахунок сортування працює в час. Якщо , підрахунок сортування працює за лінійним часом. $O(n)$ $0$ $k-1$ $k$ $\Theta(n+k)$ $k=O(n)$

У кожному з ваших рядків чи чисел є -знаки. Як ви кажете, ви робите проходи над ними. Отже, сортування radix чітко працює за . Але якщо ми вважаємо постійним і , ми бачимо, що сортувальний радіус працює в лінійний час. $d$ $d$ $\Theta(d(n+k))$ $d$ $k=O(n)$

— Джухо
джерело

1

Наприклад, припустимо, що ви сортуєте цілі числа в діапазоні для деяких для постійної . Тоді ви можете мати цифри з діапазоном .

[0, N - 1]

$[0, N-1]$

N = O (n^{d})

$N = O(n^d)$

d

$d$

O (d)

$O(d)$

O (n)

$O(n)$

— Джо

-2

Я думаю, припущення неправильне. Ви можете виконати сортування в радіаційному режимі з числами, наприклад, у шістнадцяткові. Таким чином, на кожному кроці ви розділяєте масив чисел на відер. $k = \log_2(n)$ $16$

— Олександр Кандалінцев
джерело

6

Що стосується big-O, то різниці між та .

\log_{2} n

$\log_2n$

\log_{16} n

$\log_{16}n$

— Рік Декер