Коли списки суміжності або матриці є кращим вибором?

Мені сказали, що ми будемо використовувати список, якщо графік розріджений, а матрицю, якщо графік щільний . Для мене це просто сире визначення. Я не бачу багато за цим. Чи можете ви уточнити, коли це був би природний вибір?

Спасибі заздалегідь!

— користувач21312
джерело

Пов’язано: stackoverflow.com/a/2218331/5746050 та stackoverflow.com/a/5419933/5746050

— ryan

Це не визначення, здебільшого тому, що немає єдиного визначення "розрідженого" та "щільного". Також є й інші міркування, наприклад, до яких аспектів графа ви звертаєтеся як часто.

— Рафаель

@Raphael Чи можете ви детальніше розповісти про інші міркування?

— користувач21312

@ user21312, велика різниця - це ітерабельність та доступ до країв. Якщо вам часто потрібно перебирати краї, то список коригувань може бути кориснішим. Якщо вам часто потрібно визначити, чи існує край чи отримати доступ до його ваги (або іншої інформації), матриця може бути кращою.

— ryan

З вашою метою ми, мабуть, могли б недбало ставитись до поняття "рідкісний" та "щільний". Просто змалюйте часову складність операції з матрицею, яку ви хочете використовувати для кожного типу структури даних, і подивіться, де знаходиться "точка розриву щільності". Я думаю, що друге посилання від @ryan намагається зробити щось подібне

— Apiwat Chantawibul

Відповіді:

Перш за все зауважте, що розріджений означає, що у вас дуже мало ребер, а щільний означає багато ребер або майже повний графік. У повному графіку у вас ребер, де - кількість вузлів. $n(n-1)/2$ $n$

Тепер, коли ми використовуємо матричне подання, ми виділяємо матрицю для зберігання інформації про з'єднання вузла, наприклад, якщо між вузлами та є край , інакше . Але якщо ми використовуємо список суміжності, то у нас є масив вузлів, і кожен вузол вказує на свій список суміжності, що містить ТОЛЬКІ сусідні вузли . $n\times n$ $M[i][j] = 1$ $i$ $j$ $M[i][j] = 0$

Тепер, якщо графік є рідким, і ми використовуємо матричне подання, то більшість матричних комірок залишаються невикористаними, що призводить до втрати пам'яті. Таким чином, ми зазвичай не використовуємо матричне подання для розріджених графіків. Ми віддаємо перевагу списку суміжності.

Але якщо графік щільний, то кількість ребер близько до (повного) , або до якщо графік спрямований з самокрутками. Тоді немає переваги використовувати список суміжності над матрицею. $n(n-1)/2$ $n^2$

З точки зору складності
простору Матриця суміжності: Список суміжності: де - кількість вузлів, - кількість ребер. $O(n^2)$
$O(n + m)$
$n$ $m$

Коли дерево є
непрямим деревом, тоді матриця суміжності: Список суміжності: є (краще, ніж ) $O(n^2)$
$O(n + n)$ $O(n)$ $n^2$

Коли графік спрямований, повний, із самозаймами, тоді
матриця суміжності: Список суміжності: є (різниці немає) $O(n^2)$
$O(n + n^2)$ $O(n^2)$

І нарешті, коли ви реалізуєте за допомогою матриці, перевірка наявності краю між двома вузлами займає разів, тоді як зі списком суміжності це може зайняти лінійний час у . $O(1)$ $n$

— fade2black
джерело

"Хоча зі списком суміжності, це може зайняти лінійний час". - Враховуючи, що у вашому списку суміжності (ймовірно) немає будь-якого природного порядку, чому це список замість хеш-набору?

— Кевін

@Kevin Тоді його називали б "хеш суміжності" замість "списку". Також можливо, чому б і ні? Але якщо ви просто зробите DFS або BFS, або якусь іншу процедуру, яка систематично сканує всі вузли, то яка перевага використання хешу над списком? У будь-якому випадку ви оглянете всі сусідні вузли.

— fade2black

Я додам, що у невагомому непрямому випадку для майже повного графа може бути доцільніше зберігати його доповнення, тобто розріджений графік. Тому матриця корисна, коли є приблизно половина ребер.

— М. Зимовий

Відповісти, запропонувавши просту аналогію. Якби вам довелося зберігати 6 унцій води, чи не зробили б ви це (взагалі кажучи) з контейнером на 5 галонів або з чашкою 8 унцій?

Тепер, повертаючись до свого питання .. Якщо більшість вашої матриці порожня, то навіщо її використовувати? Просто перелічіть кожне значення замість цього. Однак якщо ваш список дійсно довгий, чому б не просто використати матрицю, щоб згустити його?

Міркування за списком проти матриці насправді в цьому випадку прості.

PS список справді просто матриця однієї колонки !!! (намагаюся показати вам, наскільки це довільне рішення / сценарій)

Розглянемо графік з вузлами та ребрами. Ігноруючи умови низького порядку, бітова матриця для графіка використовує біт незалежно від кількості ребер. $N$ $E$ $N^2$

Скільки бітів вам насправді потрібно?

Якщо припустити, що краї є незалежними, кількість графіків з вузлами та ребрами дорівнює . Мінімальна кількість бітів, необхідних для зберігання цього підмножини, є . $N$ $E$ ${N^2 \choose E}$ $\log_2 {N^2 \choose E}$

Будемо вважати без втрати спільності, що , тобто, що половина або менше ребер є. Якщо це не так, ми можемо замість цього зберегти набір "не-ребер". $E \le \frac{N^2}{2}$

Якщо , , тож матричне подання є асимптотично оптимальним. Якщо , використовуючи наближення Стірлінга та трохи арифметики, знаходимо: $E = \frac{N^2}{2}$ $\log_2{N^2 \choose E} = N^2 + o(N^2)$ $E \ll N^2$

\log_{2} (\binom{N^{2}}{E})

$\log_2 {N^2 \choose E}$

= \log_{2} \frac{(N^{2})!}{E! (N^{2} - E)!}

$= \log_2 \frac {(N^2)!} {E! (N^2 - E)!}$

= 2 E \log_{2} N + O (low order terms)

$= 2E \log_2 N + O(\hbox{low order terms})$

Якщо ви вважаєте, що - це розмір цілого числа, яке може представляти індекс вузла, оптимальне представлення - це масив ідентифікаторів вузла, тобто масив пар індексів вузлів. $\log_2 N$ $2E$

Сказавши це, хорошим показником розрідженості є ентропія, яка також є кількістю бітів на край оптимального подання. Якщо є ймовірність наявності ребра, ентропія . Для ентропія дорівнює 2 (тобто два біти на край в оптимальному поданні), а графік щільний. Якщо ентропія значно більша за 2, і, особливо, якщо вона близька до розміру вказівника, графік є рідким. $p = \frac{E}{N^2}$ $- \log_2{p(1-p)}$ $p \approx \frac{1}{2}$

— Псевдонім
джерело