Важливість розриву інтегральності


44

У мене завжди були проблеми в розумінні важливості розриву інтегральності (IG) та меж цього. IG - відношення (якості) оптимальної цілої відповіді до (якості) оптимального реального рішення розслаблення задачі. Розглянемо приклад вершини (VC) як приклад. ВК можна констатувати як пошук оптимального цілого рішення наступного набору лінійних рівнянь:

Для кожної вершини v V ( G ) графа G маємо нуль / одну величину змінних xv s . Рівняння: 0 x v1 для v V ( G ) , і 1 x v + x u для кожного краю u v E ( G ) . Ми шукаємо значення, які мінімізують v V ( G )vV(G)G0xv1vV(G)1xv+xuuvE(G)vV(G)xv .

Розслаблення цієї проблеми дозволяє реальні значення між 0 і 1 тому простір рішень більший, а оптимальне реальне рішення може бути меншим, ніж оптимальне ціле рішення, яке ми хочемо знайти. Тому нам потрібно здійснити процес "округлення" за оптимальною реальною відповіддю, отриманою з лінійного програмування, щоб знайти ціле рішення. Оптимальне ціле рішення буде знаходитися між оптимальним реальним рішенням та результатом процесу округлення. IG - відношення оптимального цілого рішення до оптимального реального рішення і нічого не говорить про процес округлення. Процес округлення може (теоретично) повністю ігнорувати реальне рішення і безпосередньо обчислювати оптимальне ціле рішення.

Чому люди зацікавлені довести межі на IG?


8
Два невідповіді: (1) Емпірична інформатика. Досить часто (звичайно, не завжди!) Здається, що розрив інтегральності - твердість наближення, принаймні за деякими припущеннями. Отже, якщо ви не знаєте, як важко наблизити задачу X, доведення чітких меж на розрив цілісності може дати вам здогадку. У вас є хоча б здогадка, яку ви можете спробувати довести. (2) Якщо ваш алгоритм порушує розрив цілісності, це може бути ознакою того, що ваш алгоритм робить щось цікаве (наприклад, використання приємних комбінаторних властивостей конкретної проблеми).
Jukka Suomela

3
Чарльз, прогалини інтегральності - це активна область в рамках теорії складності в наші дні. Часто люди виявляють прогалини для великих сімей відпочинку (а не одного розслаблення). У цьому випадку можна вважати такі результати, як доведення нижчих меж проти цікавої обчислювальної моделі. Існують також глибокі зв’язки із доказовою складністю.
Моріц

Відповіді:


30

Проміжки інтегральності по суті представляють притаманні межі конкретного лінійного або опуклого релаксації у наближенні до цілої програми. Як правило, якщо розрив цілісності конкретного релаксації дорівнює , то будь-який алгоритм наближення, заснований на цьому релаксації, не може сподіватися зробити краще, ніж апроксимація x . Отже, принаймні, прогалини інтегральності цікавлять розробників алгоритмів, оскільки вони пропонують обмеження в певних методах. xx

То чому б просто не придумати ще одне розслаблення LP або перейти на інші методики і рухатися далі? Лінійне та опукло програмування виявилися центральними у алгоритмах наближення; для багатьох проблем розрив інтегральності природного формулювання LP або SDP дорівнює коефіцієнту наближення найкращого алгоритму, а також коефіцієнту твердості апроксимації. Це лише емпіричне спостереження, але це означає, що доведення розриву цілісності може запропонувати набагато сильніші наслідки вдосконаленого алгоритму або нижньої межі.

Можуть бути більш глибокі і жорсткі причини цього явища. Наприклад, припускаючи унікальну гіпотезу гігієни, відомо, що коефіцієнт апроксимації та коефіцієнт непридатності для задач задоволення обмеженнями дорівнює розриву цілісності простого релаксації СДП (див. Оптимальні алгоритми та результати непридатності для кожної ДСП? Прасада Рагхавендра)

PNP



17

Розрив цілісності є корисним показником того, наскільки добре можна визначити IP. Можливо, краще буде подумати про це неофіційно, інтуїтивно. Високий розрив цілісності означає, що певні методи не працюватимуть. Деякі первинні / подвійні методи, наприклад, залежать від невеликого розриву цілісності. Для стандартного первинного вершинного кришки LP подвійний LP вимагає максимальної відповідності. У цьому випадку ми можемо зробити наступне:

  • знайти оптимальне дробове рішення до подвійного LP (максимальна дробова відповідність)y
  • помножимо розчин на коефіцієнт 2 (подвоїти всі ваги ребер)y
  • перетворіть це у можливий інтеграл для первинного LP (кожне ребро дає половину своєї ваги від вектора до кожної його кінцевої точки у векторі , тоді кожен є замінено на ).x2yxximin(xi,1)

У цьому випадку ця проста стратегія працює, і ми закінчуємо можливим інтегральним рішенням первинного LP, вага якого не більше ніж удвічі перевищує вагу можливого рішення для подвійного LP. Оскільки вага можливого рішення для подвійного LP є нижньою межею для OPT, це алгоритм 2-наближення.

Тепер, звідки береться розрив цілісності? ІГ в цьому випадку 2, але це одне не означає, що алгоритм буде працювати. Швидше, це говорить про те, що це може спрацювати. І якщо ІГ було б більше 2, це гарантувало б, що проста стратегія не завжди спрацює. Принаймні, нам доведеться помножити подвійне рішення на IG. Отже, розрив цілісності іноді говорить нам про те , що не буде працювати. Розрив цілісності також може вказувати, на який фактор наближення ми можемо сподіватися. Невеликий розрив цілісності говорить про те, що дослідження стратегій округлення тощо може бути гідним підходом.

Для більш цікавого прикладу розглянемо задачу набору ударів та потужну техніку наближення задачі за допомогою -nets (Brönnimann & Goodrich, 1995) . Багато проблем можна сформулювати як екземпляри Hitting Set, і стратегія, яка була успішною для багатьох проблем, - це зробити, а потім просто знайти хороший чистий пошук, тобто алгоритм побудови малих -nets, і прокрутити все через мета-алгоритм B&G. Тож люди (включаючи мене) намагаються знайти чисті шукачі для обмежених екземплярів Hitting Set, які для будь-якого можуть створити -net розміром , де функціяεεεεf(1/ε)fмає бути якомога менше. Маючи - типова мета; це дало б -приближення.f(1/ε)=O(1/ε)O(1)

Як виявляється, найкраща можлива функція обмежена розривом цілісності певного LP для множини ударів (Even, Rawitz, Shahar, 2005) . Зокрема, оптимальні інтегральні та дробові рішення задовольняють . Для необмежених випадків встановлення натискання розрив цілісності становить , але при формулюванні іншої проблеми, як Hitting Set, IG може бути нижчим. У цьому прикладі автори показують, як знайти -nets розміруfOPTIf(OPTf)Θ(log(m))εO((1/ε)loglog(1/ε))для обмежених випадків набору наборів, які відповідають проблемі попадання осі-паралельних полів. Таким чином вони покращуються за найбільш відомим фактором наближення цієї проблеми. Це відкрита проблема, чи можна це покращити чи ні. Якщо для цих обмежених випадків набору Hitting Set IG для LP Hitting Set є , неможливо було б створити чистий пошук, що гарантує -nets розміру , оскільки це буде означати існування алгоритму, який гарантує інтегральні набори наборів розміру , але оскількиΘ(loglogm)εo((1/ε)loglog(1/ε))o(OPTfloglogOPTf)OPTfmце означатиме менший розрив інтегральності. Тож якщо розрив інтегральності великий, це доводить, що це може завадити людям витрачати час на пошуки хороших мережевих шукачів.


13

Коли ви розробляєте алгоритм наближення для певної проблеми з максимальною жорсткістю NP, вам можуть бути цікаві кілька значень: Є OPT, оптимальне значення вашої проблеми, таке ж, як OPT (IP), оптимальне значення будь-якої правильної IP-постановки вашої проблеми. Є також OPT (LP), оптимальне значення лінійної релаксації вашого IP.

OPT(LP)OPT(IP)

Нарешті, є V, значення рішення, яке ви в кінцевому підсумку отримуєте шляхом округлення розчину LP. Ви хотіли б довести, що щоб показати, що ваш алгоритм є наближенням , але це часто неможливо зробити безпосередньо, оскільки у вас немає утримуйте простір рішення. Натомість, майже завжди доводиться, що . Звичайно, це означає, що , але сильніше. Зокрема, якщо розрив інтегральності вашої формули IP-адреси перевищує , вищезазначене твердження в цілому буде помилковим, оскільки ваша процедура округлення закінчується цілісним рішенням.V>OPT(IP)ccVOPT(LP)cV>OPT(IP)cc

Тож суть у цьому: LP дає вам рішення, яке ви знаєте "добре", і ви хочете округлити його до чогось, що "майже так само добре". Якщо розрив цілісності великий, це взагалі неможливо, оскільки ніколи не буде процедури, яка гарантує отримання цілісного рішення, яке є «настільки ж хорошим», як рішення LP - адже іноді таких не існує!


12

Ви маєте рацію в тому, що розрив цілісності релаксації не має жодного стосунку до жодного алгоритму округлення. Це два різних поняття. Розрив цілісності є властивістю певного розслаблення. Тобто, наскільки більша величина цього релаксу порівняно з оптимальною інтегральною величиною?

Чому ми дбаємо про лінійні / опуклі розслаблення? Для ефективного наближення інтегрального значення. Отже, ми зазвичай розмовляємо про релаксацію лише у тих випадках, коли оптимальне значення важко обчислити, і нас цікавлять ефективні наближення. Прогалини в інтегральності показують нам властиві обмеження того, що можна досягти за допомогою таких методів.

Отже, чому ми піклуємось про алгоритми округлення поверх релаксації? Ми використовуємо алгоритми округлення, щоб вирішити алгоритмічну задачу пошуку майже оптимального рішення на відміну від просто наближення значення оптимального рішення. Більше того, часто алгоритми округлення використовуються, перш за все, для обмеження цілісного розриву релаксації.


Точно, здається, що люди цікавляться формулюваннями IP та їх розслабленням через алгоритми наближення вихідної проблеми, але я не розумію, що ми дізнаємось про результуючі алгоритми наближення, доказуючи обмеження на IG.
Каве

11

Технічно розрив цілісності призначений для конкретного формулювання IP, а не (як ви це сформулювали) співвідношення між найкращим лінійним релаксацією та оптимальним рішенням (яке, як видається, кількісно оцінюється за ВСІМ формулюваннями IP).

Розрив цілісності важливий, оскільки він показує межі конкретного препарату LP, який використовується. Якщо я знаю, що певна релаксація має розрив цілісності , то я також знаю, що якщо я колись сподіваюся довести межу кращої за , мені потрібно буде використовувати інший склад .cc


Привіт Суреш. Дякую, я знав, що IG призначений для конкретного формулювання IP, вибачте, якщо я не вказав його правильно. Чого я не розумію - це співвідношення IG з алгоритмами наближення та остаточну відповідь, яку ми отримуємо в кінці процесу округлення. Мені здається, що IG є геометричною властивістю конкретного реального розслаблення до вихідної проблеми і її відношення до алгоритмів наближення для мене не зрозуміло. Хочу дізнатися більше про причини, які роблять межі ІГ цікавими, особливо щодо алгоритмів наближення.
Kaveh

Привіт, Каве, я намагався уточнити конкретно ці моменти у своїй відповіді. Можливо, це допомагає.
Моріц

3
Особливо захоплююча відповідь на ваше запитання - атака Swart на P проти NP шляхом спроби побудувати лінійну програму для TSP, яка мала цілі рішення. Михаліс Яннакакіс написав цей прекрасний документ, який потім показав, що NO симетрична релаксація TSP допускає формулювання розміру полі з цілими розчинами ( dx.doi.org/10.1016/0022-0000(91)90024-Y ).
Суреш Венкат

6

Був дуже цікавий документ "Про перевагу мережевого кодування для поліпшення пропускної здатності мережі", який показав, що розрив інтегральності "двонаправленого розслаблення розрізу" для проблеми дерева Штайнера точно дорівнює типу "переваги кодування" в мережевому спілкуванні. Я не знаю багатьох інших подібних паперів. Однак слід також зазначити, що на перший погляд відомі кращі розслаблення LP для проблеми дерева Штейнера (наприклад, див. Новий алгоритм апроксимації на основі гіпертографічних LP від ​​Byrka та ін. В STOC 2010, я також безсоромно добровільно подав заяву, що був співавтором деяких останніх робіт, що вивчають гіперграфічний LP).


6

Більшість відповідей вже стосуються головної причини, що турбується про розрив цілісності, а саме те, що алгоритм наближення, що базується виключно на використанні пов'язаних, що забезпечуються релаксацією, не може сподіватися довести коефіцієнт кращий, ніж розрив цілісності. Дозвольте навести дві інші мета причини, чому розрив інтегральності є корисним посібником. Для великого класу задач комбінаторної оптимізації еквівалентність поділу та оптимізації показує, що точні алгоритми тісно пов'язані з опуклим корпусом можливих рішень проблеми. Таким чином, геометрична та алгоритмічна перспектива дуже тісно пов'язані між собою. Подібна формальна еквівалентність не відома алгоритмам наближення, але вона є корисною інструкцією - алгоритми йдуть рука об руку з геометричними релаксаціями. Алгоритмічна інновація буває тоді, коли люди мають конкретну мету покращити.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.