Я набираю це досить швидко через суворі часові обмеження (і навіть не потрапив до відповіді раніше з тієї ж причини), але я подумав, що спробую принаймні чіпнути свої два центи.
Я думаю, що це справді велике запитання, і я витратив нетривіальну кількість часу за останні кілька років на це. (Повне розкриття: я отримав значну частину свого поточного фінансування саме для того, щоб спробувати знайти відповіді на запитання такого типу, а потім потенційно перетворити більш глибоке розуміння на SAT у більш ефективні SAT-рішення.)
Якщо треба було б дати відповідь в одному реченні, я думаю
насправді ніхто не знає, і це активна область досліджень
майже так само добре, як це отримує. За винятком того, що є набагато більше місця для більшої активності, особливо з боку теорії.
Деякі запропоновані пояснення (не взаємовиключні), про які вже йшлося в інших відповідях та коментарях, є
- (a) на задньому плані,
- (b) параметризовані міркування щодо складності,
- (c) графічна структура проблеми CNF,
- (d) міркування щодо складності доказів та
- (д) фазові переходи.
Починаючи з кінця (е), здається, існує певна плутанина щодо фазових переходів. Коротка відповідь тут полягає в тому, що немає жодних причин вважати, що співвідношення пропозицій до змінних є актуальним для прикладних задач або теоретичних комбінаторних проблем (він же створений екземпляри). Але чомусь в застосованій частині спільноти SAT не надто рідкісне уявлення про те, що співвідношення клауз до змінних якось має бути загальноприйнятним заходом. Співвідношення клауза до змінної дуже актуально для випадкових k-SAT, але не для інших моделей.
Моє відчуття, що на задньому плані (а) було популярним поясненням, але я особисто не бачив переконливих доказів того, що це пояснює те, що відбувається на практиці.
Параметризована складність (b) дає прекрасну теорію про деякі аспекти SAT, і дуже привабливою гіпотезою є те, що випадки використання SAT є простими, оскільки вони, як правило, «близькі до якогось острова тяги». Я думаю, що ця гіпотеза відкриває багато захоплюючих напрямків дослідження. Як зазначається в деяких відповідях, існує велика кількість зв’язків між (a) та (b). Однак поки що я не бачу жодних доказів того, що параметризована складність занадто корелює з тим, що відбувається на практиці. Зокрема, здається, що випадки, які можна простежити, можуть бути дуже, дуже важкими на практиці, а випадки без невеликих задніх куточків все ще можуть бути дуже простими.
Пояснення, яке видається мені найбільш вірогідним для промислових випадків, - це (с), а саме те, що (графічна) структура формул CNF повинна бути співвіднесена з практичними показниками SAT. Ідея тут полягає в тому, що змінні та пункти промислових примірників можуть бути об'єднані у добре пов'язані спільноти з невеликим зв’язком між собою, і що вирішувачі SAT якимось чином використовують цю структуру. На жаль, здається, що це досить важко зафіксувати це більш жорстко, і однаково, на жаль, ця область страждає від великої кількості галасу. Пропоновані пояснення, які я бачив до цього часу в документах, є досить незадовільними, і моделі, здається, легко збити. Проблема, здається, полягає в тому, що якщо людина дійсно хоче це зробити ретельно, тоді математика стає дуже важкою (тому що це важка проблема), а також стає надзвичайно брудною (тому що вам потрібна ваша модель, щоб бути досить близькою до реальності, щоб отримати відповідні результати). Зокрема, документи, які я бачив, пояснюючи, що ефективність VSIDS (змінної від незалежної від спадання суми, що спадає) евристична для змінних виборів працює добре, оскільки вона досліджує спільноти в графічному представленні примірників досить непереконливі, хоча гіпотеза як така все ще є дуже привабливий.
Один напрямок досліджень, який я особисто проводив, полягає в тому, чи практичне виконання SAT якимось чином співвідноситься з мірами складності доказових формул CNF. На жаль, коротка відповідь здається, що насправді немає чіткого і переконливого зв’язку. Можливо, все ще існують нетривіальні кореляції (це те, що ми зараз досліджуємо різними способами), але здається, що теорія є надто приємною та чистою та гарною, і реальність занадто безладна, щоб мати справді хороший збіг. (Щодо документа, що стосується заходів щодо доказів складності та практичної твердості SATЯрвісало, Матслах, Нордстрем і Живне в КР '12 виявилося, що більш детальні експерименти дають набагато складнішу картину з менш чіткими висновками --- ми сподіваємося отримати повну версію журналу, що повідомляє про це будь-яке десятиліття, але це складно, хоча все ще сподіваємось цікаво.)
Інший, пов'язаний з цим, напрямок роботи зі складною доказовою здатністю полягає в моделюванні сучасних розв'язувачів SAT як доказових систем та доведенні теорем у цих моделях для виведення властивостей відповідних розв'язувачів. Це трохи мінне поле, хоча в тому, що невеликий і, здавалося б, нешкідливий вибір дизайну з боку теоретичної моделі може призвести до того, що результати з практичної точки зору є абсолютно невідповідними. З іншого боку, якщо ви хочете, щоб теоретична модель була досить близькою до реальності, щоб дати відповідні результати, то ця модель стає надзвичайно брудною. (Це тому, що ефективність вирішувача SAT залежить від глобальної історії всього, що сталося до цього часу нетривіальними способами, і це означає, що модель не може бути модульною в тому, як ми зазвичай встановлюємо наші системи доказів --- будь то конкретний крок виведення "правильно"
Два видання, які справді слід згадати як винятки з цього, є [Pipatsrisawat і Darwiche 2011] та [Atserias, Fichte та Thurley 2011], де показано, що кероване конфліктом зауваження про розв'язування SAT, змодельованим природним чином, має потенціал поліноміально моделювати повну загальну роздільну здатність. Існує досить довгий список робіт, що передують [PD11] та [AFT11], які по суті вимагають однакового результату, але всі вони мають серйозні проблеми з моделюванням. (Це правда, що [PD11] та [AFT11] також потребують певних припущень для роботи, але вони є майже тими, з яких ви б очікували, якщо ви не будете просити документи, які також показали б, що параметризована ієрархія складності руйнується.)
Знову ж таки, я пишу все це дуже швидко, але якщо є істотний інтерес для чогось із перерахованого, я б спробував доопрацювати (хоча, щоб повернутися до цього знову, може знадобитися деякий час --- будь ласка, не соромтеся надіслати мені повідомлення, якщо є ви хочете, щоб я коментував). Як швидкий спосіб надання довідок, дозвольте мені зробити кілька безсоромних самороз'ємів (хоча сором дещо зменшується, коли я бачу, що деякі коментарі також цитують деякі з цих посилань):
Розмова в стилі підручника Про взаємодію між доказовою складністю та рішенням SAT, що проводиться в Міжнародній літній школі щодо задоволеності, теорій модуля задоволеності та автоматизованого обґрунтування в 2016 році, з великою кількістю повних посилань на кінець слайдів: http://www.csc .kth.se / ~ jakobn / дослідження / TalkInterplaySummerSchool2016.pdf
Трохи свіжіші та більш короткі розмови з опитування Розуміння SAT-рішення , кероване конфліктом через об'єктив доказів складності з початку 2017 року (також із повними посиланнями в кінці): http://www.csc.kth.se/~jakobn/research /TalkProofComplexityLensCDCL1702.pdf
Огляд зв’язків між складністю доказування та вирішенням SAT: http://www.csc.kth.se/~jakobn/research/InterplayProofCplxSAT.pdf [Бібліографічна довідка: Jakob Nordström. Про взаємодію між доказовою складністю та рішенням SAT. Новини ACM SIGLOG, том 2, номер 3, стор. 19-44, липень 2015 р. (Легко відредагована версія з виправленими помилками друку).]]
Папір SAT '16 із CDCL сумлінно моделюється як система доказування: http://www.csc.kth.se/~jakobn/research/Trade-offsTimeMemoryModelCDCL_SAT.pdf [Бібліографічна довідка: Ян Елферс, Ян Йогансен, Массімо Лаурія, Томас Маґнард , Якоб Нордстрем та Марк Віньялс. Компроміси між часом і пам’яттю в більш жорсткій моделі вирішувачів CDCL SAT. У працях 19-ї міжнародної конференції з теорії та застосувань тестування на задоволення (SAT '16), Записки лекції з інформатики, том 9710, сторінки 160-176, липень 2016 р.]