Вимірювання випадковості формул CNF

Широко відомо, що формули CNF можна грубо розділити на 2 широкі класи: випадкові та структуровані. Структуровані формули CNF на противагу випадковим формулам CNF демонструють певний порядок, показуючи шаблони, які навряд чи трапляться випадково. Однак можна знайти структуровані формули, що показують певну ступінь випадковості (тобто певні конкретні групи пропозицій здаються значно менш структурованими, ніж інші), а також випадкові формули зі слабкою формою структури (тобто певні конкретні групи пропозицій здаються менш випадковими, ніж інші ). Отже, здається, що випадковість формули - це не лише факт так / ні факт.

Нехай - функція, яка за формулою CNF повертає реальне значення від до включно: означає чисту структуровану формулу, а означає чисту випадкову формулу. $r: \mathcal{F} \rightarrow [0,1]$ $F \in \mathcal{F}$ $0$ $1$ $0$ $1$

Цікаво, чи хтось коли-небудь намагався вигадати такий . Звичайно, значення, повернене було б (принаймні, це моя мета) лише практичним вимірюванням за деякими розумними критеріями, а не твердою теоретичною правдою. $r$ $r$

Мені також цікаво дізнатися, чи хтось коли-небудь визначав і вивчав будь-який статистичний показник, який може бути використаний при визначенні , або при визначенні інших загальних корисних властивостей формули. Під статистичним показником я маю на увазі щось подібне: $r$

ВГС (Hit Count дисперсії)

Нехай бути функцією , яка, з урахуванням змінної , повертає число раз з'являється в . Нехай безліч змінних , використовуваних в . Нехай $h_F: \mathbb{N} \rightarrow \mathbb{N}$ $v_j \in \mathbb{N}$ $v_j$ $F$ $V$ $F$ - AHC (середня кількість хітів). ВГС визначають так: $\bar{h}_F = \frac{1}{|V|} \sum_{v_j \in V}{h_F(v_j)}$

У випадкових випадках ВГС дуже низький (усі змінні згадуються майже однакову кількість разів), тоді як у структурованих випадках це не так (деякі змінні використовуються дуже часто, а деякі інші - ні, тобто є "кластери використання"). $HVC = \frac{1}{|V|} \sum_{v_j \in V}{(h_F(v_j) - \bar{h}_F)^2}$
ДОПОМОГА (середня ступінь домішки)

Нехай - кількість разів, коли виникає позитивно, а - кількість разів, коли вона виникає негативно. Нехай є функцією, яка за змінної повертає свій ідентифікатор (ступінь домішки). Функція визначається так: $h_F^{+}(v_j)$ $v_j$ $h_F^{-}(v_j)$ $i: \mathbb{N} \rightarrow [0,1]$ $v_j \in V$ $i(v_j)$ . Ці змінні, що зустрічаються в половині разів позитивних і в половині разів негативних, мають максимальну ступінь домішки, тоді як ті змінні, які завжди є позитивними або завжди негативними (тобто чисті літерали), мають мінімальний ступінь домішки. AID просто визначається так: $i(v_j) = 2 \cdot \frac{min(h_F^{+}(v_j), h_F^{-}(v_j))}{h_F(v_j)}$

У випадкових екземплярах (принаймні, у тих, що генеруються за допомогою відмови від змінних з вірогідністю), AID майже дорівнює, тоді як у структурованих випадках він зазвичай далеко не дорівнює. $AID = \frac{1}{|V|} \sum_{v_j \in V}{i(v_j)}$

$0.5$ $1$ $1$
IDV (варіація ступеня домішки)

IDV є більш надійним показником, ніж сам AID, оскільки він обчислює випадкові випадки, генеровані за допомогою відміни змінних з вірогідністю, що відрізняється від . Він визначається як: $0.5$

$IDV = \frac{1}{|V|} \sum_{v_j \in V}{(i(v_j) - AID)^2}$

$0$ $0$

Мотивації

Щоб краще зрозуміти, як працюють формули CNF, як можна визначити їх випадковість / структуру, чи можна було б визначити інші корисні загальні властивості, переглядаючи їхні статистичні показники, якщо і як такі показники можна використовувати для прискорення пошуку.
Поцікавтеся, чи можна було б відповідати про задоволеність (чи навіть кількість рішень) формули CNF, просто розумно маніпулюючи її статистичними показниками.

Запитання

Хто-небудь пропонував спосіб вимірювання випадковості формули CNF?
Хто-небудь пропонував будь-який статистичний показник, який можна використовувати для вивчення або навіть механічного підрахунку корисних загальних властивостей формули CNF?

— Джорджіо Камерані
джерело

див. статтю у цій відповіді ( cstheory.stackexchange.com/questions/4321/… ). Це може дати вам підказку, як визначити такий r

— Маркос

можливо відповідна дискусія щодо вимірювання випадковості бітових рядків mathoverflow.net/questions/37518/…

— Ярослав Булатов

Я можу вам сказати це багато, оскільки я над цим працював певний час. Якщо врахувати SAT, формули для 1 і 2 є експоненціальними. З іншого боку, для k-SAT формули для 1 і 2 є многочленними. Це стосується мого ЦІННОГО ВИЗНАЧЕННЯ ЗАПИТАННЯ КОНТАКТУ КОНТАКТУ, на яке, схоже, ніхто не хоче відповісти.

— Tayfun Pay

@Geekster: Ви хочете дати відповідь тут?

— Hsien-Chih Chang 2 之

@Geekster: Що ви маєте на увазі під "... формули для 1 та 2 - експоненціальні" ?

— Джорджіо Камерані

Я пропоную запозичити інтуїцію фізики про те, що "менш випадкові" структури більш симетричні. Симетрія для CNF - це будь-яка трансформація змінних, яка зберігає функцію інваріантною. За цим критерієм функціонують 3 змінні, такі як

$\displaystyle x_{1} \vee x_{2} \vee x_{3} .$

або, скажімо,

$\displaystyle(x_{1} \vee x_{2} \vee \neg x_{3}) \wedge (x_{1} \vee \neg x_{2} \vee x_{3}) \wedge (\neg x_{1} \vee x_{2} \vee x_{3}) \wedge (\neg x_{1} \vee \neg x_{2} \vee \neg x_{3}).$

менш випадкові, ніж, скажімо

$\displaystyle(x_{1} \vee x_{2} \vee \neg x_{3}) \wedge (x_{1} \vee \neg x_{2} \vee x_{3}) \wedge (\neg x_{1} \vee \neg x_{2} \vee x_{3}) .$

Взагалі, визначення поняття "випадкове" на кінцевих структурах є складним. Історично це було випробувано на бінарних послідовностях, які, мабуть, є найпростішими кінцевими структурами. Наприклад, інтуїтивно, послідовність 01010101 є "менш випадковою", ніж, скажімо, 01001110. Однак швидко було зрозуміло, що не існує послідовного формального визначення кінцевої випадкової послідовності! Тому слід скептично ставитися до будь-яких наївних спроб визначити міру випадковості для будь-якої кінцевої структури.

— Тегірі Ненаші
джерело

Я повністю згоден з інтуїцією: "структура означає наявність симетрій, тоді як випадковість означає відсутність симетрії" . Ви посилаєтесь на синтаксичні симетрії (тоді як семантичні симетрії - це ті, що змінюють функцію, але залишають простір рішення незмінним). Я завжди був переконаний, що ключова симетрія є ключовою.

— Джорджіо Камерані

@ Уолтер: Ідея симетрії - це спроба використовувати алгебру, а не алгоритми: алгоритмічна складність - це міра, яка не відповідає послідовному визначенню для кінцевих об'єктів. Але тоді ми повинні призначити міру складності кожному елементу групи (наприклад, перетворення, яке заперечує одну змінну, простіше, ніж те, що заперечує дві) - це відчувається як просто підштовхування проблеми навколо ...

— Тегірі Ненаші