Вимірювання випадковості формул CNF


12

Широко відомо, що формули CNF можна грубо розділити на 2 широкі класи: випадкові та структуровані. Структуровані формули CNF на противагу випадковим формулам CNF демонструють певний порядок, показуючи шаблони, які навряд чи трапляться випадково. Однак можна знайти структуровані формули, що показують певну ступінь випадковості (тобто певні конкретні групи пропозицій здаються значно менш структурованими, ніж інші), а також випадкові формули зі слабкою формою структури (тобто певні конкретні групи пропозицій здаються менш випадковими, ніж інші ). Отже, здається, що випадковість формули - це не лише факт так / ні факт.

Нехай - функція, яка за формулою CNF F F повертає реальне значення від 0 до 1 включно: 0 означає чисту структуровану формулу, а 1 означає чисту випадкову формулу.r:F[0,1]FF0101

Цікаво, чи хтось коли-небудь намагався вигадати такий . Звичайно, значення, повернене r, було б (принаймні, це моя мета) лише практичним вимірюванням за деякими розумними критеріями, а не твердою теоретичною правдою.rr

Мені також цікаво дізнатися, чи хтось коли-небудь визначав і вивчав будь-який статистичний показник, який може бути використаний при визначенні , або при визначенні інших загальних корисних властивостей формули. Під статистичним показником я маю на увазі щось подібне:r

  1. ВГС (Hit Count дисперсії)

    Нехай бути функцією , яка, з урахуванням змінної v JN , повертає число раз v J з'являється в F . Нехай V безліч змінних , використовуваних в F . Нехай ˉ h F = 1hF:NNvjNvjFVF- AHC (середня кількість хітів). ВГС визначають так: HVC=1h¯F=1|V|vjVhF(vj)

    У випадкових випадках ВГС дуже низький (усі змінні згадуються майже однакову кількість разів), тоді як у структурованих випадках це не так (деякі змінні використовуються дуже часто, а деякі інші - ні, тобто є "кластери використання").HVC=1|V|vjV(hF(vj)h¯F)2



  2. ДОПОМОГА (середня ступінь домішки)

    Нехай - кількість разів, коли v j виникає позитивно, а h - F ( v j ) - кількість разів, коли вона виникає негативно. Нехай i : N[ 0 , 1 ] є функцією, яка за змінної v jV повертає свій ідентифікатор (ступінь домішки). Функція i ( v j ) визначається так: i (hF+(vj)vjhF(vj)i:N[0,1]vjVi(vj) . Ці змінні, що зустрічаються в половині разів позитивних і в половині разів негативних, мають максимальну ступінь домішки, тоді як ті змінні, які завжди є позитивними або завжди негативними (тобто чисті літерали), мають мінімальний ступінь домішки. AID просто визначається так: AID=1i(vj)=2min(hF+(vj),hF(vj))hF(vj)

    У випадкових екземплярах (принаймні, у тих, що генеруються за допомогою відмови від змінних з вірогідністю0,5), AID майже дорівнює1, тоді як у структурованих випадках він зазвичай далеко не дорівнює1.AID=1|V|vjVi(vj)

    0.511

  3. IDV (варіація ступеня домішки)

    IDV є більш надійним показником, ніж сам AID, оскільки він обчислює випадкові випадки, генеровані за допомогою відміни змінних з вірогідністю, що відрізняється від . Він визначається як: I D V = 10.5

    IDV=1|V|vjV(i(vj)AID)2

    00

Мотивації

  1. Щоб краще зрозуміти, як працюють формули CNF, як можна визначити їх випадковість / структуру, чи можна було б визначити інші корисні загальні властивості, переглядаючи їхні статистичні показники, якщо і як такі показники можна використовувати для прискорення пошуку.
  2. Поцікавтеся, чи можна було б відповідати про задоволеність (чи навіть кількість рішень) формули CNF, просто розумно маніпулюючи її статистичними показниками.

Запитання

  1. Хто-небудь пропонував спосіб вимірювання випадковості формули CNF?
  2. Хто-небудь пропонував будь-який статистичний показник, який можна використовувати для вивчення або навіть механічного підрахунку корисних загальних властивостей формули CNF?

1
див. статтю у цій відповіді ( cstheory.stackexchange.com/questions/4321/… ). Це може дати вам підказку, як визначити такий r
Маркос

1
можливо відповідна дискусія щодо вимірювання випадковості бітових рядків mathoverflow.net/questions/37518/…
Ярослав Булатов

Я можу вам сказати це багато, оскільки я над цим працював певний час. Якщо врахувати SAT, формули для 1 і 2 є експоненціальними. З іншого боку, для k-SAT формули для 1 і 2 є многочленними. Це стосується мого ЦІННОГО ВИЗНАЧЕННЯ ЗАПИТАННЯ КОНТАКТУ КОНТАКТУ, на яке, схоже, ніхто не хоче відповісти.
Tayfun Pay

@Geekster: Ви хочете дати відповідь тут?
Hsien-Chih Chang 2 之

@Geekster: Що ви маєте на увазі під "... формули для 1 та 2 - експоненціальні" ?
Джорджіо Камерані

Відповіді:


3

Я пропоную запозичити інтуїцію фізики про те, що "менш випадкові" структури більш симетричні. Симетрія для CNF - це будь-яка трансформація змінних, яка зберігає функцію інваріантною. За цим критерієм функціонують 3 змінні, такі як

x1x2x3.

або, скажімо,

(x1x2¬x3)(x1¬x2x3)(¬x1x2x3)(¬x1¬x2¬x3).

менш випадкові, ніж, скажімо

(x1x2¬x3)(x1¬x2x3)(¬x1¬x2x3).

Взагалі, визначення поняття "випадкове" на кінцевих структурах є складним. Історично це було випробувано на бінарних послідовностях, які, мабуть, є найпростішими кінцевими структурами. Наприклад, інтуїтивно, послідовність 01010101 є "менш випадковою", ніж, скажімо, 01001110. Однак швидко було зрозуміло, що не існує послідовного формального визначення кінцевої випадкової послідовності! Тому слід скептично ставитися до будь-яких наївних спроб визначити міру випадковості для будь-якої кінцевої структури.


Я повністю згоден з інтуїцією: "структура означає наявність симетрій, тоді як випадковість означає відсутність симетрії" . Ви посилаєтесь на синтаксичні симетрії (тоді як семантичні симетрії - це ті, що змінюють функцію, але залишають простір рішення незмінним). Я завжди був переконаний, що ключова симетрія є ключовою.
Джорджіо Камерані

1
@ Уолтер: Ідея симетрії - це спроба використовувати алгебру, а не алгоритми: алгоритмічна складність - це міра, яка не відповідає послідовному визначенню для кінцевих об'єктів. Але тоді ми повинні призначити міру складності кожному елементу групи (наприклад, перетворення, яке заперечує одну змінну, простіше, ніж те, що заперечує дві) - це відчувається як просто підштовхування проблеми навколо ...
Тегірі Ненаші
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.