Широко відомо, що формули CNF можна грубо розділити на 2 широкі класи: випадкові та структуровані. Структуровані формули CNF на противагу випадковим формулам CNF демонструють певний порядок, показуючи шаблони, які навряд чи трапляться випадково. Однак можна знайти структуровані формули, що показують певну ступінь випадковості (тобто певні конкретні групи пропозицій здаються значно менш структурованими, ніж інші), а також випадкові формули зі слабкою формою структури (тобто певні конкретні групи пропозицій здаються менш випадковими, ніж інші ). Отже, здається, що випадковість формули - це не лише факт так / ні факт.
Нехай - функція, яка за формулою CNF F ∈ F повертає реальне значення від 0 до 1 включно: 0 означає чисту структуровану формулу, а 1 означає чисту випадкову формулу.
Цікаво, чи хтось коли-небудь намагався вигадати такий . Звичайно, значення, повернене r, було б (принаймні, це моя мета) лише практичним вимірюванням за деякими розумними критеріями, а не твердою теоретичною правдою.
Мені також цікаво дізнатися, чи хтось коли-небудь визначав і вивчав будь-який статистичний показник, який може бути використаний при визначенні , або при визначенні інших загальних корисних властивостей формули. Під статистичним показником я маю на увазі щось подібне:
- ВГС (Hit Count дисперсії)
Нехай бути функцією , яка, з урахуванням змінної v J ∈ N , повертає число раз v J з'являється в F . Нехай V безліч змінних , використовуваних в F . Нехай ˉ h F = 1- AHC (середня кількість хітів). ВГС визначають так: HVC=1
У випадкових випадках ВГС дуже низький (усі змінні згадуються майже однакову кількість разів), тоді як у структурованих випадках це не так (деякі змінні використовуються дуже часто, а деякі інші - ні, тобто є "кластери використання").
- ДОПОМОГА (середня ступінь домішки)
Нехай - кількість разів, коли v j виникає позитивно, а h - F ( v j ) - кількість разів, коли вона виникає негативно. Нехай i : N → [ 0 , 1 ] є функцією, яка за змінної v j ∈ V повертає свій ідентифікатор (ступінь домішки). Функція i ( v j ) визначається так: i ( . Ці змінні, що зустрічаються в половині разів позитивних і в половині разів негативних, мають максимальну ступінь домішки, тоді як ті змінні, які завжди є позитивними або завжди негативними (тобто чисті літерали), мають мінімальний ступінь домішки. AID просто визначається так: AID=1
У випадкових екземплярах (принаймні, у тих, що генеруються за допомогою відмови від змінних з вірогідністю0,5), AID майже дорівнює1, тоді як у структурованих випадках він зазвичай далеко не дорівнює1.
- IDV (варіація ступеня домішки)
IDV є більш надійним показником, ніж сам AID, оскільки він обчислює випадкові випадки, генеровані за допомогою відміни змінних з вірогідністю, що відрізняється від . Він визначається як: I D V = 1
Мотивації
- Щоб краще зрозуміти, як працюють формули CNF, як можна визначити їх випадковість / структуру, чи можна було б визначити інші корисні загальні властивості, переглядаючи їхні статистичні показники, якщо і як такі показники можна використовувати для прискорення пошуку.
- Поцікавтеся, чи можна було б відповідати про задоволеність (чи навіть кількість рішень) формули CNF, просто розумно маніпулюючи її статистичними показниками.
Запитання
- Хто-небудь пропонував спосіб вимірювання випадковості формули CNF?
- Хто-небудь пропонував будь-який статистичний показник, який можна використовувати для вивчення або навіть механічного підрахунку корисних загальних властивостей формули CNF?