Очікувані значення складності Колмогорова у випадковій вибірці


9

Колмогорова складність рядка не обчислюється. Однак у випадковому підмножині розміру двійкових рядків довжиною скільки очікується, що їх складність буде меншою, ніж якесь ціле число менше (як функція , та )?Mnn0nMnn0


Ви використовуєте тут «стандартну» складність Колмогорова чи складність префікса?
Обрі да Кунья

Насправді я думав лише про складність Колмогорова. Я здогадувався про зв'язок про який згадується домоторп, коли ми розглядаємо всесвіт усіх рядків. Я не ясно , якщо якийсь - або «відповідає» результат для довільного випадкового підмножини розміру може бути отриманий. Однак складність префіксу приведе нас до іншого погляду? 2noM
проти

Це, безумовно, не змінило б порядок, адже я думаю, що зараз моя відповідь є обома версіями.
domotorp

1
Для кожного та кожного ймовірність того, що випадкова -бітна рядок має складність Колмогорова , більша за (при ) . Отже, у випадковому розподілі рядків слід очікувати, що рядки з ... інтуїтивно, дуже висока ймовірність вибрати рядок з високою складністю Колмогорова. ncnxK(x)nc112cc=nn0MM2(nn0)K(x)<n0
Marzio De Biasi

Відповіді:


10

Складність Колмогорова визначається лише до деякої адитивної константи, тому точну відповідь неможливо дати. Межа, яку я тут описую, ще слабша.

Звичайно, очікуване число можна легко обчислити, коли ми дізнаємося, скільки з рядків мають складність менше , тому дозвольте мені відповісти на це. Зазвичай перше твердження про складність Колмогорова полягає в тому, що це число не більше - оскільки існує лише ці багато рядків меншої довжини. З іншого боку, якщо у вашій програмі написано "довжини , візьміть го числа", то ви отримаєте рядки складності менше , де - без префіксу версія складності Колмогорова (так щонайбільше2nn02n01nx2n0K(n)Cn0K(n)nlogn+logn+O(1)). Більш детально, рядок спочатку містить опис машини Тьюрінга, яка приймала введення , де p - опис програми без префіксів, яка виводить , виводить е число довжини , яке становить біт , а потім за цим слідує .pxnxnO(1)px

Можливо, можна покращити ці межі, але я сумніваюся, що ви могли б отримати точну відповідь.


Чи можете ви пояснити трохи про фразу ", якщо у вашій програмі написано" довжини n, візьміть x число "?
проти

Ви маєте рацію, вона повинна бути без префіксу, я її виправив.
domotorp

3

Точну відповідь можна дати. Кількість рядків довжиною з (простою) складністю не більше становить , аж до постійного коефіцієнта. Отже, будь-який процес, який випадковим чином вибирає підмножину, матиме з обґрунтованою ймовірністю частку рядків складності менше . Для того, щоб показати наше наше твердження, досить показати , що число рядків зі складністю рівним для запиті також надсилається . Ми можемо показати необхідний результат, визначивши підсумовування цього значення за від 1 доnн02н0-К(н0|н)2-К(н0|н)+О(1)н0к2к-К(к|н)кн0. Щоб показати це, ми використовуємо результат адитивності для простої складності (завдяки Б. Баувенсу та А. Шен. Теорема адитивності для простої складності Колмогорова . Теорія обчислювальних систем, 52 (2): 297-302, лют. 2013), Тут позначає складність Колмогорова без префіксу. Вибираючи , ми спостерігаємо, що для кожної -бітної рядок складності маємо Отже, для кожного такого маємо . Нехай

С(а,б)=К(а|С(а,б))+С(б|а,С(а,б))+О(1).
К()а=ннбк
k=C(b)=C(n,b)+O(1)=K(n|k)+C(b|n,k)+O(1).
bC(b|n,k)=kK(n|k)+O(1)k=kK(n|k). Тепер можна помітити, що є максимум таких рядків , і кожна з лексикографічно перших рядків довжиною задовольняє . Таким чином з них задовольняє .O(2k)b2knC(b|n,k)k+O(1)Ω(2k)C(b|n,k)=k+O(1)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.