Належне навчання PAC 2-DNF при рівномірному розподілі


10

Який сучасний результат полягає у складності запитів правильних формул 2-DNF для засвоєння ПКС із зразками запитів та при рівномірному розподілі ? Або будь-яке нетривіальне обмеження на ньому?

Оскільки я зовсім не знайомий з теорією навчання, і це питання мотивоване іншим полем, відповідь може бути очевидною. Я перевірив книгу Кірнс і Вазірані, але, схоже, вони не розглядають цю установку прямо.

upd. Хоча головний параметр, що цікавить, - складність запиту, важливий час роботи також є важливим. Якщо можливо, час роботи бажано приблизно відповідати складності запиту або максимум поліномом.

upd. Додаток В (вгорі сторінки 18) до статті «Навчання субмодулярним функціям» Балкана та Харві зазначає, що «Добре відомо, що 2-DNF є ефективно вивченими PAC». Однак вони не згадують, чи є цей результат належним навчанням чи дають будь-яку інформацію.


Які запити?
Тимофій ВС

Просто зразки. Крім того, я думаю, я повинен бути явним, що питання стосується складності запиту, а не часу виконання (відредаговано).
Григорій Ярославцев

Я відповів на ваше запитання, припускаючи, що зразкові запити - це лише випадкові приклади (а не запити про членство).
Лев Рейзін

1
Так, запити - це лише випадкові приклади рівномірного розподілу.
Григорій Ярославцев

Відповіді:


14

Я не знаю, чи розглядаєте ви наступне нетривіальне обмеження, але ось я йду.

По-перше, щоб було зрозуміло, щоб ми не плутали -DNF з -term DNF (що я часто роблю), формула -DNF для змінних має форму де і , .ckcx1,,xнi=1k(i,1i,2...i,c)1iк1jci,j{х1,,хн,х¯1,,х¯н}

Спочатку ми можемо запитати, скільки різних термінів може існувати в -DNF. Кожен доданок матиме з змінних, кожна або заперечується, або не робить - для різні можливі терміни. У екземплярі 2-DNF кожен додаток буде або з'являтися, або ні, що робить можливі "цілі", де - простір гіпотез.ccн2c(нc)|Н|=22c(нc)Н

Уявіть алгоритм, який бере вибірки, а потім намагається виконати всігіпотези, поки вона не знайде ту, яка ідеально прогнозує на вибірках. Теорема Бритва Оккама говорить, що для цього алгоритму потрібно взяти лише зразки ціль з помилкою з ймовірністю .м|Н|м=О(1ϵ|(Н|+1δ)ϵ1-δ

У нашому випадку, , , це означає, що вам потрібно буде приблизно зразків, щоб зробити (належне) навчання.c=2lg|Н|=О(н2)н2

Але вся гра в навчанні насправді не є вибірковою складністю (хоча це і є частиною гри, особливо в навчанні, що працює на атрибути), а скоріше у спробі розробити алгоритми багаточленного часу. Якщо ви не піклуєтесь про ефективність, то - найпростіша відповідь на складність вибірки PAC.н2

ОНОВЛЕННЯ (враховуючи змінене запитання) :

Оскільки ви чітко заявляли, що піклуєтесь лише про складність вибірки, я представив алгоритм Оккама з грубою силою, який, мабуть, найпростіший аргумент. Однак моя відповідь була трохи прихильною. -DNF насправді можна вивчити в поліноміальний час! Це результат оригінального документу Валент " Теорія навчального ". Насправді -DNF можна вивчити для будь-якого .2cc=О(1)

Аргумент полягає в наступному. Ви можете розглянути -DNF як диз'юнкцію "мета-змінних" і спробувати дізнатися диз'юнкцію, усунувши мета-змінні, несумісні з прикладами. Таке рішення може бути легко переведене назад до "належного" рішення та потребує часу . Як бічне зауваження, досі відкрито, чи існує алгоритм поліноміального часу для .cнcО(нc)c=ω(1)

Щодо того, чи є складність вибірки також нижньою межею, відповідь, як правило, так. Цей документ Ehrenfeucht et al. показує, що зв'язана Оккамом майже щільна.н2


1
Дякую! Це нетривіальний результат - я не розумів, що експоненціальний час роботи буде корисним. Однак для застосування я маю на увазі насправді поліноміальний час набагато бажаніший (оновлено питання). Чи найвідоміший для цієї проблеми підхід, який ви описали? Чи є нижчі межі складності запиту (навіть для необмеженого часу роботи)?
Григорій Ярославцев

Оновлено питання за допомогою посилання, яке мотивувало це питання.
Григорій Ярославцев

1
оновив відповідь, надавши ваше оновлене запитання
Лев Рейзін

Також - у цьому випадку я не думаю, що експоненціальний час роботи корисний. Але загалом, здається, так і є. Навчання (з оптимальною складністю вибірки), як правило, легко, коли у вас є експоненціальний час.
Лев Рейзін

2
Дуже дякую! Мені знадобиться деякий час, щоб перевірити посилання, але поки це здається повною відповіддю.
Григорій Ярославцев
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.