Комбінаторна характеристика точного навчання з запитами про членство


15

Редагувати: Оскільки за тиждень я не отримував жодних відповідей / коментарів, я хочу додати, що я радий почути що-небудь про проблему. Я не працюю в цьому районі, тому навіть якщо це просте спостереження, я, можливо, цього не знаю. Навіть коментар на кшталт "Я працюю в цьому районі, але такої характеристики я не бачив" був би корисним!

Фон:

Існує кілька добре вивчених моделей навчання теорії навчання (наприклад, навчання PAC, навчання в Інтернеті, точне навчання з запитами на членство / еквівалентність).

Наприклад, у навчанні PAC вибіркова складність понятійного класу має приємну комбінаторну характеристику з точки зору VC-виміру класу. Отже, якщо ми хочемо вивчити клас з постійною точністю та впевненістю, це можна зробити за допомогою зразків, деΘ(d) є вимір VC. (Зауважте, що ми говоримо про складність вибірки, а не про складність у часі.) Існує також більш вдосконалена характеристика з точки зору точності та впевненості. Так само помилкова модель онлайн-навчання має приємну комбінаторну характеристику.d

Питання:

Хочу знати, чи відомий подібний результат для моделі точного навчання із запитами про членство. Модель визначається так: У нас є доступ до чорного поля, яке на вході дає f ( x ) . Ми знаємо , що е походить від деякої концепції класу C . Ми хочемо визначити f якомога менше запитів.xf(x)fCf

Чи є комбінаторний параметр концептуального класу який характеризує кількість запитів, необхідних для вивчення концепції в моделі точного навчання з запитами на членство?C

Що я знаю:

Найкраща така характеристика, яку я знайшов, є у цій роботі Серведіо та Гортлера , використовуючи параметр, який вони відносять до Бшуті, Кліва, Гавальда, Каннана та Тамона . Вони визначають комбінаторний параметр під назвою , де C - клас поняття, який має такі властивості. (Нехай Q C - оптимальна кількість запитів, необхідних для вивчення C у цій моделі.)γCCQCC

QC=Ω(1/γC)QC=Ω(log|C|)QC=O(log|C|/γC)

Ця характеристика майже щільна. Однак між верхньою та нижньою рамками може бути квадратичний зазор. Наприклад, якщо , то нижня межа - Ω ( k ) , але верхня межа - O ( k 2 ) . (Я також вважаю, що цей розрив є досяжним, тобто існує клас концепції, для якого нижні межі є обома Ω ( k ) , але верхня межа - O ( k 2 ) .)1/γC=log|C|=kΩ(k)O(k2)Ω(k)O(k2)


1
"Розмір стога сіна" характеризує складність запиту щодо оптимізації функції: cis.upenn.edu/~mkearns/papers/haystack.pdf , Це відрізняється від того, що ви хочете, але вам може сподобатися відповідна робота, яка обговорює те, що відомо про характеристику складність запиту точного навчання.
Аарон Рот

Відповіді:


6

Щоб повернути додому точку прикладу анонімного лося, розглянемо клас концепції, який складається з функцій, які виводять 1 лише на одну точку на {0,1} ^ n. Клас розміром 2 ^ n, і 2 ^ n запитів потрібні в гіршому випадку. Погляньте на найгірший викладацький вимір (Goldman & Schapire), який забезпечує щось подібне до того, що ви шукаєте.


1
Спасибі! Пошук викладацького виміру привів мене до розширеного викладацького виміру, який схожий на комбінаторний параметр, про який я згадував у запитанні, що потім привело мене до багатьох інших цікавих робіт з цієї теми.
Робін Котарі

4

Я не знаю такої характеристики. Однак варто зазначити, що майже для будь-якого концептуального класу потрібно запитувати всі моменти. Щоб побачити це, розглянемо концептуальний клас, який складається з усіх n-мірних булевих векторів з вагою Хеммінга 1. Цей концептуальний клас, очевидно, потребує n запитів для вивчення, що дорівнює його кардинальності. Ви можете, напевно, узагальнити це спостереження, щоб зрозуміти, що майже будь-який клас концепції також потребує виконання всіх запитів.

Я б підозрював, що з огляду на поняття C як вхідний, важко визначити складність того, як саме вивчити концепт-клас із запитами членства, або навіть наблизити його до вимови константи. Це дало б певну ознаку того, що "хорошої" комбінаторної характеристики не існує. Якщо ви хочете довести такий результат твердості NP, але спробуйте і не зможете розмістити тут, і я побачу, чи зможу це зрозуміти (у мене є деякі ідеї).


1
Дякуємо за відповідь. Навіть якщо це правда, що майже всі класи концепції (за певного розумного розподілу по класах) важко засвоїти, деякі класи вивчаються легко, і було б цікаво мати комбінаторний параметр, який характеризує це. Я не проти, якщо параметр важко обчислити. Не відомо, що навіть розмір ВК є ефективно обчислюваним.
Робін Котарі

1

Хоча інші вказали на відповідь. Я подумав, що можу зробити це самодостатнім і показати, чому саме викладацький вимір - це відповідь.

CXSXffCS .

T(f)f(f,C)=min{ |S| | ST(f)}fмiн(f) в Т(f). Аналогічно розглянемо ТД(С)=максfСТД(f,С) бути викладацьким виміром С.

Мінімальна кількість запитів, необхідних для ідентифікації f є ТД(f,С). This happens when the query strategy uses the sequence TSmin(f). As for any fewer queries we have at least two concepts consistent with it. And TD(C) is the minimum for any f.


I don't understand why the teaching dimension upper bounds the query complexity of learning f. What does the algorithm look like? The function f in unknown to the algorithm when we start, so it cannot simply query the teaching set for f.
Robin Kothari

@RobinKothari TD lower bounds the minimum number of queries in any MQ-algorithm. In practice, there may be no algorithm that blindly achieves this bound without cheating or code tricks. In Angluin's "Queries Revisited" paper, she discussed a parameter called MQ that represent the number of queries needed by the best MQ-algorithm in the worst case. I don't recall its details but certainly TD<=MQ.
seteropere

1
Що мене зацікавило (коли я задав це запитання) був параметром, який характеризує точне навчання із запитами про членство. Він повинен бути як верхньою, так і нижньою межею. Я подав приклад параметра, який досягає цього (до журналу | C | фактор) у запитанні. Моє питання полягав у тому, чи відомо щось краще.
Робін Котарі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.