Алгоритми статистичних запитів?


13

Я поставив це питання на схрещені питання та відповіді, але здається, що він пов'язаний з CS набагато більше, ніж зі статистикою.

Чи можете ви навести мені приклади алгоритмів машинного навчання, які вивчають статистичні властивості набору даних, а не окремі спостереження, тобто використовують модель статистичних запитів ?


1
що таке модель статистичного запиту?
Суреш Венкат

з паперового порталу Kearns.acm.org/citation.cfm?doid=293347.293351 : "у цій моделі алгоритму навчання заборонено досліджувати окремі приклади невідомої цільової функції, але надається доступ до оракула, що забезпечує оцінки ймовірностей над вибіркою простір випадкових прикладів. ". вибачте, якщо це не очевидно, я оновив своє запитання за посиланням на папір
Deyaa

Відповіді:


14

Практично кожен алгоритм, який працює в моделі PAC (за винятком алгоритмів паритетного навчання), може бути змушений працювати в моделі SQ. Див., Наприклад, цей документ Blum et al. в якому кілька популярних алгоритмів переводяться в їх еквіваленти SQ ( Практична конфіденційність: рамка SuLQ ). Цей документ, в принципі, стосується "конфіденційності", але ви можете ігнорувати це - це дійсно просто реалізація алгоритмів із запитами SQ.

Навчання агностиків, з іншого боку, набагато складніше в моделі SQ: обчислювальні питання (однак вони важливі), складність вибірки, необхідна для навчання агностиків, приблизно така ж, як і для точного навчання, якщо ви насправді маєте доступ до точки даних. З іншого боку, навчання агностиків стає набагато складніше у моделі SQ - вам зазвичай потрібно буде робити суперполіномічно багато запитів, навіть для класів, простих як монотонні диз'юнкції. Дивіться цей документ Feldman ( Повна характеристика вивчення статистичних запитів із застосуванням до еволюціонування ) або цей останній документ Gupta et al. ( Приватні вивільнення сполучень та бар'єр статистичних запитів )


дійсно приємна відповідь Аарон :) велике спасибі :)
Deyaa

7

Модель SQ була створена для аналізу шумостійкого навчання - саме алгоритм, який працює, створюючи статистичні запити, буде працювати під класифікаційним шумом. Як сказав Аарон, більшість алгоритмів PAC, які ми виявили, мають еквіваленти в моделі SQ. Єдиним винятком є ​​елімінація Гаусса, яка використовується при навчанні паритетів (можна навіть розумно застосувати їївивчити журнал (n) лог (n) паритети розмірів у моделі класифікації шуму). Ми також знаємо, що паритети не можна вивчити за допомогою статистичних запитів, і виявляється, що найцікавіші класи, як дерева рішень, можуть імітувати функції парності. Отже, у нашому прагненні отримати алгоритми навчання PAC для багатьох цікавих класів (наприклад, дерева рішень, DNF тощо), ми знаємо, що нам потрібні принципово нові алгоритми навчання, які не працюють у моделі статистичних запитів.


Цікаво. Чи є у вас посилання, що паритети не можуть бути вивчені в моделі SQ?
М. Алагон

1
це було доведено Kearns в його оригінальній статті, що визначає модель: portal.acm.org/citation.cfm?doid=293347.293351, а потім знову показана Blum et al, де вони визначали розмір SQ класу portal.acm.org/citation .cfm? id = 195058.195147 . В основному, аргумент виглядає так: паритети є "попарно незалежними" з рівномірним розподілом, тож вам доведеться вгадати правильний паритет, щоб дізнатися що-небудь, і існує маса можливих паритетів ...
Лев Рейзін

5

Я хотів би трохи уточнити відповідь Аарона. Практично кожен алгоритм агностики (ще раз, за ​​винятком усього, що використовує усунення Гаусса) може працювати в моделі SQ. Природно, агностичне навчання важче, ніж неагностичне навчання, але це питання незалежне.


/ϵ2
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.