У мене є деякі дані, які існують на графіку . Вершини належать до одного з двох класів y i ∈ { - 1 , 1 } , і мені цікаво навчати SVM для розмежування двох класів. Одним відповідним ядром для цього є дифузійне ядро , K = exp ( - β L ) , де єлапласіаномз G і β є параметром настройки.
Налаштування SVM вимагає вибору гіперпараметрів, тому мені доводиться налаштовувати Зазвичай для цієї проблеми ми використовуємо перехресну перевірку, але це не здається доречним, оскільки опускаємо вершину i з змінює весь графік, можливо навіть збільшуючи кількість підключених компонентів! Якщо кількість підключених компонентів змінюється, деякі вершини стають недоступними для інших, і ми стикаємося з зовсім іншим набором даних, ніж ми починали. Тобто, ми не тільки не вистачаємо вилученої вершини i , але й не вистачаємо інформації про всі інші вершини j на графіку, який прилягав до цієї вершини.
Основне поняття перехресної перевірки полягає в тому, що ми хотіли б наблизити, як буде працювати модель, коли вона представлена новими даними. У стандартних проблемах відсутність деяких ваших даних для тестування не змінює значення решти навчальних даних. Однак у випадку даних графіків не зрозуміло, що означає для моделі бачити "нові" дані в налаштуваннях CV. Опущення вершин або ребер може повністю змінити дані. Наприклад, уявіть собі вершини графіка , а всі інші вершини мають 1 край. Опускаючи центральну вершину для побудови навчальних даних S ∗ який є графіком зір, в якому одна вершина має k ребра до k то повністю від'єднається графік, а матриця ядра буде діагональною! Але, звичайно, можна буде навчити модель на цих даних про навчання, наданих у . Менш зрозуміло, що це означає перевірити працездатність, що виходить із вибірки отриманої моделі. Чи можна перерахувати матрицю ядра для S , і надає її для прогнозування?
Або, альтернативно, починається з обчислення матриці ядра з опущених вузлів, тому нам може бути зручно, що ми отримуємо досить неупереджені позапробові оцінки від виконання CV таким чином.
Як можна вибрати гіперпараметри для проблем такого типу? Чи резюме недосконале, але прийнятне чи нам потрібні спеціалізовані методи? Чи можлива настройка гіперпараметрів взагалі в моєму контексті?