Класифікація з одним домінуючим предиктором


9

Я маю (к-класова) класифікаційна проблема з набором 100 реальних оцінок прогнозів, один з яких, здається, має набагато більше пояснювальної сили, ніж будь-який з інших. Я хотів би детальніше познайомитися з ефектами інших змінних. Однак, стандартні методи машинного навчання (випадкові ліси, SVM та ін.), Схоже, переповнюються одним сильним передбачувачем і не дають мені багато цікавої інформації про інших.

Якби це була проблема регресії, я б просто регресував проти сильного прогноктора, а потім використовував залишки в якості вхідних даних для інших алгоритмів. Я насправді не бачу, як цей підхід можна перевести в контекст класифікації.

Мій інстинкт полягає в тому, що ця проблема повинна бути досить поширеною: чи існує стандартна методика її вирішення?

Відповіді:


2

Для проблем 2 класу ви можете використовувати пакет GBM в R , який ітеративно підходить деревам класифікації до залишків з функції втрати. На жаль, він ще не підтримує багатокласних проблем.

Це здається проблемою, яка добре підходить для підвищення, але я не знаю жодних програм підсилення, які підтримують проблеми k-класу. Я думаю, що проблема полягає в написанні відповідної функції втрат для декількох класів. В glmnetпакетах мають поліноміальний функцію втрат, можливо , ви можете переглядати це вихідний код для деяких покажчиків.

Ви можете спробувати написати власний алгоритм прискорення або ви можете перетворити свою проблему на k бінарні проблеми класифікації (один клас порівняно з усіма іншими класами), пристосувати модель gbm до кожної проблеми та оцінити ймовірність класу від кожної моделі.


2
Zach Не впевнений, де знаходиться в стабільності розвитку, але GBM на R Forge має багаточленну логістику як функцію втрат, що дозволяє класифікувати багато категорій.
B_Miner

Дякую! Я погоджуюсь, що стимулювання, швидше за все, буде хорошим способом наблизитись до цього, і я вивчу запропоновані вами речі. Мені все одно цікаво дізнатись, чи є хороший спосіб вирішити цю проблему шляхом трансформації проблеми.
Мартін О'Лірі

@Zach Будь ласка, дайте мені знати, як це працює.
B_Miner
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.