У мене схожий набір даних
+--------+------+-------------------+
| income | year | use |
+--------+------+-------------------+
| 46328 | 1989 | COMMERCIAL EXEMPT |
| 75469 | 1998 | CONDOMINIUM |
| 49250 | 1950 | SINGLE FAMILY |
| 82354 | 2001 | SINGLE FAMILY |
| 88281 | 1985 | SHOP & HOUSE |
+--------+------+-------------------+
Я вбудував його у векторний простір формату LIBSVM
+1 1:46328 2:1989 3:1
-1 1:75469 2:1998 4:1
+1 1:49250 2:1950 5:1
-1 1:82354 2:2001 5:1
+1 1:88281 2:1985 6:1
Показники особливостей:
- 1 - "дохід"
- 2 - "рік"
- 3 - "використання / КОМЕРЦІЙНИЙ ВИКЛАД"
- 4 - "використання / CONDOMINIUM"
- 5 - "використання / ОДНА СІМ'Я"
- 6 - "використання / МАГАЗИН & ДІМ"
Чи добре тренувати машину з підтримкою векторної підтримки (SVM) із поєднанням безперервних (рік, дохід) та категоричних (використання) даних?