На даний момент я використовую Scikit learn із таким кодом:
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
а потім підходять і прогнозують набір даних із 7 різними мітками. Я отримав дивний вихід. Незалежно від того, для якої техніки перехресної перевірки я використовую передбачувану мітку в наборі перевірки, завжди буде мітка 7.
Я пробую деякі інші параметри, включаючи повний за замовчуванням ( svm.SVC()
), але поки rbf
замість цього використовується метод ядра poly
або linear
він просто не буде працювати, в той час як він працює дуже добре для poly
і linear
.
Крім того, я вже спробував передбачити дані поїздів замість валідаційних даних, і вони ідеально підходять.
Хтось бачить подібну проблему раніше і знає, що тут відбувається?
Я ніколи не розглядаю детально свій розподіл класів, але знаю, що це повинно бути приблизно 30%, це 7, 14% - 4.
Я навіть пробую ручну реалізацію 1 проти решти, і це все ще не корисно.