Я щойно закінчив машинне навчання курсу R на когнітивному класі.ai і почав експериментувати з випадковими лісами.
Я зробив модель, використовуючи бібліотеку "randomForest" у Р. Модель класифікується на два класи, добрий та поганий.
Я знаю, що коли модель є надмірною, вона добре працює на даних із власного набору тренувань, але погано на даних, що не мають вибірки.
Для тренування та тестування моєї моделі я перемістив та розділив повний набір даних на 70% для навчання та 30% для тестування.
Моє запитання: я отримую 100% точність від прогнозу, зробленого на тестовому наборі. Це погано? Це здається занадто гарним, щоб бути правдою.
Завдання - розпізнавання хвиль на чотирьох один на одного залежно від форм хвиль. Особливістю набору даних є результати витрат на аналіз динамічного часового викривлення хвильових форм з їх цільовою формою хвилі.