Що таке вільно доступний набір даних для класифікації з більш ніж 1000 ознаками (або зразкові точки, якщо вони містять криві)?
Вже існує спільнота вікі про безкоштовні набори даних: Розміщення вільно доступних зразків даних
Але тут було б непогано мати більш цілеспрямований список, який можна зручніше використовувати , також я пропоную такі правила:
- Одне повідомлення на набір даних
- Немає посилання на набір даних
кожен набір даних повинен бути пов’язаний із
ім'я (щоб зрозуміти, що мова йде про) і посилання на набір даних (R набори даних можуть бути названі з ім'ям пакета)
кількість функцій (скажімо, це p ) розмір набору даних (скажімо, це n ) та кількість міток / класу (нехай скажемо, це k )
типовий показник помилок у вашому досвіді (вкажіть використаний алгоритм у словах) або з літератури (в останньому випадку пов'яжіть папір)