Я початківець зі статистики (взяв лише один курс коледжу), але в мене є досвід програмування.
Я щойно почав грати з бібліотекою класифікаторів Байєса для Рубі, і шукаю ідеї для аналізу.
Зараз я заплутаюся з категоризацією Tweet, але чи є у вас ідеї?
Що ще важливіше, як я можу дізнатися про те, які типи даних піддаються наївній байєсівській класифікації.
Дякую.