Я планую використовувати класифікатор лінійної підтримуючої машини scikit (SVM) для класифікації тексту на корпусі, що складається з 1 мільйона мічених документів. Що я планую зробити, це коли користувач вводить якесь ключове слово, класифікатор спочатку класифікує його до категорії, а потім подається запит на отримання інформації в документах цієї категорії категорії. У мене є кілька питань:
- Як я підтверджую, що класифікація не займе багато часу? Я не хочу, щоб користувачі витрачали час на очікування закінчення класифікації, щоб отримати кращі результати.
- Чи для цього підходить бібліотека наукових програм Python для веб-сайтів / веб-додатків?
- Хтось знає, як Amazon або Flipkart виконують класифікацію за запитами користувачів, чи вони використовують зовсім іншу логіку?