Я намагаюся зробити класифікацію тексту за допомогою Textblob. Я спочатку навчаю модель і серіалізую її за допомогою засолу, як показано нижче.
import pickle
from textblob.classifiers import NaiveBayesClassifier
with open('sample.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()
І коли я намагаюся запустити цей файл:
import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)
f.close()
Я отримую цю помилку:
UnicodeDecodeError: кодек 'utf-8' не може декодувати байт 0x80 у положенні 0: недійсний початковий байт
Нижче наведено вміст мого sample.csv:
Мій SQL взагалі працює некоректно. Це був неправильний вибір, SQL
У мене проблеми. Будь ласка, негайно дайте відповідь, підтримка
Де я тут помиляюся? Будь ласка, допоможіть.