Запитання з тегом «scikit-learn»

scikit-learn - це бібліотека машинного навчання для Python, яка пропонує прості та ефективні інструменти для аналізу даних та обміну даними, з акцентом на машинне навчання. Він доступний для всіх і може бути повторно використаний у різних контекстах. Він побудований на NumPy та SciPy. Проект є відкритим кодом та комерційно доступний (ліцензія BSD).

8
Коли колону-вектор y пропускали, коли очікувався масив 1d
Мені потрібно , щоб відповідати RandomForestRegressorз sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Цей код працював завжди, поки я не здійснив деяку попередню обробку даних ( train_y). Повідомлення про помилку говорить: DataConversionWarning: вектор стовпця y був переданий, коли очікувався масив 1d. Будь ласка, змініть форму y …

3
Python - Що таке sklearn.pipeline.Pipeline?
Я не можу зрозуміти, як саме sklearn.pipeline.Pipelineпрацює. Є кілька пояснень в доці . Наприклад, що вони означають: Трубопровід перетворень з кінцевим оцінкою. Щоб моє питання було зрозумілішим, що таке steps? Як вони працюють? Редагувати Завдяки відповідям я можу зробити своє питання зрозумілішим: Коли я викликаю трубопровід і проходжу, як кроки, …

13
ImportError при імпорті із sklearn: неможливо імпортувати ім'я check_build
Під час імпорту із sklearn я отримую таку помилку: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build Я використовую python 2.7, scipy-0.12.0b1 superpack, …

2
Як працює параметр class_weight в scikit-learn?
У мене виникають багато проблем з розумінням того, як функціонує class_weightпараметр логістичної регресії scikit-learn. Ситуація Я хочу використовувати логістичну регресію, щоб зробити бінарну класифікацію на дуже незбалансованому наборі даних. Класи мають позначення 0 (негативний) та 1 (позитивний), і спостережувані дані знаходяться у співвідношенні приблизно 19: 1, більшість зразків мають негативний …


5
Запустіть регресію OLS з фреймом даних Pandas
У мене є pandasкадр даних, і я хотів би мати можливість передбачити значення стовпця A за значеннями у стовпцях B і C. Ось іграшковий приклад: import pandas as pd df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40, 50], "C": [32, 234, 23, 23, 42523]}) В ідеалі я мав би …

4
Як обчислити точність, відкликання, точність та f1-бал для багатокласового випадку за допомогою scikit?
Я працюю над проблемою аналізу настроїв, дані виглядають так: label instances 5 1190 4 838 3 239 1 204 2 127 Таким чином, мої дані незбалансовані, оскільки 1190 instancesпозначено міткою 5. Для класифікації Im використовують SVC scikit . Проблема полягає в тому, що я не знаю, як правильно врівноважувати свої …



10
sklearn: знайдені масиви з непослідовною кількістю зразків при виклику LinearRegression.fit ()
Я просто намагаюся зробити просту лінійну регресію, але мене це бентежить за: regr = LinearRegression() regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values) яка виробляє: ValueError: Found arrays with inconsistent numbers of samples: [ 1 999] Ці виділення повинні мати однакові розміри, і вони повинні бути нумерованими масивами, і що я пропускаю?
102 scikit-learn 

7
як перевірити, яка версія nltk, scikit learn встановлена?
У скрипті оболонки я перевіряю, встановлені ці пакети чи ні, якщо вони не встановлені, то встановіть його. Тож із скриптом для оболонки: import nltk echo nltk.__version__ але він зупиняє скрипт оболонки на importчерзі в терміналі Linux намагалися бачити таким чином: which nltk що нічого не дає думати, що він встановлений. …

3
RandomForestClassifier проти ExtraTreesClassifier у scikit learn
Хто-небудь може пояснити різницю між RandomForestClassifier та ExtraTreesClassifier у scikit learn. Я витратив чимало часу на читання газет: П. Гертс, Д. Ернст. Та Л. Вегенкель, “Надзвичайно рандомізовані дерева”, Машинне навчання, 63 (1), 3-42, 2006 Здається, це різниця для ET: 1) При виборі змінних під час поділу вибірки відбираються з усього …

5
Параметр “stratify” з методу “train_test_split” (scikit Learn)
Я намагаюся використовувати train_test_splitпакет scikit Learn, але у мене проблеми з параметром stratify. Далі - код: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) Однак я постійно отримую таку проблему: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters passed: {'stratify': array([0, 0, 0, 0, …

4
Які плюси та мінуси між get_dummies (Pandas) та OneHotEncoder (Scikit-learn)?
Я вивчаю різні методи перетворення категоріальних змінних у числові для класифікаторів машинного навчання. Я натрапив на pd.get_dummiesметод, і sklearn.preprocessing.OneHotEncoder()я хотів побачити, як вони відрізняються з точки зору продуктивності та використання. Я знайшов підручник з використання OneHotEncoder()на https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/, оскільки sklearnдокументація була не дуже корисно на цій функції. У мене таке відчуття, …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.