Запитання з тегом «python»

Використовуйте для наукових даних питання, пов'язані з мовою програмування Python. Не призначений для загальних питань кодування (-> stackoverflow).

1
Яка найкраща модель Кераса для багатокласової класифікації?
Я працюю на дослідження, де необхідно класифікувати один з WINNER три події = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 Моя поточна модель: def build_model(input_dim, output_classes): …

1
Чому xgboost так швидше, ніж sklearn GradientBoostingClassifier?
Я намагаюся підготувати градієнтну модель для збільшення градієнта на 50 к. Прикладах із 100 числовими функціями. XGBClassifierобробляє 500 дерев протягом 43 секунд на моїй машині, тоді як GradientBoostingClassifierобробляє лише 10 дерев (!) за 1 хвилину і 2 секунди :( Я не намагався виростити 500 дерев, як це займе години. Я …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
Гіпертунінг параметрів XGBoost
XGBoost робив чудову роботу, коли справа стосується як категоричних, так і постійних залежних змінних. Але як вибрати оптимізовані параметри для проблеми XGBoost? Ось як я застосував параметри для недавньої проблеми Kaggle: param <- list( objective = "reg:linear", booster = "gbtree", eta = 0.02, # 0.06, #0.01, max_depth = 10, #changed …
27 r  python  xgboost 

3
Як змусити ваги бути негативними при лінійній регресії
Я використовую стандартну лінійну регресію з використанням scikit-learn в python. Однак я хотів би змусити ваги бути позитивними для кожної риси (не від'ємною), чи я можу це досягти? Я шукав документацію, але не міг знайти спосіб досягти цього. Я розумію, що я не можу отримати найкраще рішення, але мені потрібно, …

7
Як клонувати робоче середовище Python на іншій машині?
Я розробив модель машинного навчання з Python (Anaconda + Flask) на своїй робочій станції, і все йде добре. Пізніше я спробував перенести цю програму на іншу машину, де, звичайно, я намагався налаштувати те саме середовище, але програма не запускається. Я скопіював програму на інші машини, де вона також працює безперебійно. …
26 python  anaconda 

1
PyTorch проти Tensorflow Fold
І PyTorch, і Tensorflow Fold є глибокими рамками навчання, призначеними для вирішення ситуацій, коли вхідні дані мають неоднакову довжину або розміри (тобто ситуації, коли динамічні графіки є корисними або потрібними). Мені хотілося б знати, як вони порівнюються, у сенсі парадигм, на які вони покладаються (наприклад, динамічне формування) та їх наслідків, …

2
Об’єднання двох різних моделей у Keras
Я намагаюся об'єднати дві моделі Кераса в одну модель, і я не в змозі цього досягти. Наприклад, на малюнку, що додається, я хотів би отримати середній шар розміру 8 і використовувати це як вхід до шару (знову ж розмірності 8) в моделі а потім поєднати як модель і модель як …

6
Методи машинного навчання для оцінки віку користувачів на основі сайтів у Facebook, які їм подобаються
У мене є база даних з моєї програми Facebook, і я намагаюся використовувати машинне навчання для оцінки віку користувачів, виходячи з того, які сайти Facebook їм подобаються. У моїй базі даних є три найважливіші характеристики: розподіл за віком у моєму навчальному наборі (загалом 12 тис. користувачів) спрямований на молодших користувачів …

4
Чи існує прямий спосіб паралельного запуску pandas.DataFrame.isin?
У мене є програма моделювання та підрахунку балів, яка широко використовує DataFrame.isinфункцію панд, здійснюючи пошук по списках фейсбукових "схожих" записів окремих користувачів на кожну з кількох тисяч певних сторінок. Це найбільш трудомістка частина програми, більше, ніж моделювання чи забивання штук, просто тому, що вона працює лише на одному ядрі, а …

4
Word2Vec для іменного розпізнавання особи
Я хочу використовувати реалізацію google word2vec для побудови названої системи розпізнавання сутностей. Я чув, що рекурсивні нейронні мережі з поширенням назад через структуру добре підходять для названих завдань розпізнавання об'єктів, але мені не вдалося знайти гідної реалізації або гідного підручника для цього типу моделі. Оскільки я працюю з нетиповим корпусом, …

4
Scikit-learn: отримання SGDClassifier для прогнозування, а також логістичної регресії
Способом навчання логістичної регресії є використання стохастичного градієнтного спуску, яке scikit-learn пропонує інтерфейс. Що я хотів би зробити, це взяти SGDClassifier для scikit-learn і мати його так, як логістична регресія тут . Однак я повинен бракувати деяких удосконалень машинного навчання, оскільки мої бали не рівноцінні. Це мій поточний код. Що …

5
Образ VM для проектів з наукових даних
Оскільки є чимало інструментів, доступних для завдань із вивчення даних, і це громіздко встановити все і створити досконалу систему. Чи є зображення ОС Linux / Mac OS з Python, R та іншими інструментами з відкритим вихідним кодом, встановленими та доступними для того, щоб люди могли їх використовувати відразу? Ідеально підійде …
24 python  r  tools 

3
Кращі практики для зберігання моделей машинного навчання Python
Які найкращі практики для збереження, зберігання та спільного використання моделей машинного навчання? У Python ми зазвичай зберігаємо двійкове представлення моделі, використовуючи соління або joblib. Моделі, в моєму випадку, можуть бути ~ 100Мо великими. Крім того, joblib може зберігати одну модель у декількох файлах, якщо ви не встановите compress=1( /programming/33497314/sklearn-dumping-model-using-joblib-dumps-multiple-files-which-one-is-the- коре …

4
Чи потрібно стандартизувати ваші дані перед кластеризацією?
Чи потрібно стандартизувати ваші дані перед кластером? У прикладі scikit learnпро DBSCAN, ось вони роблять це у рядку: X = StandardScaler().fit_transform(X) Але я не розумію, для чого це потрібно. Зрештою, кластеризація не передбачає особливого розповсюдження даних - це непідвладний метод навчання, тому його мета - вивчити дані. Чому потрібно було …

5
Розрахунок дивергенції KL в Python
Я досить новачок у цьому і не можу сказати, що я маю повне розуміння теоретичних концепцій, що стоять за цим. Я намагаюся обчислити розбіжність KL між декількома списками точок у Python. Я використовую http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html, щоб спробувати це зробити. Проблема, з якою я стикаюся, полягає в тому, що повернене значення є …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.