Запитання з тегом «classification»

Екземпляр контрольованого навчання, який визначає категорію або категорії, до яких належить новий екземпляр набору даних.

5
Виберіть алгоритм двійкової класифікації
У мене проблема бінарної класифікації: Приблизно 1000 зразків у навчальному наборі 10 атрибутів, включаючи двійкові, числові та категоричні Який алгоритм є найкращим вибором для такого типу проблем? За замовчуванням я розпочну з SVM (попередній з номінальними значеннями атрибутів, перетвореними на бінарні функції), оскільки він вважається найкращим для відносно чистих і …

5
збільшують теплову карту для новонароджених
Я створюю corr()df з оригінального df. corr()ДФ вийшов 70 X 70 і неможливо уявити собі Heatmap ... sns.heatmap(df). Якщо я спробую відобразити corr = df.corr()таблицю, таблиця не відповідає екрану, і я бачу всі кореляції. Це спосіб або надрукувати весь, dfнезалежно від його розміру, або контролювати розмір теплової карти?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

5
Об'єднання рідких та щільних даних у машинному навчанні для підвищення продуктивності
У мене є рідкісні функції, які є прогностичними, також у мене є деякі щільні риси, які також є прогностичними. Мені потрібно поєднати ці функції разом, щоб поліпшити загальну продуктивність класифікатора. Тепер, справа в тому, що я намагаюся поєднати їх разом, щільні риси, як правило, більше домінують над розрідженими характеристиками, отже, …

3
Однокласна дискримінаційна класифікація з незбалансованим, гетерогенним негативним фоном?
Я працюю над вдосконаленням існуючого контрольованого класифікатора, щоб класифікувати {протеїнові} послідовності як такі, що належать до певного класу (попередники нейропептидних гормонів), чи ні. Існує близько 1150 відомих "позитивних" на тлі близько 13 мільйонів послідовностей білків ("Невідомий / погано анотований фон") або близько 100 000 рецензованих відповідних білків, анотованих з різними …

6
Яка причина прийняття перетворення журналу кількох безперервних змінних?
Я займався питаннями класифікації, і читав код та підручники багатьох людей. Одне, що я помітив, - це те, що багато людей приймають np.logабо logбезперервну змінну, наприклад, loan_amountі applicant_incomeт.д. Я просто хочу зрозуміти причину цього. Чи допомагає це покращити точність прогнозування нашої моделі. Це обов’язково? чи є якась логіка за цим? …

1
Як вибирається точка розщеплення для безперервних змінних у деревах рішень?
У мене є два питання, пов'язані з деревами рішень: Якщо у нас є безперервний атрибут, як ми обираємо значення розбиття? Приклад: Вік = (20,29,50,40 ....) Уявіть собі , що ми маємо безперервний атрибут , які мають значення в . Як я можу написати алгоритм, який знаходить точку розщеплення , щоб, …

2
Використання атрибутів для класифікації / кластеризації користувачів
У мене є набір даних користувачів, які купують продукти з веб-сайту. Атрибути, які я маю, - це ідентифікатор користувача, регіон (штат) користувача, ідентифікатор категорій продукту, ідентифікатор ключових слів продукту, ідентифікатор ключових слів веб-сайту та витрата товару на витрату. Метою є використання інформації про продукт та веб-сайт, щоб визначити, хто такі …

4
Дерево рішень чи логістична регресія?
Я працюю над проблемою класифікації. У мене є набір даних, що містить рівну кількість категоричних змінних і безперервних змінних. Як я дізнаюся, яку техніку використовувати? між деревом рішення та логістичною регресією? Чи правильно вважати, що логістична регресія буде більш придатною для безперервної змінної, а дерево рішення буде більш придатним для …

2
Модель бінарної класифікації для незбалансованих даних
У мене є набір даних із такими специфікаціями: Навчальний набір даних з 193 176 зразками з 2821 позитивом Тестовий набір даних із 82 887 зразків із 673 позитивними Є 10 функцій. Я хочу виконати двійкову класифікацію (0 або 1). Проблема, з якою я стикаюся, полягає в тому, що дані дуже …

1
Як обробити нульовий коефіцієнт при розрахунку класифікатора Naive Bayes?
Якщо у мене є набір даних про навчання і я треную класифікатор Naive Bayes на ньому, і у мене є значення атрибута, яке має нульовий вірогідність. Як мені впоратися з цим, якщо пізніше я хочу передбачити класифікацію нових даних? Проблема полягає в тому, що якщо в розрахунку є нуль, весь …

1
У чому різниця між генерацією та вилученням функцій?
Хтось може мені сказати, яка мета генерування функцій? і навіщо потрібне збагачення простору функцій перед класифікацією зображення? Це необхідний крок? Чи є який-небудь спосіб збагатити простір функцій?

3
Найкращий спосіб класифікувати набори даних із змішаними типами атрибутів
Мені хотілося б знати, який найкращий спосіб класифікувати набір даних, що складається із змішаних типів атрибутів, наприклад, текстових та числових. Я знаю, що можу перетворити текстовий в булевий, але словниковий запас різноманітний, а дані стають занадто рідкими. Я також намагався класифікувати типи атрибутів окремо і комбінувати результати за допомогою методів …

2
чому нам потрібно обробляти дисбаланс даних?
Мені потрібно знати, чому нам потрібно мати справу з дисбалансом даних. Я знаю, як впоратися з цим і різними методами вирішити проблему, яка полягає у вибіранні або зменшенні вибірки або за допомогою Smote. Наприклад, якщо у мене рідкісне захворювання - 1 відсоток із 100, і скажемо, що я вирішив створити …

3
Як використовувати RBM для класифікації?
На даний момент я граю з обмеженими машинами Boltzmann, і, оскільки я перебуваю на ній, я хотів би спробувати класифікувати рукописні цифри. Модель, яку я створив, тепер є досить фантастичною генеративною моделлю, але я не знаю, як іти далі. У цій статті автор зазначає, що, створивши хорошу генеративну модель, « …

1
Класифікуйте клієнтів на основі 2 особливостей та часової серії подій
Мені потрібна допомога щодо того, яким повинен бути наступний крок у алгоритмі, який я розробляю. Через NDAs я не можу розкрити багато, але я постараюся бути загальним і зрозумілим. В основному, після кількох кроків в алгоритмах, я маю це: Для кожного клієнта, який я маю, і події, які він проводить …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.