Запитання з тегом «classification»

Екземпляр контрольованого навчання, який визначає категорію або категорії, до яких належить новий екземпляр набору даних.

3
Кращі мови для наукових обчислень [закрито]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 5 років тому . Здається, що більшість мов мають деяку кількість бібліотек наукових обчислень. Python має Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

3
Як я можу класифікувати категоричні дані, які не виправлені?
У мене є проблема класифікації як категоричних, так і числових даних. Проблема, з якою я стикаюся, полягає в тому, що мої категоричні дані не виправлені, це означає, що новий кандидат, ярлик якого я хочу передбачити, може мати нову категорію, яку раніше не спостерігали. Наприклад, якщо мої категоричні дані були sexєдино …

3
Рання зупинка на втраті перевірки чи на точності?
В даний час я навчаю нейронну мережу, і не можу вирішити, що використовувати для реалізації своїх критеріїв раннього припинення: втрата валідації або такі показники, як точність / f1score / auc / незалежно від обчислених наборів перевірки. У своєму дослідженні я натрапив на статті, що захищають обидві точки зору. Здається, Керас …

3
Коли нам слід вважати набір даних незбалансованим?
Я стикаюся з ситуацією, коли кількість позитивних та негативних прикладів у наборі даних є незбалансованим. Моє запитання: чи існують якісь принципові правила, які підказують нам, коли нам слід підпробовувати велику категорію, щоб змусити якесь врівноваження в наборі даних. Приклади: Якщо кількість позитивних прикладів становить 1000, а кількість негативних прикладів - …

1
Бібліотеки для (алгоритми розповсюдження міток / часте видобування підграфів) для графіків на R
Загальний опис проблеми У мене є графік, де деякі вершини позначені типом з 3 або 4 можливими значеннями. Для інших вершин тип невідомий. Моя мета - використовувати графік, щоб передбачити тип вершин, що не мають маркування. Можливі рамки Я підозрюю, що це вписується в загальні рамки проблем із розповсюдженням етикетки, …

4
Чому кілька моделей можуть дати майже однакові результати?
Я аналізував набір даних ~ 400k записів і 9 змінних Залежна змінна є двійковою. Я встановив логістичну регресію, дерево регресії, випадковий ліс і дерево, підсилене градієнтом. Усі вони надають віртуальну ідентичну корисність підходящих номерів, коли я перевіряю їх в іншому наборі даних. Чому це так? Я здогадуюсь, що це тому, …

1
Як визначити складність англійського речення?
Я працюю над додатком, щоб допомогти людям вивчати англійську мову як другу мову. Я підтвердив, що речення допомагають вивчати мову, надаючи додатковий контекст. Я зробив це, провівши невелике дослідження в класі 60 учнів. Я видобув понад сто тисяч речень з Вікіпедії для різних англійських слів (включаючи 800 слів Баррона і …

3
Прогнозуйте найкращий час дзвінка
У мене є набір даних, що включає набір клієнтів у різних містах Каліфорнії, час виклику для кожного клієнта та стан виклику (Правда, якщо клієнт відповідає на дзвінок, і Неправильно, якщо клієнт не відповідає). Я повинен знайти відповідний час дзвінків для майбутніх клієнтів таким, щоб ймовірність відповісти на дзвінок висока. Отже, …

2
Скільки часу займає класифікатор scikit для класифікації?
Я планую використовувати класифікатор лінійної підтримуючої машини scikit (SVM) для класифікації тексту на корпусі, що складається з 1 мільйона мічених документів. Що я планую зробити, це коли користувач вводить якесь ключове слово, класифікатор спочатку класифікує його до категорії, а потім подається запит на отримання інформації в документах цієї категорії категорії. …

1
Збалансовані дані, що спричиняють неправильну класифікацію на множині набору даних
Я працюю над класифікацією тексту, де маю 39 категорій / класів та 8,5 мільйонів записів. (У майбутньому дані та категорії будуть збільшуватися). Структура або формат моїх даних наступний. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary …

1
Як підходити до проблеми класифікації, коли один із класів визначається "не будь-яким з інших"
Припустимо, мене цікавлять три класи c1c1c_1, c2c2c_2, c3c3c_3. Але мій набір даних насправді містить ще кілька реальних класів(cj)nj=4(cj)j=4n(c_j)_{j=4}^n. Очевидною відповіддю є визначення нового класу c^4c^4\hat c_4 що стосується всіх класів cjcjc_j, j>3j>3j>3 але я підозрюю, що це не гарна ідея, оскільки зразки в c^4c^4\hat c_4 будуть рідкісними і не дуже …

4
Класифікуйте багатоваріантний часовий ряд
У мене є набір даних, що складається з часових рядів (8 балів) з приблизно 40 вимірами (тому кожен часовий ряд - 8 на 40). Відповідний результат (можливі результати для категорій) - це 0 або 1. Який був би найкращий підхід до проектування класифікатора часових рядів з кількома розмірами? Моя початкова …

2
Класифікація векторних послідовностей
Мій набір даних складається з векторних послідовностей. Кожен вектор має 50 дійсних значень. Кількість векторів у послідовності становить від 3-5 до 10-15. Іншими словами, довжина послідовності не фіксована. Деяка значна кількість послідовностей (а не векторів!) Зазначається міткою класу. Моє завдання - вивчити класифікатор, який задає послідовність векторів, обчислює мітку класу …

2
Реалізація комплементарних наївних баїв у пітоні?
Проблема Я намагався використовувати Naive Bayes на міченому наборі даних про злочини, але отримав дійсно погані результати (7% точність). Naive Bayes працює набагато швидше, ніж інші алогоритми, якими я користувався, тому хотів спробувати з'ясувати, чому оцінка була такою низькою. Дослідження Після прочитання я виявив, що Naive Bayes слід використовувати з …

4
Запропонувати набори навчальних наборів текстів класифікатора
Які вільно доступні набори даних я можу використовувати для тренування класифікатора тексту? Ми намагаємось посилити залучення наших користувачів, рекомендуючи для нього найпов'язаніший вміст, тому ми подумали, що якщо ми класифікуємо наш вміст на основі заздалегідь визначеного пакету слів, ми можемо рекомендувати йому залучати вміст, отримуючи його відгуки про випадкову кількість …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.