Запитання з тегом «classification»

Статистична класифікація - це проблема ідентифікації підгрупи, до якої належать нові спостереження, де ідентичність підгрупи невідома, на основі навчального набору даних, що містять спостереження, субпопуляція яких відома. Тому ці класифікації показуватимуть змінну поведінку, яку можна вивчити статистикою.

1
Тест на пропорції та двійковий класифікатор
У мене є прототип машини для виготовлення деталей. У першому тесті машина виробляє деталей, і двійковий класифікатор повідомляє мені, що частини несправні ( , зазвичай і ), а частини хороші.d 1 d 1 < N 1 d 1 / N 1 < 0,01 N 1 ≈ 10 4 N 1 …

1
Чи є MFCC оптимальним методом подання музики до системи пошуку?
Техніка обробки сигналу, частота Cepstrum Mel , часто використовується для отримання інформації з музичного твору для використання в завданні машинного навчання. Цей метод дає короткочасний спектр потужності, а коефіцієнти використовуються як вхідні. При проектуванні систем пошуку музики такі коефіцієнти вважаються характерними для твору (очевидно, не обов'язково унікальні, але розрізняючі). Чи …

4
Поліпшення класифікації SVM діабету
Я використовую SVM для прогнозу діабету. Для цього я використовую набір даних BRFSS . Набір даних має розміри і перекошений. Відсоток s у цільовій змінній становить тоді як s складають решта .432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% Я використовую тільки 15з 136незалежних змінних з набору даних. Однією з причин …

2
K-найближчий-сусід з безперервними та бінарними змінними
У мене є набір даних із стовпцями a b c(3 атрибути). aє чисельною і безперервним в той час як bі cкатегорично кожен з двома рівнями. Я використовую метод K-Найближчих сусідів для класифікації aта bввімкнення c. Отже, щоб можна було виміряти відстані, я перетворюю свій набір даних, видаляючи bта додаючи b.level1і …

3
Як класифікувати незбалансований набір даних за допомогою конволюційних нейронних мереж (CNN)?
У мене є незбалансований набір даних у задачі бінарної класифікації, де сума позитивів проти негативів становить 0,3% проти 99,7%. Розрив між позитивом і негативом величезний. Коли я треную CNN зі структурою, що використовується в проблемі MNIST, результат тестування показує високий показник помилкових негативних значень. Також крива помилок тренінгу швидко спадає …

1
Чи можуть випадкові ліси зробити набагато краще, ніж 2,8% помилки тесту на MNIST?
Я не знайшов жодної літератури щодо застосування випадкових лісів до MNIST, CIFAR, STL-10 тощо. Тому я подумав, що спробував би їх з інваріантним перестановкою MNIST. У R я спробував: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Це тривало протягом 2 годин і отримало 2,8% тестової помилки. Я також спробував scikit-learn , с …

1
SMOTE викидає помилку для багатокласової проблеми дисбалансу
Я намагаюся використовувати SMOTE для виправлення дисбалансу в моїй проблемі класифікації класів. Хоча SMOTE чудово працює на наборі даних райдужної оболонки відповідно до довідкового документа SMOTE, він не працює на подібному наборі даних. Ось як виглядають мої дані Зауважте, у ньому є три класи зі значеннями 1, 2, 3. > …

1
Оптимальна кількість компонентів у гауссовій суміші
Отже, отримання «уявлення» про оптимальну кількість кластерів у k-засобах добре зафіксовано. Я знайшов статтю про це в гауссових сумішах, але не впевнений, що я переконаний у цьому, не дуже добре це розумію. Чи існує ... ніжніший спосіб зробити це?

3
Для проблеми класифікації, якщо змінна класу має неоднакове розподіл, яку техніку ми повинні використовувати?
напр. якщо у мене є оцінка кредитної змінної з двома класами - хороший і поганий, де # (хороший) = 700 і # (погано) = 300. Я не хочу скорочувати свої дані. яку техніку я повинен використовувати? Я використовував SVM, але він дає все погане як хороше в прогнозах.

2
Де знайти заздалегідь підготовлені моделі для трансферного навчання [закрито]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі лише редагуючи цю публікацію . Закрито 2 роки тому . Я новачок у галузі машинного навчання, але хотів спробувати застосувати простий алгоритм класифікації з …

1
Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними
Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Коли використовувати модель суміші Гаусса?
Я новачок у використанні GMM. Мені не вдалося знайти відповідної допомоги в Інтернеті. Чи може хто-небудь, будь ласка, надати мені правильний ресурс на тему "Як вирішити, чи використання GMM відповідає моїй проблемі?" або у випадку проблем із класифікацією "Як вирішити, чи потрібно використовувати класифікацію SVM чи класифікацію GMM?"

1
Різниця між типами SVM
Я новачок, що підтримую векторні машини. Коротке пояснення svmФункція з e1071пакету в R пропонує різні варіанти: C-класифікація ну-класифікація однокласифікація (для виявлення новинок) eps-регресія ну-регресія Які інтуїтивні відмінності між п'ятьма типами? Який слід застосувати в якій ситуації?

2
Чи фіксують дерева CART взаємодії між передбачувачами?
У цьому документі стверджується, що в CART, оскільки бінарний розкол виконується по одному коваріату на кожному кроці, всі розщеплення є ортогональними, тому взаємодії між коваріатами не враховуються. Однак багато дуже серйозних посилань стверджують, навпаки, що ієрархічна структура дерева гарантує, що взаємодія між предикторами буде автоматично змодельована (наприклад, цей документ , …

3
VC розмір прямокутника
У книзі "Вступ до машинного навчання" Етема Альпайдіна зазначено, що розмір VC прямокутника, орієнтованого на вісь, дорівнює 4. Але як можна прямокутник розбити набір із чотирьох колінеарних точок з чергуванням позитивних та негативних точок ?? Чи може хтось пояснити та довести розмір ВК прямокутника?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.