Статистика та великі дані classification

1

Тест на пропорції та двійковий класифікатор

У мене є прототип машини для виготовлення деталей. У першому тесті машина виробляє деталей, і двійковий класифікатор повідомляє мені, що частини несправні ( , зазвичай і ), а частини хороші.d 1 d 1 < N 1 d 1 / N 1 < 0,01 N 1 ≈ 10 4 N 1 …

10 hypothesis-testing statistical-significance classification proportion

1

Чи є MFCC оптимальним методом подання музики до системи пошуку?

Техніка обробки сигналу, частота Cepstrum Mel , часто використовується для отримання інформації з музичного твору для використання в завданні машинного навчання. Цей метод дає короткочасний спектр потужності, а коефіцієнти використовуються як вхідні. При проектуванні систем пошуку музики такі коефіцієнти вважаються характерними для твору (очевидно, не обов'язково унікальні, але розрізняючі). Чи …

10 machine-learning classification signal-processing mfcc

4

Поліпшення класифікації SVM діабету

Я використовую SVM для прогнозу діабету. Для цього я використовую набір даних BRFSS . Набір даних має розміри і перекошений. Відсоток s у цільовій змінній становить тоді як s складають решта .432607 × 136432607×136432607 \times 136Y11 %11%11\%N89 %89%89\% Я використовую тільки 15з 136незалежних змінних з набору даних. Однією з причин …

10 r classification svm feature-selection e1071

2

K-найближчий-сусід з безперервними та бінарними змінними

У мене є набір даних із стовпцями a b c(3 атрибути). aє чисельною і безперервним в той час як bі cкатегорично кожен з двома рівнями. Я використовую метод K-Найближчих сусідів для класифікації aта bввімкнення c. Отже, щоб можна було виміряти відстані, я перетворюю свій набір даних, видаляючи bта додаючи b.level1і …

10 r classification k-nearest-neighbour

3

Як класифікувати незбалансований набір даних за допомогою конволюційних нейронних мереж (CNN)?

У мене є незбалансований набір даних у задачі бінарної класифікації, де сума позитивів проти негативів становить 0,3% проти 99,7%. Розрив між позитивом і негативом величезний. Коли я треную CNN зі структурою, що використовується в проблемі MNIST, результат тестування показує високий показник помилкових негативних значень. Також крива помилок тренінгу швидко спадає …

10 classification neural-networks deep-learning convolution computer-vision

1

Чи можуть випадкові ліси зробити набагато краще, ніж 2,8% помилки тесту на MNIST?

Я не знайшов жодної літератури щодо застосування випадкових лісів до MNIST, CIFAR, STL-10 тощо. Тому я подумав, що спробував би їх з інваріантним перестановкою MNIST. У R я спробував: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Це тривало протягом 2 годин і отримало 2,8% тестової помилки. Я також спробував scikit-learn , с …

10 r machine-learning classification random-forest scikit-learn

1

SMOTE викидає помилку для багатокласової проблеми дисбалансу

Я намагаюся використовувати SMOTE для виправлення дисбалансу в моїй проблемі класифікації класів. Хоча SMOTE чудово працює на наборі даних райдужної оболонки відповідно до довідкового документа SMOTE, він не працює на подібному наборі даних. Ось як виглядають мої дані Зауважте, у ньому є три класи зі значеннями 1, 2, 3. > …

10 r classification unbalanced-classes oversampling

1

Оптимальна кількість компонентів у гауссовій суміші

Отже, отримання «уявлення» про оптимальну кількість кластерів у k-засобах добре зафіксовано. Я знайшов статтю про це в гауссових сумішах, але не впевнений, що я переконаний у цьому, не дуже добре це розумію. Чи існує ... ніжніший спосіб зробити це?

10 classification k-means mixture unsupervised-learning

3

Для проблеми класифікації, якщо змінна класу має неоднакове розподіл, яку техніку ми повинні використовувати?

напр. якщо у мене є оцінка кредитної змінної з двома класами - хороший і поганий, де # (хороший) = 700 і # (погано) = 300. Я не хочу скорочувати свої дані. яку техніку я повинен використовувати? Я використовував SVM, але він дає все погане як хороше в прогнозах.

10 classification binary-data

2

Де знайти заздалегідь підготовлені моделі для трансферного навчання [закрито]

Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі лише редагуючи цю публікацію . Закрито 2 роки тому . Я новачок у галузі машинного навчання, але хотів спробувати застосувати простий алгоритм класифікації з …

9 machine-learning classification neural-networks transfer-learning

1

Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними

Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …

9 machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

2

Коли використовувати модель суміші Гаусса?

Я новачок у використанні GMM. Мені не вдалося знайти відповідної допомоги в Інтернеті. Чи може хто-небудь, будь ласка, надати мені правильний ресурс на тему "Як вирішити, чи використання GMM відповідає моїй проблемі?" або у випадку проблем із класифікацією "Як вирішити, чи потрібно використовувати класифікацію SVM чи класифікацію GMM?"

9 classification svm gaussian-mixture generalized-moments

1

Різниця між типами SVM

Я новачок, що підтримую векторні машини. Коротке пояснення svmФункція з e1071пакету в R пропонує різні варіанти: C-класифікація ну-класифікація однокласифікація (для виявлення новинок) eps-регресія ну-регресія Які інтуїтивні відмінності між п'ятьма типами? Який слід застосувати в якій ситуації?

9 r classification svm e1071

2

Чи фіксують дерева CART взаємодії між передбачувачами?

У цьому документі стверджується, що в CART, оскільки бінарний розкол виконується по одному коваріату на кожному кроці, всі розщеплення є ортогональними, тому взаємодії між коваріатами не враховуються. Однак багато дуже серйозних посилань стверджують, навпаки, що ієрархічна структура дерева гарантує, що взаємодія між предикторами буде автоматично змодельована (наприклад, цей документ , …

9 machine-learning classification data-mining cart

3

VC розмір прямокутника

У книзі "Вступ до машинного навчання" Етема Альпайдіна зазначено, що розмір VC прямокутника, орієнтованого на вісь, дорівнює 4. Але як можна прямокутник розбити набір із чотирьох колінеарних точок з чергуванням позитивних та негативних точок ?? Чи може хтось пояснити та довести розмір ВК прямокутника?

9 classification vc-dimension

Запитання з тегом «classification»