Запитання з тегом «svm»

Технологія підтримки Vector посилається на "сукупність споріднених методів навчання під контролем, які аналізують дані та розпізнають зразки, використовувані для класифікації та регресійного аналізу".

2
тренінгові підходи для сильно незбалансованого набору даних
У мене сильно незбалансований набір даних тесту. Позитивний набір складається з 100 випадків, тоді як негативний - 1500 випадків. Що стосується тренінгу, у мене є більший пул кандидатів: позитивний навчальний набір має 1200 випадків, а негативний навчальний набір - 12000 випадків. Для подібного сценарію у мене є кілька варіантів: 1) …

4
Низька точність класифікації, що робити далі?
Отже, я новачок у галузі ML та намагаюся зробити якусь класифікацію. Моя мета - передбачити результат спортивної події. Я зібрав декілька історичних даних і зараз намагаюся підготувати класифікатора. У мене було близько 1200 зразків, 0,2 з них я розділив для тестових цілей, інші я вклав у пошук сітки (включена перехресна …

3
Пошук сітки при перехресній валідації k-кратної
Я маю набір даних 120 зразків у 10-кратній перехресній валідації. В даний час я підбираю дані тренувань першого тренінгу і роблю на ньому 5-кратну перехресну перевірку, щоб вибрати значення гамма та С шляхом пошуку по сітці. Я використовую SVM з ядром RBF. Оскільки я роблю десять 10 крос-валідацій, щоб повідомити …

6
Найшвидша реалізація SVM
Більше загального питання. Я запускаю rbf SVM для прогнозного моделювання. Я думаю, що моїй програмі, безумовно, потрібно трохи прискорити. Я використовую scikit learn з грубим точним пошуком сітки + перехресне підтвердження. Кожен пробіг SVM займає близько хвилини, але з усіма ітераціями я все ще знаходжу це занадто повільно. Припустимо, що …

3
SVM для незбалансованих даних
Я хочу спробувати використовувати векторні машини підтримки (SVM) у своєму наборі даних. Перш ніж спробувати проблему, мене попередили, що SVM не справляються з надзвичайно незбалансованими даними. У моєму випадку я можу мати 95-98% 0 і 2-5% 1. Я намагався знайти ресурси, які говорили про використання SVM на рідкісних / незбалансованих …

1
Яка інтуїція за обмінними зразками під нульовою гіпотезою?
Перестановочні тести (також називаються тестом рандомизації, тестом на повторну рандомізацію або точним тестом) дуже корисні і корисні, коли припущення про нормальний розподіл, необхідне, наприклад, t-testне виконується, і при перетворенні значень за ранжуванням непараметричний тест, як-от Mann-Whitney-U-test, призведе до втрати більше інформації. Однак одне і єдине припущення не слід оминути увагою …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
Інтуїція для підтримки векторних машин та гіперплану
У своєму проекті я хочу створити логістичну регресійну модель для прогнозування бінарної класифікації (1 або 0). У мене 15 змінних, 2 з яких категоричні, а решта - це суміш безперервних та дискретних змінних. Для того, щоб відповідати моделі логістичної регресії, мені порадили перевірити наявність лінійної відокремленості за допомогою SVM, перцептрон …

5
Ядро SVM: Я хочу інтуїтивно зрозуміти відображення у просторі більш високого розміру, і як це робить можливим лінійне розділення
Я намагаюся зрозуміти інтуїцію, що стоїть за SVM ядра. Тепер я розумію, як працює лінійна SVM, завдяки якій приймається лінія рішення, яка розбиває дані якнайкраще. Я також розумію принцип переносу даних у простор більш високого розміру, і як це може полегшити пошук лінійної лінії рішення у цьому новому просторі. Я …

2
Змішування безперервних та бінарних даних з лінійним SVM?
Тож я грав із SVM, і мені цікаво, чи це добре робити: У мене є набір безперервних функцій (від 0 до 1) та набір категоричних ознак, які я перетворив на фіктивні змінні. У цьому конкретному випадку я кодую дату вимірювання у фіктивній змінній: У мене є три періоди, з яких …

2
Чому масштаб важливий для лінійної класифікації SVM?
Виконуючи лінійну класифікацію SVM, часто корисно нормалізувати дані тренувань, наприклад, віднімаючи середнє та ділення на стандартне відхилення, а потім масштабувати дані тесту із середнім та стандартним відхиленням даних тренувань. Чому цей процес різко змінює ефективність класифікації?

1
Чи впливає прокляття розмірності на деякі моделі більше, ніж на інші?
Місця, які я читав про прокляття розмірності, пояснюють це в поєднанні насамперед з kNN та лінійними моделями взагалі. Я регулярно бачу найкращих рейтингів у Kaggle, використовуючи тисячі функцій на наборі даних, які навряд чи мають 100k балів даних. Вони, в основному, використовують бусте дерева та NN, серед інших. Це багато …

3
Що означає "машина" в "машині підтримки вектора" та "машині з обмеженим набором Больцмана"?
Чому їх називають «машинами»? Чи є в цьому контексті слово "машина"? (Як і назва "лінійне програмування" може бути заплутаним, але ми знаємо, чому його називають "програмуванням".)

3
втрати шарніру проти логістичних збитків, переваги та недоліки / обмеження
Втрату шарніру можна визначити за допомогою а втрата журналу може бути визначена якмакс ( 0 , 1 - уiшТхi)макс(0,1-уiшТхi)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)журнал ( 1 + розд( - уiшТхi) )журнал(1+досвід⁡(-уiшТхi))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) У мене є такі питання: Чи є якісь недоліки втрати шарніру (наприклад, чутливі до виснажувачів, як зазначено в http://www.unc.edu/~yfliu/papers/rsvm.pdf )? Які …

1
Різниця між логістичною регресією та підтримуючими векторними машинами?
Я знаю, що при логістичній регресії виявляється гіперплан, який розділяє навчальні зразки. Я також знаю, що векторні машини підтримки знаходять гіперплан з максимальним запасом. Моє запитання: чи різниця між логістичною регресією (LR) та машинами підтримки вектора (SVM) полягає в тому, що LR виявляє будь-яку гіперплану, яка розділяє навчальні зразки, тоді …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.