Статистика та великі дані machine-learning

2

У мене є декілька тісно пов’язаних питань щодо слабких учнів, що навчаються в ансамблі (наприклад, стимулювання). Це може здатися німим, але які переваги використання слабких на відміну від сильних учнів? (наприклад, чому б не підсилити "сильні" методи навчання?) Чи є якась "оптимальна" сила для слабких учнів (наприклад, зберігаючи всі інші …

22 machine-learning boosting ensemble

3

Підтримка векторної регресії для прогнозування багатоваріантних часових рядів

Хтось намагався прогнозувати часові ряди, використовуючи регресію вектора підтримки? Я розумію, що підтримують векторні машини підтримки і частково розуміють регресію векторів підтримки, але не розумію, як їх можна використовувати для моделювання часових рядів, особливо багатоваріантних часових рядів. Я спробував прочитати кілька робіт, але вони занадто високі. Чи може хтось просто …

22 time-series machine-learning svm

9

Як визначити впевненість прогнозу нейронної мережі?

Щоб проілюструвати моє запитання, припустимо, що у мене є навчальний набір, де вхід має ступінь шуму, але вихід, наприклад, не має; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] тут вихід …

22 regression machine-learning neural-networks confidence-interval prediction-interval

2

Коли ми повинні дискретизувати / бін безперервні незалежні змінні / функції, а коли не слід?

Коли ми повинні дискретизувати / бін незалежні змінні / функції, а коли не слід? Мої спроби відповісти на питання: Взагалі, ми не повинні бініти, оскільки бінінг втратить інформацію. Бінінг насправді збільшує ступінь свободи моделі, тому можливе сприятливе пристосування після бінінгу. Якщо у нас є модель "з великим ухилом", бінінг може …

22 machine-learning continuous-data feature-construction binning

2

Чи всі алгоритми машинного навчання розділяють дані лінійно?

Я любитель програмування та машинного навчання. Лише кілька місяців тому я почав вивчати програмування машинного навчання. Як і багато хто, хто не має кількісного наукового досвіду, я також почав дізнаватися про ML, познайомившись з алгоритмами та наборами даних у широко використовуваному пакеті ML (caret R). Ще деякий час я читав …

22 machine-learning

2

Вибір оптимальної альфа-еластичної логістичної регресії

Я здійснюю еластичну чисту логістичну регресію на наборі даних охорони здоров’я, використовуючи glmnetпакет в R, вибираючи значення лямбда по сітці від 0 до 1. Мій скорочений код нижче:αα\alpha alphalist <- seq(0,1,by=0.1) elasticnet <- lapply(alphalist, function(a){ cv.glmnet(x, y, alpha=a, family="binomial", lambda.min.ratio=.001) }) for (i in 1:11) {print(min(elasticnet[[i]]$cvm))} яка виводить середню перехресну …

22 machine-learning cross-validation glmnet elastic-net

3

Чому Ларс і Глмнет дають різні рішення для проблеми Лассо?

Я хочу краще зрозуміти пакети R Larsі Glmnet, які використовуються для вирішення задачі Лассо: (проpзмінні таNзразків, див.www.stanford.edu/~hastie/Papers/glmnet.pdfна сторінці 3)м я н( β0β) ∈ Rр + 1[ 12 Н∑i = 1N( уi- β0- хТiβ)2+ λ | | β| |л1]мiн(β0β)∈Rp+1[12N∑i=1N(уi-β0-хiТβ)2+λ||β||л1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + \lambda||\beta ||_{l_{1}} \right]pppNNN Тому я застосував їх …

22 r regression machine-learning lasso regularization

8

Виконайте K-засоби (або його близькі споріднення), кластеризуючи лише матрицю відстані, а не дані по характеристиках

Я хочу виконати кластеризацію K-засобів на об'єктах, які у мене є, але об'єкти не описуються як точки в просторі, тобто за objects x featuresнабором даних. Однак я в змозі обчислити відстань між будь-якими двома об’єктами (воно засноване на функції подібності). Отже, я розпоряджаюсь матрицею відстані objects x objects. Я раніше …

22 machine-learning clustering data-mining k-means distance

4

Як би ви створили систему машинного навчання грі Angry Birds?

Погравши занадто багато Angry Birds, я почав дотримуватися власних стратегій. Виявляється, я розробив дуже специфічний підхід до отримання 3 зірок на кожному рівні. Це змусило мене замислитися над проблемами розвитку системи машинного навчання, яка б змогла грати Angry Birds. Взаємодія з грою та запуск птахів є тривіальною. Але одне питання, …

22 machine-learning reinforcement-learning

1

Видалення одного з стовпців при використанні однокольорового кодування

Я розумію, що при машинному навчанні це може бути проблемою, якщо ваш набір даних має дуже корельовані функції, оскільки вони ефективно кодують ту саму інформацію. Нещодавно хтось зазначав, що коли ви робите одноразове кодування за категоріальною змінною, ви отримуєте корельовані функції, тому вам слід відкинути один із них як "посилання". …

22 regression machine-learning categorical-data discrete-data categorical-encoding

2

Машина Больцмана з обмеженими можливостями: як вона використовується в машинному навчанні?

Фон: Так, для обмеження ваг нейронної мережі МОЖЕ бути використана обмежена машина Больцмана (БРМ). Також його можна використовувати "пошарово" шляхом побудови глибокої мережі вірування (тобто тренування -го шару на верхньому ( n - 1 ) -го шару, а потім для підготовки -й шар у верхній частині -го шару, промийте і …

21 machine-learning neural-networks deep-learning deep-belief-networks rbm

4

Чи можна використовувати алгоритми машинного навчання або глибокого навчання для «покращення» процесу вибірки методу MCMC?

На основі мало знань, які я маю щодо методів MCMC (ланцюг Маркова Монте-Карло), я розумію, що відбір проб є важливою частиною вищезгаданої методики. Найпоширенішими методами відбору проб є Гамільтоніан та Метрополіс. Чи є спосіб використовувати машинне навчання або навіть глибоке навчання для побудови більш ефективного пробника MCMC?

21 machine-learning mcmc monte-carlo markov-process

5

Наряд: Ні срібної кулі?

Я розумію, що навіть якщо в відповідності з належною перехресної процедурою вибору перевірки і моделі, перенавчання буде , якщо один шукає в моделі досить важко , якщо накласти обмеження на складності моделі, період. Крім того, часто люди намагаються навчитися штрафувати щодо складності моделі з даних, що підриває захист, який вони …

21 machine-learning cross-validation goodness-of-fit scikit-learn caret

4

«Напівнавчальне навчання» - це надмірна підготовка?

Я читав звіт про переможне рішення конкурсу Kaggle ( Класифікація зловмисних програм ). Звіт можна знайти у цьому дописі на форумі . Проблема була проблемою класифікації (дев'ять класів, метрика - логарифмічна втрата) із 10000 елементами в наборі поїздів, 10000 елементами в тестовому наборі. Під час змагань моделі оцінювались проти 30% …

21 machine-learning random-forest boosting overfitting semi-supervised

3

Як передбачити результат лише з позитивних випадків як навчання?

Для простоти, скажімо, я працюю на класичному прикладі спам / не-спам-листів. У мене є набір 20000 електронних листів. З них я знаю, що 2000 - це спам, але я не маю жодного прикладу не-спам-листів. Я хотів би передбачити, чи залишилися 18000 спамом чи ні. В ідеалі результат, який я шукаю, …

21 machine-learning predictive-models unsupervised-learning supervised-learning semi-supervised

Запитання з тегом «machine-learning»