Статистика та великі дані machine-learning

1

Наскільки відрізняється підтримка векторної регресії порівняно зі SVM?

Я знаю основи SVM та SVR, але все ще не розумію, як проблема пошуку гіперплану, який максимально збільшує запас, вписується в SVR. По-друге, я прочитав щось про використовується як межа толерантності в SVR. Що це означає?ϵϵ\epsilon По-третє, чи є різниця між параметрами функції прийняття рішення, використовуваними у SVM та SVR?

11 regression machine-learning svm

3

Чи корисні взаємодії лише в умовах регресії?

Я завжди читав термін взаємодія в контексті регресії. Чи слід також розглянути взаємодію з різними моделями, наприклад, knn або svm? Якщо є , або навіть більше функцій і дозволяють сказати спостережень, який звичайний спосіб знайти корисну взаємодію? Спробуйте всі комбінації? Або використовувати лише комбінації, які мають сенс?505050100100100100010001000

11 machine-learning interaction terminology

3

Ресурси для вивчення методик з декількома цілями?

Я шукаю ресурси (книги, конспекти лекцій тощо) про методи, які можуть обробляти дані, які мають кілька цілей (напр .: три залежної змінної: 2 дискретні та 1 безперервна). Хтось має ресурси / знання з цього приводу? Я знаю, що для цього можна використовувати нейронні мережі.

11 regression machine-learning predictive-models references

1

Алгоритми вбудовування в слово з точки зору продуктивності

Я намагаюся вкласти приблизно 60 мільйонів фраз у векторний простір , а потім обчислити схожість косинусів між ними. Я використовую sklearn CountVectorizerз спеціально вбудованою функцією токенізатора, яка створює уніграми та біграми. Виявляється, що для отримання значущих уявлень, я повинен передбачити величезну кількість стовпців, лінійних за кількістю рядків. Це призводить до …

11 machine-learning natural-language word2vec word-embeddings cosine-similarity

2

Класифікація з частково "невідомими" даними

Припустимо, я хочу вивчити класифікатор, який приймає вектор чисел як вхідний і дає мітку класу як вихід. Мої дані навчання складаються з великої кількості пар вхід-вихід. Однак, коли я приходжу до тестування деяких нових даних, ці дані, як правило, лише частково завершені. Наприклад, якщо вектор вводу має довжину 100, лише …

11 machine-learning classification neural-networks deep-learning

2

Об'єднання спостережень у Гауссовому процесі

Я використовую Гауссовий процес (GP) для регресії. У моїй проблемі досить часто два або більше точок даних бути близькими один до одного, відносно масштабів довжини проблеми. Також спостереження можуть бути надзвичайно галасливими. Для прискорення обчислень та підвищення точності вимірювання здається природним об'єднання / інтеграція кластерів точок, близьких одна до одної, …

11 regression machine-learning gaussian-process

2

У чому полягають відмінності між регресією Рейджа за допомогою Rm glmnet та Python's scikit-learn?

Я переглядаю розділ LAB §6.6, присвячений хребтовій регресії / Лассо, в книзі «Вступ до статистичного навчання з додатками в R» Джеймса, Віттена, Хасті, Тібширані (2013). Більш конкретно, я намагаюся застосувати модель scikit-learn Ridgeдо набору даних "Hitters" з пакету R "ISLR". Я створив той самий набір функцій, що і в коді …

11 r machine-learning scikit-learn regression

1

поріг розрахунку для мінімального класифікатора ризику?

Припустимо, два класи і мають атрибут і мають розподіл і . якщо ми маємо рівні до для наступної матриці витрат:C 2 x N ( 0 , 0,5 ) N ( 1 , 0,5 ) P ( C 1 ) = P ( C 2 ) = 0,5С1C1C_1С2C2C_2хxxN( 0 , 0 …

11 machine-learning classification bayesian normal-distribution bivariate

1

Коли використовувати домішки Джині і коли використовувати інформаційний приріст?

Може хтось, будь ласка, пояснить мені, коли слід використовувати домішки Джині та отримання інформації для дерев рішень? Чи можете ви надати мені ситуації / приклади, коли найкраще використовувати який?

11 machine-learning classification data-mining cart

1

Використання стандартних інструментів машинного навчання на даних, що цензуруються ліворуч

Я розробляю програму прогнозування, мета якої - дозволити імпортеру прогнозувати попит на свою продукцію із своєї мережі клієнтів дистриб'юторів. Показники продажів є досить хорошим показником попиту, якщо існує достатня кількість запасів, щоб заповнити попит. Однак, коли товарний запас знижується до нуля (ситуація, яку ми прагнемо допомогти нашому клієнту уникнути), ми …

11 r regression machine-learning censoring

1

Вибір моделі в режимі офлайн та онлайн-навчання

Останнім часом я намагаюся дізнатися більше про онлайн-навчання (це абсолютно захоплююче!), І одна тема, яку мені не вдалося зрозуміти, - як думати про вибір моделі в офлайні та в Інтернеті. В Зокрема, припустимо , що ми тренуємо класифікатор в автономному режимі, на основі деякого фіксованого набору даних . Скажімо, його …

11 machine-learning model-selection online

2

Що це все про машинне навчання в реальній практиці?

Я є новачком у машинному навчанні (також деяка статистика), на деякий час вивчав знання (контрольовані / непідтримувані алгоритми навчання, відповідні методи оптимізації, регуляризація, деякі філософії (наприклад, компроміс з відхиленням відхилення?)). Я знаю, що без будь-якої реальної практики я не отримав би глибокого розуміння цих матеріалів машинного навчання. Тож я розпочну …

11 machine-learning algorithms

2

Чи очікування те саме, що середнє?

Я займаюся ML у своєму університеті, і професор згадував термін Очікування (Е), в той час як він намагався пояснити нам деякі речі про Гауссові процеси. Але з того, як він це пояснив, я зрозумів, що E - це те саме, що і середнє μ. Я правильно зрозумів? Якщо це однаково, …

11 machine-learning gaussian-process linear-algebra

1

Пояснення максимізації очікування

Я знайшов дуже корисний підручник щодо алгоритму ЕМ . Приклад та малюнок із підручника просто геніальні. Пов'язане питання щодо обчислення ймовірностей, як працює максимізація очікування? У мене є ще одне питання щодо того, як з'єднати теорію, описану в підручнику, із прикладом. Під час Е-кроку ЕМ вибирає функцію яка знижує межі …

11 machine-learning clustering algorithms natural-language

4

Як вибрати кількість дерев в узагальненій моделі посиленої регресії?

Чи існує стратегія вибору кількості дерев в ГБМ? Зокрема, ntreesаргумент у R's gbmфункції. Я не бачу, чому ви не повинні встановлювати ntreesмаксимальне розумне значення. Я помітив, що більша кількість дерев явно знижує мінливість результатів від кількох ГБМ. Я не думаю, що велика кількість дерев призведе до надмірного вбрання. Будь-які думки?

11 r machine-learning gbm

Запитання з тегом «machine-learning»