Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

1
Наскільки відрізняється підтримка векторної регресії порівняно зі SVM?
Я знаю основи SVM та SVR, але все ще не розумію, як проблема пошуку гіперплану, який максимально збільшує запас, вписується в SVR. По-друге, я прочитав щось про використовується як межа толерантності в SVR. Що це означає?ϵϵ\epsilon По-третє, чи є різниця між параметрами функції прийняття рішення, використовуваними у SVM та SVR?

3
Чи корисні взаємодії лише в умовах регресії?
Я завжди читав термін взаємодія в контексті регресії. Чи слід також розглянути взаємодію з різними моделями, наприклад, knn або svm? Якщо є , або навіть більше функцій і дозволяють сказати спостережень, який звичайний спосіб знайти корисну взаємодію? Спробуйте всі комбінації? Або використовувати лише комбінації, які мають сенс?505050100100100100010001000

3
Ресурси для вивчення методик з декількома цілями?
Я шукаю ресурси (книги, конспекти лекцій тощо) про методи, які можуть обробляти дані, які мають кілька цілей (напр .: три залежної змінної: 2 дискретні та 1 безперервна). Хтось має ресурси / знання з цього приводу? Я знаю, що для цього можна використовувати нейронні мережі.

1
Алгоритми вбудовування в слово з точки зору продуктивності
Я намагаюся вкласти приблизно 60 мільйонів фраз у векторний простір , а потім обчислити схожість косинусів між ними. Я використовую sklearn CountVectorizerз спеціально вбудованою функцією токенізатора, яка створює уніграми та біграми. Виявляється, що для отримання значущих уявлень, я повинен передбачити величезну кількість стовпців, лінійних за кількістю рядків. Це призводить до …

2
Класифікація з частково "невідомими" даними
Припустимо, я хочу вивчити класифікатор, який приймає вектор чисел як вхідний і дає мітку класу як вихід. Мої дані навчання складаються з великої кількості пар вхід-вихід. Однак, коли я приходжу до тестування деяких нових даних, ці дані, як правило, лише частково завершені. Наприклад, якщо вектор вводу має довжину 100, лише …

2
Об'єднання спостережень у Гауссовому процесі
Я використовую Гауссовий процес (GP) для регресії. У моїй проблемі досить часто два або більше точок даних бути близькими один до одного, відносно масштабів довжини проблеми. Також спостереження можуть бути надзвичайно галасливими. Для прискорення обчислень та підвищення точності вимірювання здається природним об'єднання / інтеграція кластерів точок, близьких одна до одної, …

2
У чому полягають відмінності між регресією Рейджа за допомогою Rm glmnet та Python's scikit-learn?
Я переглядаю розділ LAB §6.6, присвячений хребтовій регресії / Лассо, в книзі «Вступ до статистичного навчання з додатками в R» Джеймса, Віттена, Хасті, Тібширані (2013). Більш конкретно, я намагаюся застосувати модель scikit-learn Ridgeдо набору даних "Hitters" з пакету R "ISLR". Я створив той самий набір функцій, що і в коді …


1
Коли використовувати домішки Джині і коли використовувати інформаційний приріст?
Може хтось, будь ласка, пояснить мені, коли слід використовувати домішки Джині та отримання інформації для дерев рішень? Чи можете ви надати мені ситуації / приклади, коли найкраще використовувати який?

1
Використання стандартних інструментів машинного навчання на даних, що цензуруються ліворуч
Я розробляю програму прогнозування, мета якої - дозволити імпортеру прогнозувати попит на свою продукцію із своєї мережі клієнтів дистриб'юторів. Показники продажів є досить хорошим показником попиту, якщо існує достатня кількість запасів, щоб заповнити попит. Однак, коли товарний запас знижується до нуля (ситуація, яку ми прагнемо допомогти нашому клієнту уникнути), ми …

1
Вибір моделі в режимі офлайн та онлайн-навчання
Останнім часом я намагаюся дізнатися більше про онлайн-навчання (це абсолютно захоплююче!), І одна тема, яку мені не вдалося зрозуміти, - як думати про вибір моделі в офлайні та в Інтернеті. В Зокрема, припустимо , що ми тренуємо класифікатор в автономному режимі, на основі деякого фіксованого набору даних . Скажімо, його …

2
Що це все про машинне навчання в реальній практиці?
Я є новачком у машинному навчанні (також деяка статистика), на деякий час вивчав знання (контрольовані / непідтримувані алгоритми навчання, відповідні методи оптимізації, регуляризація, деякі філософії (наприклад, компроміс з відхиленням відхилення?)). Я знаю, що без будь-якої реальної практики я не отримав би глибокого розуміння цих матеріалів машинного навчання. Тож я розпочну …

2
Чи очікування те саме, що середнє?
Я займаюся ML у своєму університеті, і професор згадував термін Очікування (Е), в той час як він намагався пояснити нам деякі речі про Гауссові процеси. Але з того, як він це пояснив, я зрозумів, що E - це те саме, що і середнє μ. Я правильно зрозумів? Якщо це однаково, …

1
Пояснення максимізації очікування
Я знайшов дуже корисний підручник щодо алгоритму ЕМ . Приклад та малюнок із підручника просто геніальні. Пов'язане питання щодо обчислення ймовірностей, як працює максимізація очікування? У мене є ще одне питання щодо того, як з'єднати теорію, описану в підручнику, із прикладом. Під час Е-кроку ЕМ вибирає функцію яка знижує межі …

4
Як вибрати кількість дерев в узагальненій моделі посиленої регресії?
Чи існує стратегія вибору кількості дерев в ГБМ? Зокрема, ntreesаргумент у R's gbmфункції. Я не бачу, чому ви не повинні встановлювати ntreesмаксимальне розумне значення. Я помітив, що більша кількість дерев явно знижує мінливість результатів від кількох ГБМ. Я не думаю, що велика кількість дерев призведе до надмірного вбрання. Будь-які думки?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.