Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

3
Випробування на лінійну відокремлюваність
Чи є спосіб перевірити лінійну відокремленість двокласного набору даних у великих розмірах? Мої вектори функцій 40-довгі. Я знаю, що я завжди можу проводити експерименти з логістичною регресією та визначати швидкість поштовху проти помилкової тривоги, щоб зробити висновок, чи є два класи лінійно відокремленими чи ні, але було б добре знати, …

1
libsvm попередження та перехресне підтвердження "досягнення максимальної кількості ітерацій"
Я використовую libsvm в режимі C-SVC з поліномним ядром ступеня 2, і мені потрібно тренувати кілька SVM. Кожен навчальний набір має 10 функцій та 5000 векторів. Під час тренінгу я отримую це попередження для більшості СВМ, які я треную: WARNING: reaching max number of iterations optimization finished, #iter = 10000000 …

1
Чому обрізка не потрібна для випадкових лісових дерев?
Брейман каже, що дерева вирощуються з поза обрізкою. Чому? Я маю на увазі сказати, що повинна бути вагома причина, чому дерева у випадкових лісах не обрізають. З іншого боку, дуже важливо обрізати єдине дерево рішень, щоб уникнути надмірного розміщення. Чи є література доступна для читання з цієї причини? Звичайно, дерева …

2
Чи AdaBoost менш чи більше схильний до переозброєння?
Я читав різні (здавалося б) суперечливі твердження про те, чи AdaBoost (або інші прискорювальні методи) менш чи більше схильні до переозброєння порівняно з іншими методами навчання. Чи є вагомі підстави вірити тим чи іншим? Якщо це залежить, від чого це залежить? Які причини того, що AdaBoost менш / більше схильний …

3
Застосування «хитрості ядра» до лінійних методів?
Трюк ядра використовується в декількох моделях машинного навчання (наприклад , SVM ). Вперше він був введений у статті "Теоретичні основи методу потенційної функції в навчанні розпізнавання образів" у 1964 році. Визначення вікіпедії говорить, що це так метод використання алгоритму лінійного класифікатора для вирішення нелінійної задачі шляхом відображення оригінальних нелінійних спостережень …

2
Яким чином випадковий ліс породжує випадковий ліс
Я не фахівець з випадкових лісів, але чітко розумію, що ключовим питанням випадкового лісу є (випадкове) генерування дерев. Чи можете ви пояснити мені, як генеруються дерева? (тобто Який використовуваний розподіл для генерації дерев?) Спасибі заздалегідь !

1
Різниця між відсутніми даними та розрідженими даними в алгоритмах машинного навчання
Які основні відмінності між розрідженими даними та відсутніми даними? І як це впливає на машинне навчання? Більш конкретно, який вплив мають рідкісні та відсутні дані на алгоритми класифікації та тип регресії (прогнозування чисел) алгоритмів. Я говорю про ситуацію, коли відсоток відсутніх даних є значним, і ми не можемо скинути рядки, …

5
Чому функціональна техніка працює?
Нещодавно я дізнався, що один із способів пошуку кращих рішень для проблем ML - це створення функцій. Можна зробити це, наприклад підсумувавши дві функції. Наприклад, ми маємо дві особливості «атака» та «захист» якогось героя. Потім ми створюємо додаткову функцію під назвою "загальний", яка є сумою "атаки" та "оборони". Зараз мені …

2
Розуміння похідного відхилення відхилення від дисперсії
Я читаю розділ компрометації дисперсії Елементи статистичного навчання, і я сумніваюся у формулі на сторінці 29. Нехай дані виникають із такої моделі, що Y= f( x ) + ϵY=f(х)+ϵ Y = f(x)+\epsilon де - випадкове число з очікуваним значенням та варіацією . Нехай очікуване значення похибки моделі - де - …

2
Які методи оптимізації найкраще працюють для LSTM?
Я використовував theano для експерименту з LSTM, і мені було цікаво, які методи оптимізації (SGD, Adagrad, Adadelta, RMSprop, Adam тощо) найкраще працюють для LSTM? Чи є якісь наукові роботи на цю тему? Також, чи залежить відповідь від типу програми, для якої я використовую LSTM? Якщо так, я використовую LSTM для …

2
Чи функціонує потяг для карет для перехресного підтвердження glmnet як для альфа, так і для лямбда?
Чи перекваліфікується caretпакет R як для моделі, так alphaі lambdaдля glmnetмоделі? Запустивши цей код, eGrid <- expand.grid(.alpha = (1:10) * 0.1, .lambda = (1:10) * 0.1) Control <- trainControl(method = "repeatedcv",repeats = 3,verboseIter =TRUE) netFit <- train(x =train_features, y = y_train, method = "glmnet", tuneGrid = eGrid, trControl = Control) …

2
Чому зворотне розповсюдження не працює, коли ви ініціалізуєте ваги однакового значення?
Чому зворотне розповсюдження не працює, коли ви ініціалізуєте всю вагу одного і того ж значення (скажімо, 0,5), але працює добре, коли задаються випадкові числа? Чи не повинен алгоритм обчислювати помилку і працювати звідти, незважаючи на те, що ваги спочатку однакові?

5
Глибоке навчання: як я можу знати, які змінні важливі?
Щодо мовлення нейронної мережі (y = вага * x + зміщення), як я можу знати, які змінні важливіші за інші? У мене є нейронна мережа з 10 входами, 1 прихованим шаром з 20 вузлами та 1 вихідним шаром, який має 1 вузол. Я не впевнений, як знати, які вхідні змінні …

3
Коли генетичні алгоритми є хорошим вибором для оптимізації?
Генетичні алгоритми є однією з форм методу оптимізації. Часто стохастичний градієнтний спуск та його похідні є найкращим вибором для оптимізації функцій, але генетичні алгоритми все ще іноді застосовуються. Наприклад, антена космічного корабля ST5 NASA була створена за допомогою генетичного алгоритму: Коли методи генетичної оптимізації є кращим вибором, ніж більш поширені …

3
Чому ваги мереж RNN / LSTM розподіляються впродовж часу?
Нещодавно я зацікавився LSTM, і я з подивом дізнався, що ваги діляться з часом. Я знаю, що якщо ви поділяєте ваги протягом часу, то ваші послідовності введення часу можуть бути різної довжини. З загальною вагою у вас є набагато менше параметрів для тренування. З мого розуміння, причина, з якої можна …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.