Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

5
Чи мрія автоматизованого машинного навчання?
Коли я відкриваю машинне навчання, я бачу різні цікаві методи, такі як: автоматично налаштовувати алгоритми з такими методами, як grid search, отримати більш точні результати за допомогою комбінації різних алгоритмів одного "типу" boosting, отримати більш точні результати за рахунок поєднання різних алгоритмів (але не той же самий тип алгоритмів), це …

1
Чому люди не використовують більш глибокі RBF або RBF у поєднанні з MLP?
Тож, дивлячись на нейронні мережі радіальної основи функції, я помітив, що люди лише рекомендують використовувати 1 прихований шар, тоді як при багатошарових персептронних нейронних мережах більше шарів вважається кращим. З огляду на те, що мережі RBF можуть бути навчені з версією поширення зворотного зв'язку? Чи є причини, чому більш глибокі …

2
Чому в ідентифікації мови тексту замість слів використовується n-грам?
У двох популярних мовних ідентифікаційних бібліотеках, компактному детекторі мови 2 для C ++ та мовному детекторі для Java, обидві вони використовували (на основі символів) n-грамів для отримання тексту. Чому мішок слів (одне слово / словник) не використовується, і яка перевага та недолік мішок слів і n-грам? Крім того, які ще …

3
чому метод прискорення чутливий до людей, що втрачають перевагу
Я знайшов багато статей, в яких говориться, що прискорені методи чутливі до виснажувачів, але жодна стаття не пояснює, чому. На моєму досвіді, люди, що працюють із людьми, погані для будь-якого алгоритму машинного навчання, але чому прискорені методи виокремлюються як особливо чутливі? Яким чином такі алгоритми можна класифікувати за чутливістю до …

2
Як обчислити вагу критерію Фішера?
Я вивчаю розпізнавання образів і машинне навчання, і я натрапив на таке питання. Розглянемо двокласну задачу класифікації з рівною ймовірністю попереднього класуP(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} і розподіл примірників у кожному класі, заданий p(x|D1)=N([00],[2001]),p(x|D1)=N([00],[2001]), p(x|D_1)= {\cal N} \left( \begin{bmatrix} 0 \\0 \end{bmatrix}, \begin{bmatrix} 2 & 0 \\ 0 & 1 \end{bmatrix} \right), p(x|D2)=N([44],[1001]).p(x|D2)=N([44],[1001]). …


1
Чи є сучасні способи використання джекніфінгу?
Питання: завантажувальний процес перевершує джекніфінг; однак мені цікаво, чи є випадки, коли jackknifing є єдиним або принаймні життєздатним варіантом для визначення невизначеності оцінок параметрів. Крім того, на практичних ситуаціях, наскільки упередженим / неточним є джекніфінг відносно завантажувального завантаження, і чи можуть результати джекніфа забезпечити попереднє розуміння перед тим, як розробити …

1
Відмінності між рандомізованою логістичною регресією та рівнинно-ванільною логістичною регресією
Мені хотілося б знати відмінності між рандомізованою логістичною регресією (RLR) та простою логістичною регресією (LR), тому я читаю статтю "Вибір стабільності" від Meinshausen et al. ; проте я не розумію, що таке RLR і чим відрізняються RLR від LR. Чи може хтось вказати на те, що я повинен прочитати, щоб …

1
Чи є різниця між віддаленим наглядом, самонавчанням, самонавідним навчанням та слабким наглядом?
З того, що я прочитав: Далекий нагляд : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data and …

3
Розуміння параметрів функції Гаусса Базиса, що використовуються в лінійній регресії
Я хотів би застосувати функцію бази Гаусса в реалізації лінійної регресії. На жаль, мені важко зрозуміти пару параметрів у базовій функції. Зокрема μμ\mu і σσ\sigma . Мій набір даних - матриця 10 000 х 31. 10 000 зразків та 31 особливість. Я читав, що "Кожна основна функція перетворює вхідний вектор …

4
Чи можете ви порівняти різні методи кластеризації на наборі даних без основної істини шляхом перехресної перевірки?
На даний момент я намагаюся проаналізувати набір даних текстових документів, які не мають основної істини. Мені сказали, що ви можете використовувати k-кратну перехресну перевірку для порівняння різних методів кластеризації. Однак у прикладах, які я бачив у минулому, використовується основна правда. Чи можна використовувати засоби k-fold на цьому наборі даних для …

5
Рекурсивний (онлайн) алгоритм регуляризованих найменших квадратів
Чи може хтось вказати мені в напрямку онлайн (рекурсивного) алгоритму регуляризації Тихонова (регуляризовані найменші квадрати)? У режимі офлайн я б обчислював β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY використовуючи свій оригінальний набір даних, де λλλ знайдено за допомогою n-кратної перехресної перевірки. Нове значення yyy можна передбачити для даного xxx використовуючи y=xTβ^y=xTβ^y=x^T\hat\beta . В онлайн-налаштуваннях я постійно …

2
Як застосувати нейронні мережі до задач класифікації на багато міток?
Опис: Нехай проблемною областю буде класифікація документів там, де існує набір функцій векторів, кожен з яких належить до 1 або більше класів. Наприклад, документ doc_1може належати Sportsі Englishкатегорії. Питання: Використовуючи нейронну мережу для класифікації, якою міткою був би вектор функції? це був би вектор, що складається з усіх класів таким, …

1
Перші кроки навчання для прогнозування фінансових часових періодів за допомогою машинного навчання
Я намагаюся зрозуміти, як використовувати машинне навчання для прогнозування фінансових часових серій 1 або більше кроків у майбутнє. У мене є фінансові часописи з деякими описовими даними, і я хотів би сформувати модель, а потім використовувати модель для прогнозування n-кроків вперед. Що я робив поки що: getSymbols("GOOG") GOOG$sma <- SMA(Cl(GOOG)) …

6
Які алгоритми машинного навчання корисні для оцінки, які функції є більш важливими?
У мене є дані з мінімальною кількістю функцій, які не змінюються, і декілька додаткових функцій, які можуть змінюватися і мають великий вплив на результат. Мій набір даних виглядає приблизно так: Особливості: A, B, C (завжди присутній) та D, E, F, G, H (іноді присутній) A = 10, B = 10, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.