Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

2
Де знайти заздалегідь підготовлені моделі для трансферного навчання [закрито]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі лише редагуючи цю публікацію . Закрито 2 роки тому . Я новачок у галузі машинного навчання, але хотів спробувати застосувати простий алгоритм класифікації з …

2
Чому мої кроки стають меншими при використанні фіксованого розміру кроку в градієнтному спуску?
Припустимо, ми робимо приклад іграшки на градієнті пристойному, мінімізуючи квадратичну функцію , використовуючи фіксований розмір кроку . ( )хТА хxTAxx^TAxα = 0,03α=0.03\alpha=0.03А = [ 10 , 2 ; 2 , 3 ]A=[10,2;2,3]A=[10, 2; 2, 3] Якщо ми побудуємо слід у кожній ітерації, отримаємо наступний малюнок. Чому точки стають «набагато щільнішими», …

1
Виявлені високомірні, співвідносні дані та основні характеристики / коваріати; тестування множинних гіпотез?
У мене є набір даних з близько 5000 часто співвідносних функцій / коваріатів та двійкової відповіді. Дані мені дали, я не збирав їх. Я використовую Lasso і градієнтний прискорення для створення моделей. Я використовую ітераційну, вкладену перехресну перевірку. Я повідомляю про найбільші (абсолютні) коефіцієнти 40 Лассо та 40 найважливіших особливостей …

1
Чи корисні функціональний аналіз та гільбертові простори в машинному навчанні? Якщо так, то як?
Мені було цікаво, наскільки гільбертові простори та функціональний аналіз корисні для машинного навчання? Мені здалося, що машинне навчання - це поєднання статистики, інформатики та оптимізації. Як функціональний аналіз стосується цього?

1
Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними
Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
Як інтерпретувати криву виживання моделі Кокса?
Як ви інтерпретуєте криву виживання з пропорційною моделлю небезпеки Кокса? У цьому прикладі іграшки, припустимо, ми маємо коксову пропорційну модель небезпеки для ageзмінної kidneyданих та генеруємо криву виживання. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Наприклад, на час 200200200, яке твердження вірно? або обидва помиляються? Заява 1: у …

4
Тренування нейронної мережі до регресії завжди передбачає середнє значення
Я треную просту конвертну нейронну мережу для регресії, де завдання передбачити (x, y) розташування коробки на зображенні, наприклад: На виході мережі є два вузли, один для x і один для y. Решта мережі - це стандартна звивиста нейронна мережа. Втрата - це стандартна середня квадратична помилка між передбачуваною позицією коробки …

1
Розуміння топології LSTM
Як і багато інших, я знайшов ресурси тут і тут надзвичайно корисними для розуміння клітин LSTM. Я впевнений, що я розумію, як величини течуть і оновлюються, і я досить впевнений, щоб додати також згадані "підключення" та ін. У своєму прикладі я маю на кожному етапі вхідний вектор довжини iта вихідний …

2
Застосування стохастичного варіативного умовиводу до Байєсової суміші Гаусса
Я намагаюся реалізувати модель Гауссової суміші зі стохастичними варіаційними висновками, слідуючи цій роботі . Це пгм суміші Гаусса. Згідно з документом, повний алгоритм стохастичного варіаційного висновку: І я все ще дуже плутаю метод масштабування його до GMM. По-перше, я подумав, що локальний параметр - це просто а інші - все …

2
Чи справді добре виконувати непідконтрольний підбір функції до перехресної перевірки?
У елементах статистичного навчання я знайшов таке твердження: Існує одна кваліфікація: початкові кроки скринінгу без нагляду можуть бути виконані до того, як зразки будуть випущені. Наприклад, ми могли вибрати 1000 предикторів з найбільшою дисперсією для всіх 50 зразків, перш ніж починати перехресну перевірку. Оскільки ця фільтрація не передбачає міток класу, …

2
Чи слід завжди робити резюме?
Моє запитання: чи варто робити резюме навіть для відносно великого набору даних? У мене відносно великий набір даних, і я застосую алгоритм машинного навчання до набору даних. Оскільки мій ПК не швидкий, резюме (і пошук по сітці) займає часом занадто багато часу. Зокрема, SVM ніколи не закінчується через безліч параметрів …

1
Чи може хтось пояснити, як мені 5 років, цю проблему з ESL Book Hastie?
Я працюю над книгою ESL Hastie, і мені важко займатися питанням 2.3. Питання таке: Ми розглядаємо оцінку найближчого сусіда за початком, і середнє відстань від початку до найближчої точки даних задається цим рівнянням. Я не маю уявлення, з чого почати з точки зору спроб цього вивести. Я знаю, що більшість …

6
Я хотів би дізнатися про теорію ймовірностей, теорію вимірювань та нарешті машинне навчання. З чого я починаю? [зачинено]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі лише редагуючи цю публікацію . Закрито 3 роки тому . Я хотів би дізнатися про теорію ймовірностей, теорію вимірювань та нарешті машинне навчання. Моя …

1
Як працює лінійна база, яка навчається, у стимуляції? І як це працює в бібліотеці xgboost?
Я знаю, як реалізувати лінійну цільову функцію та лінійні прискорення в XGBoost. Моє конкретне питання: коли алгоритм підходить до залишкового (або від'ємного градієнта), це використання однієї функції на кожному кроці (тобто універсарна модель) або всіх функцій (багатоваріантна модель)? Будь-яке посилання на документацію про лінійні підсилення в XGBoost буде оцінено. EDIT: …

1
Наскільки ефективно Q-навчання за допомогою нейронних мереж, коли є одна вихідна одиниця на дію?
Передумови: Я використовую наближення значення нейронної мережі у своєму навчальному завданні з посиленням. Підхід точно такий, як описаний у цьому питанні , однак сам питання інший. У цьому підході кількість результатів - це кількість дій, які ми можемо вжити. Простими словами, алгоритм наступний: виконайте дію A, досліджуйте нагороду, попросіть NN …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.