Статистика та великі дані machine-learning

2

Де знайти заздалегідь підготовлені моделі для трансферного навчання [закрито]

Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі лише редагуючи цю публікацію . Закрито 2 роки тому . Я новачок у галузі машинного навчання, але хотів спробувати застосувати простий алгоритм класифікації з …

9 machine-learning classification neural-networks transfer-learning

2

Чому мої кроки стають меншими при використанні фіксованого розміру кроку в градієнтному спуску?

Припустимо, ми робимо приклад іграшки на градієнті пристойному, мінімізуючи квадратичну функцію , використовуючи фіксований розмір кроку . ( )хТА хxTAxx^TAxα = 0,03α=0.03\alpha=0.03А = [ 10 , 2 ; 2 , 3 ]A=[10,2;2,3]A=[10, 2; 2, 3] Якщо ми побудуємо слід у кожній ітерації, отримаємо наступний малюнок. Чому точки стають «набагато щільнішими», …

9 r machine-learning optimization gradient-descent

1

Виявлені високомірні, співвідносні дані та основні характеристики / коваріати; тестування множинних гіпотез?

У мене є набір даних з близько 5000 часто співвідносних функцій / коваріатів та двійкової відповіді. Дані мені дали, я не збирав їх. Я використовую Lasso і градієнтний прискорення для створення моделей. Я використовую ітераційну, вкладену перехресну перевірку. Я повідомляю про найбільші (абсолютні) коефіцієнти 40 Лассо та 40 найважливіших особливостей …

9 machine-learning multiple-comparisons regression-coefficients lasso high-dimensional

1

Чи корисні функціональний аналіз та гільбертові простори в машинному навчанні? Якщо так, то як?

Мені було цікаво, наскільки гільбертові простори та функціональний аналіз корисні для машинного навчання? Мені здалося, що машинне навчання - це поєднання статистики, інформатики та оптимізації. Як функціональний аналіз стосується цього?

9 machine-learning mathematical-statistics computational-statistics

1

Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними

Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …

9 machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

4

Як інтерпретувати криву виживання моделі Кокса?

Як ви інтерпретуєте криву виживання з пропорційною моделлю небезпеки Кокса? У цьому прикладі іграшки, припустимо, ми маємо коксову пропорційну модель небезпеки для ageзмінної kidneyданих та генеруємо криву виживання. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Наприклад, на час 200200200, яке твердження вірно? або обидва помиляються? Заява 1: у …

9 r survival cox-model likelihood machine-learning deep-learning generative-models machine-learning reinforcement-learning q-learning regression multicollinearity convergence beta-distribution bernoulli-distribution machine-learning self-study pattern-recognition neural-networks stochastic-processes linear

4

Тренування нейронної мережі до регресії завжди передбачає середнє значення

Я треную просту конвертну нейронну мережу для регресії, де завдання передбачити (x, y) розташування коробки на зображенні, наприклад: На виході мережі є два вузли, один для x і один для y. Решта мережі - це стандартна звивиста нейронна мережа. Втрата - це стандартна середня квадратична помилка між передбачуваною позицією коробки …

9 machine-learning neural-networks optimization deep-learning loss-functions

1

Розуміння топології LSTM

Як і багато інших, я знайшов ресурси тут і тут надзвичайно корисними для розуміння клітин LSTM. Я впевнений, що я розумію, як величини течуть і оновлюються, і я досить впевнений, щоб додати також згадані "підключення" та ін. У своєму прикладі я маю на кожному етапі вхідний вектор довжини iта вихідний …

9 machine-learning neural-networks lstm rnn

2

Застосування стохастичного варіативного умовиводу до Байєсової суміші Гаусса

Я намагаюся реалізувати модель Гауссової суміші зі стохастичними варіаційними висновками, слідуючи цій роботі . Це пгм суміші Гаусса. Згідно з документом, повний алгоритм стохастичного варіаційного висновку: І я все ще дуже плутаю метод масштабування його до GMM. По-перше, я подумав, що локальний параметр - це просто а інші - все …

9 machine-learning bayesian clustering gaussian-mixture variational-bayes

2

Чи справді добре виконувати непідконтрольний підбір функції до перехресної перевірки?

У елементах статистичного навчання я знайшов таке твердження: Існує одна кваліфікація: початкові кроки скринінгу без нагляду можуть бути виконані до того, як зразки будуть випущені. Наприклад, ми могли вибрати 1000 предикторів з найбільшою дисперсією для всіх 50 зразків, перш ніж починати перехресну перевірку. Оскільки ця фільтрація не передбачає міток класу, …

9 machine-learning cross-validation feature-selection

2

Чи слід завжди робити резюме?

Моє запитання: чи варто робити резюме навіть для відносно великого набору даних? У мене відносно великий набір даних, і я застосую алгоритм машинного навчання до набору даних. Оскільки мій ПК не швидкий, резюме (і пошук по сітці) займає часом занадто багато часу. Зокрема, SVM ніколи не закінчується через безліч параметрів …

9 machine-learning cross-validation

1

Чи може хтось пояснити, як мені 5 років, цю проблему з ESL Book Hastie?

Я працюю над книгою ESL Hastie, і мені важко займатися питанням 2.3. Питання таке: Ми розглядаємо оцінку найближчого сусіда за початком, і середнє відстань від початку до найближчої точки даних задається цим рівнянням. Я не маю уявлення, з чого почати з точки зору спроб цього вивести. Я знаю, що більшість …

9 machine-learning computational-statistics

6

Я хотів би дізнатися про теорію ймовірностей, теорію вимірювань та нарешті машинне навчання. З чого я починаю? [зачинено]

Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі лише редагуючи цю публікацію . Закрито 3 роки тому . Я хотів би дізнатися про теорію ймовірностей, теорію вимірювань та нарешті машинне навчання. Моя …

9 machine-learning probability references measure-theory

1

Як працює лінійна база, яка навчається, у стимуляції? І як це працює в бібліотеці xgboost?

Я знаю, як реалізувати лінійну цільову функцію та лінійні прискорення в XGBoost. Моє конкретне питання: коли алгоритм підходить до залишкового (або від'ємного градієнта), це використання однієї функції на кожному кроці (тобто універсарна модель) або всіх функцій (багатоваріантна модель)? Будь-яке посилання на документацію про лінійні підсилення в XGBoost буде оцінено. EDIT: …

9 regression machine-learning boosting xgboost

1

Наскільки ефективно Q-навчання за допомогою нейронних мереж, коли є одна вихідна одиниця на дію?

Передумови: Я використовую наближення значення нейронної мережі у своєму навчальному завданні з посиленням. Підхід точно такий, як описаний у цьому питанні , однак сам питання інший. У цьому підході кількість результатів - це кількість дій, які ми можемо вжити. Простими словами, алгоритм наступний: виконайте дію A, досліджуйте нагороду, попросіть NN …

9 machine-learning neural-networks reinforcement-learning q-learning

Запитання з тегом «machine-learning»