Запитання з тегом «machine-learning»

Методи та принципи побудови "комп'ютерних систем, які автоматично вдосконалюються з досвідом".


4
Інтервал прогнозування навколо прогнозу часових рядів LSTM
Чи існує метод обчислення інтервалу прогнозування (розподілу ймовірностей) навколо прогнозу часових рядів з нейронної мережі LSTM (або іншої періодичної)? Скажімо, наприклад, я прогнозую 10 зразків у майбутнє (t + 1 до t + 10), виходячи з останніх 10 спостережуваних вибірок (t-9 до t), я б очікував, що прогноз при t …

4
Як масштабувати масив підписаних цілих чисел для діапазону від 0 до 1?
Я використовую Brain для тренування нейронної мережі на наборі функцій, що включає як позитивні, так і негативні значення. Але для мозку потрібні вхідні значення від 0 до 1. Який найкращий спосіб нормалізувати мої дані?

3
Що означає вихід моделі model.predict від Keras?
Я створив модель LSTM для передбачення повторюваних питань на офіційному наборі даних Quora. Тестові мітки дорівнюють 0 або 1. 1 означає, що пара запитань є дублікатом. Після побудови моделі за допомогою model.fitя тестую модель, використовуючи model.predictдані тесту. Вихід - це масив значень, таких як нижче: [ 0.00514298] [ 0.15161049] [ …


1
XGBRegressor проти xgboost.train величезна різниця швидкостей?
Якщо я треную свою модель, використовуючи наступний код: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) він закінчується приблизно за 1 хвилину. Якщо я треную свою модель, використовуючи метод …

2
Лінійна регресія з несиметричною функцією витрат?
Y( х )Y(x)Y(x)Y^( х )Y^(x)\hat Y(x)Y( х )Y(x)Y(x)cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}\text{cost}\left\{ Y(x) \gtrsim \hat Y(x) \right\} >> \text{cost}\left\{ \hat Y(x) \gtrsim Y(x) \right\} Я думаю, що проста лінійна регресія повинна зробити абсолютно чудово. Тож я дещо знаю, як це реалізувати вручну, але, мабуть, я не перший із подібними проблемами. Чи є там якісь …

1
У чому різниця між генерацією та вилученням функцій?
Хтось може мені сказати, яка мета генерування функцій? і навіщо потрібне збагачення простору функцій перед класифікацією зображення? Це необхідний крок? Чи є який-небудь спосіб збагатити простір функцій?

2
Візуалізація тренувань з глибокої нейромережі
Я намагаюся знайти еквівалент діаграм Хінтона для багатошарових мереж, щоб скласти графік ваг під час тренувань. Навчена мережа дещо схожа на Deep SRN, тобто вона має велику кількість матриць з декількома вагами, що зробить одночасний графік декількох діаграм Хінтона візуально заплутаним. Хтось знає про хороший спосіб візуалізації процесу оновлення ваги …

2
Які функції, як правило, використовуються з дерев Парсера в процесі класифікації в NLP?
Я вивчаю різні типи структур дерев розбору. Дві широко відомі структури дерев розбору: a) Дерево розбору, засноване на окружності, і b) Деревові структури розбору на основі залежності. Я можу використовувати генерувати обидва типи структур дерева розбору за допомогою пакету Stanford NLP. Однак я не впевнений, як використовувати ці структури дерев …

4
Вивчення алгоритмів машинного навчання: глибина розуміння та кількість алгоритмів
Нещодавно мене познайомили з галуззю наукових даних (минуло 6 місяців), і Ii розпочав подорож з курсу машинного навчання Ендрю Нґ та посадою, яка почала працювати над спеціалізацією JHU з наукових даних. На практичній практиці я працював над створенням прогностичної моделі, яка б передбачала погіршення. Поки я використовував glm, bayesglm, rf, …

5
Чому додавання шару відсіву покращує ефективність глибокого / машинного навчання, враховуючи, що випадання пригнічує деякі нейрони з моделі?
Якщо видалення деяких нейронів призводить до більш ефективної моделі, чому б не використати в першу чергу більш просту нейронну мережу з меншими шарами і меншою кількістю нейронів? Навіщо будувати більшу, більш складну модель на початку і придушувати її частини згодом?

1
Чим відрізняється одне гаряче кодування від одного кодування?
Я читаю презентацію, і вона рекомендує не використовувати кодування не залишати, але це добре з одним гарячим кодуванням. Я думав, що вони обоє однакові. Чи може хтось описати, у чому полягають відмінності між ними?

3
Як вибрати класифікатор після перехресної перевірки?
Коли ми робимо k-кратну перехресну перевірку, чи слід просто використовувати класифікатор, який має найвищу точність тесту? Який, як правило, найкращий підхід для отримання класифікатора від перехресної перевірки?

4
Чи можемо ми скористатися використанням трансферного навчання під час навчання моделей word2vec?
Я шукаю заздалегідь підготовлену вагу вже навчених моделей, таких як дані Google News тощо. Мені було важко навчити нову модель з достатньою кількістю даних (10 Гб тощо) для себе. Отже, я хочу скористатись трансферним навчанням, в якому я міг би отримати попередньо підготовлену вагу шару та перевчити ці ваги на …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.