Статистика та великі дані neural-networks

4

Я переглядав документи про згортку keras і знайшов два типи конвультури Conv1D і Conv2D. Я здійснив деякий пошук в Інтернеті, і це те, що я розумію про Conv1D та Conv2D; Conv1D використовується для послідовностей, а Conv2D - для зображень. Я завжди думав, що звивисті нервові мережі використовуються лише для зображень …

19 machine-learning neural-networks conv-neural-network keras

3

Знакові (іграшкові) моделі нейронних мереж

Мої професори фізики в середній школі, а також благородний лауреат Фейнман завжди представляли те, що вони називали іграшковими моделями, щоб проілюструвати основні поняття та методи фізики, такі як гармонійний генератор, маятник, прядильна поверхня та чорний ящик. Які моделі іграшок використовуються для ілюстрації основних понять та методів, що лежать в основі …

18 machine-learning neural-networks deep-learning

3

що робить нейронні мережі нелінійною моделлю класифікації?

Я намагаюся зрозуміти математичний зміст нелінійних моделей класифікації: Я щойно прочитав статтю, яка розповідає про нейронні мережі як нелінійну модель класифікації. Але я просто розумію, що: Перший шар: h1=x1∗wx1h1+x2∗wx1h2h1=x1∗wx1h1+x2∗wx1h2h_1=x_1∗w_{x1h1}+x_2∗w_{x1h2} h2=x1∗wx2h1+x2∗wx2h2h2=x1∗wx2h1+x2∗wx2h2h_2=x_1∗w_{x2h1}+x_2∗w_{x2h2} Наступний шар y=b∗wby+h1∗wh1y+h2∗wh2yy=b∗wby+h1∗wh1y+h2∗wh2уy=b∗w_{by}+h_1∗w_{h1y}+h_2∗w_{h2y} Можна спростити до =b'+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x1∗wx1h1+x2∗wx1h2)∗wh1y+(x1∗wx2h1+x2∗wx2h2)∗wh2y=b′+(x_1∗w_{x1h1}+x_2∗w_{x1h2})∗w_{h1y}+(x_1∗w_{x2h1}+x_2∗w_{x2h2})∗w_{h2y} =b'+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x1(wh1y∗wx1h1+wx2h1∗wh2y)+x2(wh1y∗wx1h1+wx2h2∗wh2y)=b′+x_1(w_{h1y}∗w_{x1h1}+w_{x2h1}∗w_{h2y})+x_2(w_{h1y}∗w_{x1h1}+w_{x2h2}∗w_{h2y}) Двошарова нейромережа - це просто проста лінійна регресія =b′+x1∗W′1+x2∗W′2=b′+x1∗W1′+x2∗W2'=b^′+x_1∗W_1^′+x_2∗W_2^′ Це можна показати …

18 neural-networks nonlinear-regression nonlinear

2

Чи використовуються методи пошуку ліній в глибокому навчанні? Чому ні?

Багато навчальних посібників в Інтернеті говорять про спуск градієнта, і майже всі вони використовують фіксований розмір кроку (швидкість навчання ). Чому не застосовується пошук рядків (наприклад, пошук зворотного відстеження чи точний пошук рядків)?αα\alpha

18 machine-learning neural-networks optimization deep-learning

3

Як розмір партії впливає на конвергенцію SGD і чому?

Я бачив подібний висновок з багатьох дискусій, що в міру збільшення розміру міні-партії збіжність SGD насправді стає важчим / гіршим, наприклад, цей документ і ця відповідь . Також я чув, що люди на ранніх етапах використовують такі хитрощі, як невеликі темпи навчання або розмір партії, щоб вирішити цю складність при …

18 machine-learning neural-networks optimization gradient-descent sgd

2

Чи слід брати зразки тренувань випадковим чином для міні-пакетних навчальних нейронних мереж без заміни?

Ми визначаємо епоху як пройшла всю сукупність усіх доступних навчальних зразків, а розмір міні-партії - кількість зразків, за яку ми в середньому знаходимо оновлення ваг / зміщення, необхідних для спуску градієнта. Моє запитання - чи слід ми не замінювати з набору навчальних прикладів, щоб генерувати кожну міні-серію в епоху. Я …

18 machine-learning neural-networks optimization deep-learning

4

Про CNN, ядра та інваріантність масштабу / обертання

У мене є пара питань, які мене бентежать стосовно CNN. 1) Особливості, отримані за допомогою CNN, - інваріантність масштабу та обертання? 2) Ядра, які ми використовуємо для згортання з нашими даними, вже визначені в літературі? що це за ядра? це різне для кожної програми?

18 neural-networks deep-learning conv-neural-network

1

Тест: Повідомте класифікатора за його межею рішення

Нижче наведено 6 меж рішення. Межі рішення - фіолетові лінії. Точки та хрестики - це два різних набори даних. Ми повинні вирішити, який з них: Лінійний SVM Кернелізоване SVM (Поліномне ядро порядку 2) Перцепрон Логістична регресія Нейронна мережа (1 прихований шар з 10 випрямленими лінійними одиницями) Нейронна мережа (1 прихований …

17 machine-learning self-study classification neural-networks svm

4

Як пояснити регуляризацію випадання простими словами?

Якщо у вас є півсторінки, щоб пояснити випадання , як би ви діяли? Яке обґрунтування лежить в основі цієї методики?

17 neural-networks deep-learning regularization dropout

2

Що таке інтуїтивне пояснення мереж Echo State?

Я новачок у періодичних нейронних мережах (RNN) і все ще вивчаю ці концепції. На абстрактному рівні я розумію, що мережа Echo State (ESN) здатна (повторно) виробляти послідовність входів, тобто сигнал, навіть після видалення входу. Однак, мені здалося, що стаття про Академію занадто складна, щоб зрозуміти та зрозуміти її повністю. Може …

17 neural-networks

1

Чи відповідає значення R-квадрата для порівняння моделей?

Я намагаюся визначити найкращу модель для прогнозування цін на автомобілі, використовуючи ціни та можливості, доступні на сайтах рекламних оголошень для автомобілів. Для цього я використав пару моделей з бібліотеки scikit-learn та моделей нейронної мережі з пібраїну та нейролаб. Я використовував поки що підхід - це запустити фіксовану кількість даних через …

17 machine-learning neural-networks random-forest r-squared elastic-net

4

Що означає "ступінь свободи" в нейронних мережах?

У книзі Бішопа «Класифікація візерунків та машинне навчання» він описує техніку регуляризації в контексті нейронних мереж. Однак я не розумію абзац, що описує, що під час тренувального процесу кількість ступенів свободи збільшується разом зі складністю моделі. Відповідна цитата: Альтернативою регуляризації як способу контролю ефективної складності мережі є процедура раннього припинення. …

17 machine-learning neural-networks regularization degrees-of-freedom

3

Використання нейронної мережі для торгівлі на біржі

Я пірнув у поле нейронних мереж і захопився ними. Нарешті я розробив прикладну систему для тестування торговельних систем на біржах, і тепер я збираюся реалізувати свою першу нейронну мережу в ній. Дуже простий і примітивний, не призначений для реальної торгівлі, а лише для початківців. Я хочу лише знати, чи хороший …

17 machine-learning neural-networks

3

Різниця між зразками, часовими кроками та особливостями нейронної мережі

Я переглядаю такий блог у нейронній мережі LSTM: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ Автор переробляє вхідний вектор X як [зразки, часові кроки, особливості] для різної конфігурації LSTM. Автор пише Дійсно, послідовності літер є часовими кроками однієї ознаки, а не одним часовим кроком окремих ознак. Ми надали більше контексту для мережі, але не більше послідовності, …

17 neural-networks lstm rnn tensorflow tensor

3

Для чого потрібні автокодери?

Останнім часом я вивчаю автокодери. Якщо я правильно зрозумів, автокодер - це нейронна мережа, де вхідний шар ідентичний вихідному шару. Отже, нейронна мережа намагається передбачити вихід, використовуючи вхід як золотий стандарт. У чому корисність цієї моделі? Які переваги намагаються відновити деякі вихідні елементи, зробивши їх максимально рівними вхідним елементам? Чому …

17 neural-networks autoencoders

Запитання з тегом «neural-networks»