Запитання з тегом «machine-learning»

Для питань, пов’язаних з машинним навчанням (ML), що представляє собою набір методів, які можуть автоматично виявляти шаблони даних, а потім використовувати непокриті шаблони для прогнозування майбутніх даних або виконувати інші види прийняття рішень у невизначеності (наприклад, планувати, як щоб зібрати більше даних). Зазвичай ML розбиваються на навчання під наглядом, без нагляду та посилення. Глибоке навчання - це підполе ML, яке використовує глибокі штучні нейронні мережі.

17
Чим відрізняється штучний інтелект від машинного навчання?
Ці два терміни, здається, пов'язані між собою, особливо в їх застосуванні в галузі інформатики та інженерії програмного забезпечення. Чи є одна підмножина іншої? Чи використовується один інструмент для побудови системи для іншого? Які їх відмінності і чому вони значні?

8
Чому Python є такою популярною мовою в галузі AI?
Перш за все, я початківець, що вивчає AI, і це не питання, орієнтоване на думку, чи порівняння мов програмування. Я не кажу, що це найкраща мова. Але факт полягає в тому, що більшість відомих фреймворків AI мають первинну підтримку Python. Вони навіть можуть підтримуватися багатомовними, наприклад, TensorFlow, що підтримують Python, …

3
Як нейронні мережі можуть мати справу з різними розмірами входу?
Наскільки я можу сказати, нейронні мережі мають фіксовану кількість нейронів у вхідному шарі. Якщо нейронні мережі використовуються в такому контексті, як NLP, пропозиції або блоки тексту різної величини подаються в мережу. Яким чином різний розмір входу узгоджується з фіксованим розміром вхідного шару мережі? Іншими словами, наскільки така мережа робиться достатньо …

4
Чи схильні нейромережі до катастрофічного забування?
Уявіть, що ви показуєте нейронній мережі малюнок лева 100 разів і мітку "небезпечно", тож він дізнається, що леви небезпечні. А тепер уявіть, що раніше ви демонстрували їй мільйони зображень левів та альтернативно позначали їх як "небезпечні" та "не небезпечні", так що ймовірність того, що лев небезпечний, становить 50%. Але останні …

3
Чому Lisp є такою доброю мовою для ШІ?
Раніше я чув від науковців та дослідників в області ШІ, що Лісп - це гарна мова для досліджень та розробок у сфері штучного інтелекту. Чи все-таки це стосується поширення нейронних мереж та глибокого навчання? Що було для цього їх міркуванням? На яких мовах зараз вбудовані сучасні системи глибокого навчання?

4
Як вибрати кількість прихованих шарів і кількість комірок пам'яті в LSTM?
Я намагаюся знайти деякі існуючі дослідження щодо того, як вибрати кількість прихованих шарів та розмір цих RNN на основі LSTM. Чи є стаття, де ця проблема досліджується, тобто скільки комірок пам’яті потрібно використовувати? Я припускаю, що це повністю залежить від програми та в якому контексті використовується модель, але що говорить …


2
Чи можна тренувати нейронну мережу поступово?
Я хотів би тренувати нейронну мережу, де вихідні класи не (усі) визначені з самого початку. Пізніше вводиться все більше і більше класів на основі вхідних даних. Це означає, що щоразу, коли я запроваджую новий клас, мені потрібно перевчити НН. Як я можу поетапно тренувати НН, тобто не забуваючи попередньо набуту …


4
Як поводитися з недійсними рухами в навчанні підкріплення?
Я хочу створити AI, який може грати з п’яти в ряд / гомоку. Як я вже згадував у назві, я хочу використовувати для цього підкріплення. Я використовую метод градієнта політики , а саме REINFORCE з базовою лінією. Для наближення значення та політики я використовую нейронну мережу . Він має згорнуті …

7
Якщо цифрові значення - це просто оцінки, то чому б не повернутися до аналогового для AI?
Поштовх до переходу ХХ століття з аналогової на цифрову схему був зумовлений прагненням до більшої точності та зниження шуму. Зараз ми розробляємо програмне забезпечення, де результати приблизні, а шум має позитивне значення. У штучних мережах ми використовуємо градієнти (якобіанські) або моделі другого ступеня (Гессіана) для оцінки наступних кроків у конвергентному …

3
Яка часова складність тренування нейронної мережі за допомогою зворотного розповсюдження?
Припустимо, що NN містить nnn прихованих шарів, mmm прикладів тренувань, xxx функцій та ninin_i вузлів у кожному шарі. Яка складність у часі для підготовки цього NN з використанням зворотного розповсюдження? У мене є основне уявлення про те, як вони знаходять складність часу алгоритмів, але тут є 4 різні фактори, які …

3
Розуміння функції втрат GAN
Я намагаюся зрозуміти функцію втрат GAN, як це передбачено в розумінні генеративних змагальних мереж (повідомлення в блозі, написане Даніелем Сейтою). У стандартній крос-ентропійній втраті у нас є вихід, який пройшов через сигмоподібну функцію та отриману в результаті бінарну класифікацію. Сієта констатує х1х1x_1 Н( ( х1, у1) , Г ) = …

1
Відмінності між методами зворотного розповсюдження
Просто для розваги я намагаюся розвинути нейронну мережу. Тепер для зворотного розмноження я побачив дві техніки. Перший використовується тут і в багатьох інших місцях. Що це робить: Він обчислює помилку для кожного вихідного нейрона. Він підтримує його в мережі (обчислюючи помилку для кожного внутрішнього нейрона). Він оновлює ваги формулою: (де …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.