Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

6
Які основні теореми машинного (глибокого) навчання?
Нещодавно Аль-Рахімі виступив із дуже провокаційною розмовою в NIPS 2017, порівнюючи сучасне машинне навчання з алхімією. Одне з його тверджень полягає в тому, що нам потрібно повернутися до теоретичних розробок, мати прості теореми, що підтверджують основоположні результати. Коли він це сказав, я почав шукати основні теореми для ML, але не …

2
Лінійне ядро ​​та нелінійне ядро ​​для підтримуючої векторної машини?
Використовуючи векторну машину підтримки, чи є якісь вказівки щодо вибору лінійного ядра проти нелінійного ядра, наприклад, RBF? Я колись чув, що нелінійне ядро, як правило, не працює добре, коли кількість функцій велика. Чи є посилання на це питання?

8
Чи всі моделі марні? Чи можлива якась точна модель - чи корисна?
Це питання гнається в моїй свідомості вже більше місяця. Випуск Amstat News за лютий 2015 року містить статтю професора Берклі Марка ван дер Лаана, яка лаять людей за використання неточних моделей. Він заявляє, що, використовуючи моделі, статистика - це мистецтво, а не наука. За його словами, завжди можна використовувати "точну …

4
Як ядра застосовуються до карт функцій для створення інших карт функцій?
Я намагаюся зрозуміти складову частину згорткових нейронних мереж. Дивлячись на таку цифру: У мене немає проблем з розумінням першого шару згортки, де у нас є 4 різних ядра (розміром ), які ми переплітаємо з вхідним зображенням, щоб отримати 4 карти карт.k × kk×kk \times k Що я не розумію, це …

6
Чому мультиколінеарність не перевіряється в сучасній статистиці / машинному навчанні
У традиційній статистиці, будуючи модель, ми перевіряємо наявність мультиколінеарності за допомогою таких методів, як оцінки коефіцієнта дисперсії дисперсії (VIF), але в машинному навчанні ми замість цього використовуємо регуляризацію для вибору особливостей і, здається, не перевіряємо, чи співвідносяться функції зовсім. Чому ми це робимо?

13
Чи може машинне навчання розшифрувати хеші SHA256?
У мене 64 хеш-символів SHA256. Я сподіваюся підготувати модель, яка може передбачити, починається чистий текст, що використовується для створення хешу, з 1 чи ні. Незалежно, якщо це "Можливо", який алгоритм був би найкращим підходом? Мої початкові думки: Створіть великий зразок хешей, який починається з 1, і великий зразок хешей, який …

3
Розуміння ролі коефіцієнта знижок у зміцненні навчання
Я вчу себе про навчання підкріпленням і намагаюся зрозуміти поняття винагороди зі знижкою. Отже, нагорода необхідна, щоб сказати системі, які пари "держава-дія" є хорошими, а які - поганими. Але я не розумію, чому необхідна винагорода зі знижкою. Чому має значення, чи буде досягнутий хороший стан швидше, ніж пізніше? Я розумію, …

2
Що таке максимум в нейронній мережі?
Хтось може пояснити, що роблять одиниці максимуму в нейронній мережі? Як вони виконують і чим вони відрізняються від звичайних одиниць? Я намагався прочитати документ "Максимальна мережа" 2013 року Goodfellow et al. (від групи професора Йошуа Бенджо), але я не дуже розумію.

5
Невже машинне навчання менш корисне для розуміння причинності, таким чином, менш цікавим для суспільних наук?
Я розумію різницю між машинним навчанням / іншими методами статистичного прогнозування та типом статистики, яку використовують вчені-соціологи (наприклад, економісти) в тому, що економісти, схоже, дуже зацікавлені в розумінні ефекту однієї чи кількох змінних - і з точки зору величини та виявлення, чи є зв’язок причинним. Для цього ви закінчуєте експериментальні …

6
Чому саме вибірка?
Припустимо, я хочу вивчити класифікатор, який передбачає, чи електронний лист є спамом. І припустимо, що лише 1% електронних листів - це спам. Найпростіше зробити це - дізнатися тривіальний класифікатор, який говорить, що жоден з електронних листів не є спамом. Цей класифікатор дав би нам 99% точності, але він не дізнався …

2
Pandas / Statsmodel / Scikit-learn
Чи різні програми Pandas, Statsmodels та Scikit вчаться в машинному навчанні / статистичних операціях, або вони доповнюють одна одну? Який із них має найповніший функціонал? Який із них активно розробляється та / або підтримується? Я маю здійснити логістичну регресію. Будь-які пропозиції щодо того, який із них я повинен використовувати?

5
Практична оптимізація гіперпараметрів: пошук випадкових та сіткових
Зараз я переживаю випадковий пошук Bengio та Bergsta для оптимізації гіперпараметрів [1], де автори стверджують, що випадковий пошук є більш ефективним, ніж пошук в сітці, щоб досягти приблизно однакової продуктивності. Моє запитання: Чи згодні люди з цим твердженням? У своїй роботі я використовував пошук в сітці здебільшого через відсутність інструментів, …

1
Як інтерпретувати заходи помилок?
Я запускаю класифікацію у Weka для певного набору даних, і я помітив, що якщо я намагаюся передбачити номінальне значення, то вихід конкретно показує правильно та неправильно прогнозовані значення. Однак тепер я запускаю його для числового атрибута, а вихід: Correlation coefficient 0.3305 Mean absolute error 11.6268 Root mean squared error 46.8547 …

1
Чим softmax_cross_entropy_with_logits відрізняється від softmax_cross_entropy_with_logits_v2?
Зокрема, я думаю, мені цікаво таке твердження: Майбутні основні версії TensorFlow дозволять градієнтам потрапляти в мітки, що вводяться на задній панелі, за замовчуванням. Що відображається при використанні tf.nn.softmax_cross_entropy_with_logits. У цьому ж повідомленні він закликає мене подивитися tf.nn.softmax_cross_entropy_with_logits_v2. Я переглянув документацію, але в ній вказано лише, що для tf.nn.softmax_cross_entropy_with_logits_v2: Зворотне розповсюдження …

4
Нагадаємо та точність у класифікації
Я читаю деякі визначення відкликання та точності, хоча це щоразу в контексті пошуку інформації. Мені було цікаво, чи може хтось пояснити це трохи більше в контексті класифікації та, можливо, проілюструвати деякі приклади. Скажімо, наприклад, у мене є двійковий класифікатор, який дає мені точність 60% і відкликання 95%, це хороший класифікатор? …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.