Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

1
Чи я просто винайшов байєсівський метод аналізу кривих ROC?
Преамбула Це довгий пост. Якщо ви перечитуєте це, зауважте, що я переглянув частину питання, хоча довідковий матеріал залишається тим самим. Крім того, я вважаю, що я розробив рішення проблеми. Це рішення з’являється внизу публікації. Дякую CliffAB, що вказав, що моє оригінальне рішення (відредаговане з цієї публікації; див. Історію редагування для …

2
Методи збільшення даних для загальних наборів даних?
У багатьох програмах машинного навчання так звані методи збільшення даних дозволили створити кращі моделі. Наприклад, припустимо навчальний набір із зображень котів та собак. Обертанням, дзеркальним відображенням, регулюванням контрасту тощо можна створити додаткові зображення з оригінальних.100100100 Що стосується зображень, то доповнення даних є відносно простим. Однак припустимо (наприклад), що у кожного …

3
Що відбувається, коли ви застосуєте SVD до проблеми спільної фільтрації? Яка різниця між ними?
У процесі спільної фільтрації у нас є значення, які не заповнені. Припустимо, користувач не переглянув фільм, тоді ми мусимо поставити "na" туди. Якщо я збираюсь взяти SVD цієї матриці, тоді мені потрібно ввести якесь число - скажімо 0. Тепер, якщо я розбиваю на матрицю, у мене є спосіб знайти подібних …

3
Перший крок для великих даних (
Припустимо, ви аналізуєте величезний набір даних у розмірі мільярдів спостережень на день, де кожне спостереження має кілька тисяч розріджених та, можливо, зайвих числових та категоріальних змінних. Скажімо, є одна проблема регресії, одна незбалансована проблема бінарної класифікації та одне завдання "з'ясувати, які прогнози є найважливішими". Моя думка, як підійти до проблеми: …

2
Порівняння кластеризації: Індекс Rand та Варіації інформації
Мені було цікаво, чи хтось мав уявлення чи інтуїцію за різницею між варіацією інформації та індексом Rand для порівняння кластерів. Я прочитала документ " Порівняння кластерів - відстань, заснована на інформації " Марини Меліа (Journal of Multivariate Analysis, 2007), але, окрім зауваження різниці у визначеннях, я не розумію, що це …

4
Наскільки різниця між кореляцією та причинним зв’язком стосується Google?
Контекст Популярне питання на цьому веб-сайті " Що таке загальні статистичні гріхи? ". Один з гріхів згадувалося за умови , що «кореляція має на увазі причинно - наслідковий зв'язок ...» посилання Потім, у коментарях із 5 опублікованими повідомленнями, пропонується: "Google заробляє $ 65 млрд на рік, не піклуючись про різницю". …

4
Чи є дерева рішень майже завжди бінарними деревами?
Майже кожен приклад дерева, який я зустрічав, є двійковим деревом. Це досить універсально? Чи підтримують більшість стандартних алгоритмів (C4.5, CART тощо) лише бінарні дерева? З того, що я збираю, CHAID не обмежується двійковими деревами, але це, здається, є винятком. Двосторонній розкол з наступним двостороннім розщепленням на одного з дітей - …

2
Перехресне підтвердження (узагальнення помилок) після вибору моделі
Примітка: Справа n >> p Я читаю «Елементи статистичного навчання» і є різні згадки про «правильний» спосіб перехресної перевірки (наприклад, сторінка 60, стор. 245). Зокрема, моє запитання полягає в тому, як оцінити кінцеву модель (без окремого тестового набору) за допомогою CV-кратного реєстру чи завантажувального завантаження, коли відбувся пошук моделі? Здається, …

2
Як вибрати між алгоритмами навчання
Мені потрібно реалізувати програму, яка класифікує записи на 2 категорії (правда / хибність) на основі деяких навчальних даних, і мені було цікаво, на який алгоритм / методологію я повинен дивитись. Здається, що їх вибирати дуже багато - штучна нейронна мережа, генетичний алгоритм, машинне навчання, байєсова оптимізація тощо тощо, і я …

1
Чи слід приймати рішення на основі мікро-усереднених або макросередніх оціночних заходів?
Я здійснив десятикратну перехресну перевірку за різними алгоритмами бінарної класифікації, з тим самим набором даних, і отримав як усереднені результати мікро- та макросів. Слід зазначити, що це була класифікаційна проблема з різними марками. У моєму випадку справжні негативи та справжні позитиви зважуються однаково. Це означає, що правильно прогнозувати справжні негативи …

1
Якою функцією може бути ядро?
У контексті машинного навчання та розпізнавання шаблонів існує концепція під назвою хитрість ядра . Зіткнувшись із проблемами, коли мене просять визначити, чи може функція бути функцією ядра чи ні, що саме потрібно робити? Чи варто спочатку перевірити, чи вони мають форму трьох-чотирьох функцій ядра, таких як поліном, RBF та Гауссан? …

3
Втрати в навчанні збільшуються з часом [дублікат]
На це питання вже є відповіді : Як зміни у вартості можуть бути позитивними? (1 відповідь) Що робити, коли моя нервова мережа не навчається? (5 відповідей) Закрито минулого місяця . Я треную модель (періодична нейронна мережа) для класифікації 4 типів послідовностей. Коли я проходжу тренування, я бачу, що втрата тренувань …

4
Як дізнатися, чи є дані лінійно відокремленими?
Дані мають багато можливостей (наприклад, 100), а кількість екземплярів становить приблизно 100 000. Дані рідкі. Я хочу підходити до даних за допомогою логістичної регресії або svm. Як дізнатися, чи є функції лінійними чи нелінійними, щоб я міг використовувати хитрість ядра, якщо нелінійний?

1
Різниця між моделями прихованого Маркова та фільтром частинок (і фільтром Кальмана)
Ось моє старе питання Я хотів би запитати, чи знає хтось різницю (якщо є якась різниця) між прихованими моделями Маркова (HMM) і фільтром частинок (PF), і як наслідок, фільтром Kalman, або за яких обставин ми використовуємо який алгоритм. Я студент, і я повинен робити проект, але спочатку я повинен зрозуміти …

2
Які переваги використання ReLU над softplus як функції активації?
Часто згадується, що випрямлені лінійні одиниці (ReLU) витіснили одиниці softplus, оскільки вони лінійні та швидші для обчислення. Чи є у softplus все-таки перевага, що викликає розрідженість, або це обмежено для ReLU? Причина, яку я запитую, це те, що я цікавлюсь негативними наслідками нульового схилу ReLU. Хіба ця властивість не «захоплює» …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.