Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

1
Дистанційний нагляд: під наглядом, напівнаглядачем чи обома?
"Дистанційний нагляд" - це схема навчання, за якою класифікатор вивчається, на якому навчається набір слабких міток (дані тренувань автоматично позначаються на основі евристики / правил). Я думаю, що як навчання під наглядом, так і напівконтрольне навчання можуть включати такий "дистанційний нагляд", якщо їхні мічені дані євристично / автоматично позначені. Однак …

1
Дискусія про перевитрату в xgboost
Моя настройка така: Я дотримуюся вказівок у "Прикладному прогнозуванні". Таким чином, я відфільтрував відповідні функції та закінчив таке: 4900 балів даних у навчальному наборі та 1600 точок даних у тестовому наборі. У мене є 26 функцій, а ціль - це суцільна змінна. Я застосовую 5-кратну перехресну перевірку для тренування моделей …

1
Як працює негативна вибірка у word2vec?
Я дуже намагався зрозуміти поняття негативної вибірки в контексті word2vec. Я не в змозі перетравити ідею [негативної] вибірки. Наприклад, у роботах Міколова негативне очікування вибірки сформульовано як logσ(⟨w,c⟩)+k⋅EcN∼PD[logσ(−⟨w,cN⟩)].log⁡σ(⟨w,c⟩)+k⋅EcN∼PD[log⁡σ(−⟨w,cN⟩)].\log \sigma(\langle w,c\rangle ) + k \cdot \mathbb E_{c_N\sim PD}[\log\sigma(−\langle w,c_N\rangle)]. Я розумію лівий термін , але не можу зрозуміти ідею вибірки негативних …

3
Чи є пень рішення лінійною моделлю?
Пень рішення - дерево рішень, що має лише один розкол. Він також може бути записаний як кусочно функція. Наприклад, припустимо, що - вектор, а - перший компонент , в регресійному режимі деякий пень рішення може бутих 1 ххxxх1x1x_1хxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 \\ 5 & x_1 > 2 \\ …

5
Які хороші набори даних для вивчення основних алгоритмів машинного навчання та чому?
Я новачок у машинному навчанні та шукаю деякі набори даних, за допомогою яких я можу порівнювати та протиставляти відмінності між різними алгоритмами машинного навчання (Дерева рішень, Підвищення, SVM та Нейронні мережі) Де я можу знайти такі набори даних? Що я повинен шукати під час розгляду набору даних? Було б чудово, …

2
Підвищення: чому ступінь навчання називається параметром регуляризації?
Параметр швидкості навчання ( ) у Gradient Boosting скорочує внесок кожної нової базової моделі - типово неглибокого дерева -, яка додається у серії. Було показано, що різко підвищити точність тестового набору, що зрозуміло, оскільки при менших кроках мінімум функції втрат можна досягти більш точно. ν∈ [ 0 , 1 ]ν∈[0,1]\nu …

2
Як можна повторно використовувати нейромережі для класифікації послідовностей?
RNN може бути використаний для прогнозування або відображення послідовності послідовностей. Але як RNN можна використовувати для класифікації? Я маю на увазі, ми даємо цілій послідовності одну мітку.

2
Що означає назва "Логістична регресія"?
Я перевіряю реалізацію логістичної регресії звідси . Після того, як я прочитав цю статтю, здається, що важливою частиною є пошук найкращих коефіцієнтів для визначення сигмоподібної функції. Тож мені просто цікаво, чому цей метод називається "Логістична регресія". Це пов’язано з логарифмічною функцією? Можливо, мені потрібна інформація про історичну інформацію, щоб краще …

6
Програміст, який хоче прорватися до машинного навчання
Я розробник програмного забезпечення (в основному .NET і Python близько 5 років досвіду). Що я можу зробити, щоб допомогти мені влаштуватися на роботу в галузі машинного навчання або насправді все, що змусить мене почати працювати в цій галузі? Чи є серйозною вимогою аспірантура?

1
Передбачувальне моделювання - чи варто дбати про змішане моделювання?
Для прогнозного моделювання нам потрібно ставитись до таких статистичних понять, як випадкові ефекти та незалежність спостережень (повторні заходи)? Наприклад.... У мене є дані з 5 кампаній прямої пошти (які відбувалися протягом року) з різними атрибутами та прапором для покупки. В ідеалі я використовував би всі ці дані в поєднанні для …


2
Коли сьогодні має значення "Найближчий сусід"?
У 1999 р. Beyer et al. запитав, коли має значення "Найближчий сусід"? Чи є кращі способи аналізу та візуалізації ефекту площини відстані на пошук NN з 1999 року? Чи дає [даний] набір даних змістовні відповіді на проблему 1-NN? Проблема 10-NN? Проблема 100 NN? Як би Ви сьогодні підходили до цього …

6
Яка «основна» ідея машинного навчання для оцінки параметрів?
"Основна" ідея статистики для оцінки параметрів - максимальна ймовірність . Мені цікаво, яка відповідна ідея в машинному навчанні. Qn 1. Було б справедливо сказати, що "фундаментальною" ідеєю в машинному навчанні для оцінки параметрів є: "Функції втрати" [Примітка. Мені здається, що алгоритми машинного навчання часто оптимізують функцію втрат і, отже, вищезазначене …

6
Чи настроювання гіперпараметра на вибірці набору даних є поганою ідеєю?
У мене є набір даних 140000 прикладів і 30 функцій, для яких я навчаю декілька класифікаторів для двійкової класифікації (SVM, Logistic Regression, Random Forest тощо) У багатьох випадках налаштування гіперпараметрів у всьому наборі даних за допомогою Grid або Random пошуку занадто дорого за часом. Я почав використовувати наступну техніку Sub …

11
Чому логістичну регресію називають алгоритмом машинного навчання?
Якщо я правильно зрозумів, в алгоритмі машинного навчання модель має вчитися на своєму досвіді, тобто коли модель дає неправильний прогноз для нових випадків, вона повинна адаптуватися до нових спостережень, і з часом модель стає все кращою . Я не бачу, щоб логістична регресія мала цю характеристику. То чому це все …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.