Статистика та великі дані machine-learning

2

Найкращі методи вибору ознак для непараметричної регресії

Тут питання новачків. В даний час я виконую непараметричну регресію, використовуючи пакет np в Р. У мене є 7 особливостей і за допомогою підходу грубої сили я визначив найкращий 3. Але незабаром у мене буде набагато більше 7 функцій! Моє питання - які найкращі в даний час методи вибору особливостей …

10 r machine-learning nonparametric feature-selection

1

Задокументовані / відтворювані приклади успішних реальних застосувань економетричних методів?

Це питання може звучати дуже широко, але ось що я шукаю. Я знаю, що існує багато чудових книг про економетричні методи, і багато чудових статей про економетричні методи. Існують навіть відмінні відтворювані приклади економетрики, як описано в цьому перекладеному питанні . Насправді приклади в цьому питанні дуже близькі до того, …

10 r machine-learning forecasting data-mining econometrics

4

Побудова інтерфейсів MATLAB і R для C5.0 Ross Quinlan

Я розглядаю побудова інтерфейсів MATLAB і R для Ross Куінланом «s C5.0 (для тих , хто не знайомий з ним, C5.0 є алгоритм дерева рішень і пакет програмного забезпечення, розширення C4.5 ), і я намагаюся зрозуміти компоненти, які мені потрібно було б написати. Єдина документація, яку я знайшов для C5.0, …

10 r machine-learning matlab

1

Чи мають стохастичні процеси, такі як процес Гаусса / Діріхле, щільність? Якщо ні, як можна застосувати правило Байєса до них?

Процес Поріса і Гаусса Діріхле часто називають "розподілами по функціях" або "розподілами над розподілами". У цьому випадку я можу змістовно говорити про щільність функції під GP? Тобто, чи мають процес Гаусса чи Діріхле певне поняття щільності ймовірності? Якщо це не так, як ми можемо використовувати правило Байєса переходити до переднього, …

10 machine-learning probability bayesian nonparametric nonparametric-bayes

3

регресія гауссових процесів для великих наборів даних

Я дізнався про регресію процесу Гаусса з онлайн-відео та конспектів лекцій. Я розумію, що якщо у нас є набір даних з точок, то ми припускаємо, що дані вибираються з -вимірного багатовимірного гаусса. Так що моє запитання в тому випадку , коли є 10 - х мільйонів робить гауссовский процес регресії …

10 machine-learning probability inference gaussian-process multivariate-regression

2

Призначення шуму Діріхле в роботі AlphaZero

У документах AlphaGo Zero та AlphaZero DeepMind вони описують додавання шуму Діріхле до попередніх імовірностей дій з кореневого вузла (стан плати) в дереві Монте-Карло: Додаткова розвідка досягається додаванням шуму Діріхле до попередніх ймовірностей у кореневому вузлі с0s0s_0конкретно П( s , a ) = ( 1 - ε )pа+ εηаП(с,а)=(1-ε)pа+εηаP(s, a) …

10 machine-learning neural-networks dirichlet-distribution

1

Чому випадкові риси Фур’є є негативними?

Випадкові функції Фур'є забезпечують наближення до функцій ядра. Вони використовуються для різних методів ядра, таких як SVM та процеси Гаусса. Сьогодні я спробував використовувати реалізацію TensorFlow, і я отримав від’ємні значення для половини моїх функцій. Як я розумію, цього не повинно статися. Тож я повернувся до оригінального документу , який …

10 machine-learning kernel-smoothing feature-construction tensorflow fourier-transform

1

Як SVM = шаблон відповідає?

Я прочитав про SVM та дізнався, що вони вирішують оптимізаційну задачу та ідея максимальної маржі була дуже розумною. Тепер, використовуючи ядра, вони можуть знайти навіть нелінійні межі поділу, що було чудово. Поки я справді не маю уявлення, як SVM (спеціальна машина ядра) та машини ядра пов'язані з нейронними мережами? Розгляньте …

10 machine-learning neural-networks svm deep-learning kernel-trick

1

Комплексний аналіз, функціональний аналіз для глибшого розуміння машинного навчання

Я хочу заглибитися в машинне навчання (теорія та застосування у фінансах). Хочу запитати, наскільки релевантні комплексний аналіз та функціональний аналіз як основа машинного навчання? Чи потрібно мені вивчати ці предмети чи слід зосередитись на іншій темі (якщо так, то на якій?)

10 machine-learning pac-learning

1

Як обчислити з зразка R квадрат?

Я знаю, що це, ймовірно, обговорювалося десь ще, але я не змогла знайти чіткої відповіді. Я намагаюся використовувати формулуR2=1−SSR/SSTR2=1−SSR/SSTR^2 = 1 - SSR/SST для розрахунку поза вибіркою R2R2R^2 лінійної регресійної моделі, де SSRSSRSSR - сума квадратних залишків і SSTSSTSST- загальна сума квадратів. Для навчального набору зрозуміло, що SST=Σ(y−y¯train)2SST=Σ(y−y¯train)2 SST = …

10 regression machine-learning r-squared out-of-sample

4

Чому потрібен спуск градієнта?

Коли ми можемо диференціювати функцію витрат і знайти параметри, розв’язавши рівняння, отримані шляхом часткової диференціації стосовно кожного параметра, і з'ясувати, де функція витрат мінімальна. Крім того, я думаю, що можливо знайти декілька місць, де похідні дорівнюють нулю, таким чином ми можемо перевірити всі такі місця і можемо знайти глобальні мінімуми …

10 machine-learning computational-statistics

1

Скільки даних для глибокого навчання?

Я дізнаюся про глибоке навчання (зокрема, CNN), а також про те, як зазвичай вимагає дуже багато даних для запобігання надмірного розміщення. Однак мені також сказали, що чим більша ємність / більше параметрів має модель, тим більше даних потрібно для запобігання надмірного розміщення. Тому моє запитання: чому ви можете не просто …

10 machine-learning neural-networks deep-learning conv-neural-network

1

Чи є програми, де SVM все ще перевершує?

Алгоритм SVM досить старий - він був розроблений у 1960-х, але був надзвичайно популярним у 1990-х та 2000-х роках. Це класична (і досить гарна) частина курсів машинного навчання. Сьогодні здається, що в обробці медіа (зображення, звук тощо) нейронні мережі повністю домінують, тоді як в інших сферах Gradient Boosting займає дуже …

10 machine-learning svm

1

Похідне від поперечної втрати ентропії у word2vec

Я намагаюся пропрацювати свій шлях через перший набір проблем навчального матеріалу онлайн-класу cs224d в Інтернеті, і у мене виникають проблеми з проблемою 3A: При використанні пропуску грамової моделі word2vec з функцією прогнозування softmax і функцією перехресної ентропії втрати ми хочемо обчислити градієнти відносно прогнозованих векторів слів. Отже, враховуючи функцію softmax: …

10 machine-learning self-study word2vec

2

Що таке букетизація?

Я ходив довкола, щоб знайти чітке пояснення "букетизації" в машинному навчанні без удачі. Що я розумію поки що, букетизація схожа на квантування в цифровій обробці сигналів, коли діапазон нескінченних значень замінюється одним дискретним значенням. Це правильно? Які плюси і мінуси (крім очевидного впливу втрати інформації) застосування букетізації? Чи є якісь …

10 machine-learning dataset data-preprocessing

Запитання з тегом «machine-learning»