Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

3
Як моделювати дані, щоб бути статистично значущими?
Я перебуваю в 10 класі і шукаю моделювати дані для проекту ярмарку машинного навчання. Кінцева модель буде використана на даних про пацієнтів і передбачає співвідношення між певним часом тижня та впливом, яке це має на прихильність ліків у межах даних про одного пацієнта. Значення прихильності будуть двійковими (0 означає, що …

7
Об'єктивні дані в машинному навчанні
Я працюю над проектом машинного навчання з даними, які вже (сильно) упереджені підбором даних. Припустимо, у вас є набір жорстко закодованих правил. Як ви будуєте модель машинного навчання для її заміни, коли всі дані, які вона може використовувати, - це дані, які вже відфільтровані за цими правилами? Щоб зрозуміти, я …

3
Знакові (іграшкові) моделі нейронних мереж
Мої професори фізики в середній школі, а також благородний лауреат Фейнман завжди представляли те, що вони називали іграшковими моделями, щоб проілюструвати основні поняття та методи фізики, такі як гармонійний генератор, маятник, прядильна поверхня та чорний ящик. Які моделі іграшок використовуються для ілюстрації основних понять та методів, що лежать в основі …

4
Чому Q-Learning використовує жадібний епсілон під час тестування?
У статті DeepMind про Deep Q-Learning для відеоігор Atari ( тут ) вони використовують метод жадібного епсилону для дослідження під час тренувань. Це означає, що коли в тренінгу вибирається дія, вона вибирається як дія з найвищим значенням q, або випадкова дія. Вибір між цими двома є випадковим і ґрунтується на …

1
Думки про перенапруження в цілому і зокрема алгоритм SMOTE [закритий]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 2 роки тому . Яка ваша думка щодо надмірного зразка в класифікації взагалі та алгоритму SMOTE зокрема? Чому …

1
Чи реально ми виконуємо багатоваріантний регресійний аналіз з коефіцієнтами * мільйона * / незалежними змінними?
Я витрачаю деякий час на вивчення машинного навчання (вибачте за рекурсію :), і мені не вдалося заінтригувати правилом вибору градієнтного спуску над рішенням прямого рівняння для обчислення коефіцієнтів регресії, у випадку багатовимірної лінійної регресії. Правило: якщо кількість функцій (коефіцієнти зчитування / незалежні змінні) становить від або вище мільйона, перейдіть за …

2
Швидкість, обчислювальні витрати PCA, LASSO, еластична сітка
Я намагаюся порівняти складну обчислювальну складність / швидкість оцінки трьох груп методів лінійної регресії, як це відмічено у Hastie et al. "Елементи статистичного навчання" (2-е видання), глава 3: Вибір підмножини Методи усадки Методи з використанням похідних напрямків введення (PCR, PLS) Порівняння може бути дуже приблизним, просто щоб дати деяку думку. …

4
Чому розділення даних на навчальний і тестовий набір недостатньо
Я знаю, що для отримання продуктивності класифікатора я повинен розділити дані на навчальний / тестовий набір. Але читаючи це : Оцінюючи різні параметри ("гіперпараметри") для оцінювачів, таких як настройка C, яку необхідно встановити вручну для SVM, все ще існує ризик перевиконання тестового набору, оскільки параметри можна налаштувати до тих пір, …

1
Як повідомляється про матрицю плутанини при перехресній валідації K-кратної?
Припустимо, я роблю K-кратну перехресну перевірку з K = 10 разів. Буде одна матриця плутанини для кожної складки. Звітуючи про результати, я повинен обчислити, що є середньою матрицею плутанини, або просто підсумовувати матриці плутанини?

3
Чому статистика розривів для k-засобів пропонує один кластер, навіть якщо їх очевидно два?
Я використовую K-засоби для кластеризації своїх даних і шукав спосіб запропонувати "оптимальний" номер кластера. Статистика прогалин, здається, є загальним способом пошуку хорошої кількості кластерів. Чомусь він повертає 1 як оптимальне число кластера, але коли я дивлюся на дані, то очевидно, що є 2 кластери: Ось як я називаю розрив у …

2
Прихована модель Маркова проти моделі переходу Маркова проти моделі держави-простору…?
Для своєї магістерської роботи я працюю над розробкою статистичної моделі переходів між різними станами, визначеної серологічним статусом. Поки що я не буду занадто багато деталей давати в цьому контексті, оскільки моє питання є більш загальним / теоретичним. У будь-якому випадку, моя інтуїція полягає в тому, що я повинен використовувати модель …

2
Чому оптимізувати суміш Гаусса безпосередньо обчислювально важко?
Розглянемо вірогідність зрубу суміші гауссів: l(Sn;θ)=∑t=1nlogf(x(t)|θ)=∑t=1nlog{∑i=1kpif(x(t)|μ(i),σ2i)}l(Sn;θ)=∑t=1nlog⁡f(x(t)|θ)=∑t=1nlog⁡{∑i=1kpif(x(t)|μ(i),σi2)}l(S_n; \theta) = \sum^n_{t=1}\log f(x^{(t)}|\theta) = \sum^n_{t=1}\log\left\{\sum^k_{i=1}p_i f(x^{(t)}|\mu^{(i)}, \sigma^2_i)\right\} Мені було цікаво, чому обчислювально важко було максимізувати це рівняння безпосередньо? Я шукав або чітку тверду інтуїцію щодо того, чому повинно бути очевидним, що його важке, чи, можливо, більш жорстке пояснення, чому це важко. Чи ця …

1
Чим екстремальний випадковий ліс відрізняється від випадкового лісу?
Чи більш ефективна реалізація ER (яка схожа Extreme Gradient Boostingна збільшення градієнта) - чи важлива різниця з практичної точки зору? Є R пакет, який реалізує їх. Чи є новий алгоритм, який долає "загальну" реалізацію (пакет RandomForest від R) не лише з точки зору ефективності, але і в деяких інших сферах? …

2
Чому обробка природних мов не підпадає під домен машинного навчання? [зачинено]
Наразі це питання не підходить для нашого формату запитань. Ми очікуємо, що відповіді будуть підкріплені фактами, посиланнями або експертними знаннями, але це питання, ймовірно, вимагатиме дискусій, аргументів, опитувань чи розширеної дискусії. Якщо ви вважаєте, що це питання можна вдосконалити та, можливо, знову відкрити, відвідайте довідковий центр для ознайомлення . Закрито …

2
Як лінійний дискримінантний аналіз зменшує розміри?
Є слова з "Елементи статистичного навчання" на сторінці 91: K-центроїди в p-мірному вхідному просторі охоплюють не більше K-1 розмірного підпростору, і якщо p набагато більший за K, це буде значним зниженням розмірності. У мене є два питання: Чому K-центроїди в p-мірному вхідному просторі охоплюють щонайбільше K-1 розмірне підпростір? Як розташовані …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.