Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

3
LASSO з умовами взаємодії - це добре, якщо основні ефекти скорочуються до нуля?
Регресія LASSO зменшує коефіцієнти до нуля, забезпечуючи ефективний вибір моделі. Я вважаю, що в моїх даних є змістовні взаємодії між номінальними та безперервними коваріатами. Однак, не обов'язково, що "основні наслідки" справжньої моделі є змістовними (не нульовими). Звичайно, я цього не знаю, оскільки справжня модель невідома. Мої цілі - знайти справжню …

10
Чому б не просто скинути нейронні мережі та глибоке навчання? [зачинено]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 2 роки тому . Принципова проблема глибокого навчання та нейронних мереж загалом. Рішення, що відповідають даним навчальних даних, …

5
Алгоритми машинного навчання для обробки відсутніх даних
Я намагаюся розробити модель прогнозування, використовуючи великі клінічні дані, включаючи лабораторні значення. Простір даних розрізнений з 5-ти зразками та 200 змінними. Ідея полягає у ранжуванні змінних за допомогою методу вибору функцій (IG, RF тощо) та використання функцій вищого рейтингу для розробки прогнозної моделі. Хоча вибір можливостей іде добре з підходом …

2
Інтуїція за логістичною регресією
Нещодавно я почав вивчати машинне навчання, проте мені не вдалося зрозуміти інтуїцію за логістичною регресією . Далі наведені факти про логістичну регресію, які я розумію. В якості основи гіпотези ми використовуємо сигмоїдну функцію . Я розумію , чому це правильний вибір, проте , чому це єдиний вибір , який я …

5
Чи варто коли-небудь стандартизувати двійкові змінні?
У мене є набір даних із набором функцій. Деякі з них є двійковими активний або звільнений, неактивний або спокійний), а решта оцінюються реально, наприклад .(1=(1=(1=0=0=0=4564.3424564.3424564.342 Я хочу подати ці дані в алгоритм машинного навчання, тому я -знаходжу всі реально оцінені функції. Я отримую їх приблизно від до . Тепер двійкові …

3
Щоденний аналіз часових рядів
Я намагаюся зробити аналіз часових рядів і я новачок у цій галузі. Я щодня перераховую подію 2006–2009 рр. І хочу приєднати до неї модель часових рядів. Ось прогрес, який я досяг: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) Отриманий сюжет я отримую: Щоб перевірити, чи є сезонність і тенденція в даних, чи ні, …

3
Які міри для точності багатозначних даних?
Розглянемо сценарій, коли вам надаються матриця K PoznaLabel і матриця PredictedLabel. Я хотів би виміряти добротність матриці PredictedLabel щодо матриці KknownLabel. Але проблема тут полягає в тому, що у матриці K knownLabel є кілька рядків, лише один 1, а інші кілька рядків мають багато 1 (ці екземпляри мають багато міток). …

5
Процедура кластеризації, коли кожен кластер має рівну кількість балів?
У мене є кілька точок в R pX={x1,...,xn}X={x1,...,xn}X=\{x_1,...,x_n\}RpRpR^p , і я хочу об'єднати точки так, щоб: Кожен кластер містить рівну кількість елементів . (Припустимо, що кількість кластерів ділить nXXXnnn .) Кожен кластер є «просторово згуртованим» у певному сенсі, як кластери з значень.kkk Легко придумати безліч процедур кластеризації, які задовольняють одну …

2
10-кратна перехресна валідація проти перехресної валідації
Я роблю вкладену перехресну перевірку. Я прочитав, що перехресне підтвердження виходу з одного виходу може бути упередженим (не пам'ятаю чому). Чи краще використовувати 10-кратну перехресну валідацію або перехресну валідацію "один-один", окрім більш тривалої тривалості виконання для перехресної перевірки "вихід-один-вихід"?

4
Яку проблему вирішують надмірне зондування, недооцінка та SMOTE?
У недавньому, добре сприйнятому питанні, Тім запитує, коли незбалансовані дані насправді є проблемою в машинному навчанні ? Передумова питання полягає в тому, що існує багато машинної літератури, яка обговорює баланс класів та проблему незбалансованих класів . Ідея полягає в тому, що набори даних з дисбалансом між позитивним та негативним класом …

1
Як діє емпіричний Байєс?
Тому я щойно закінчив читати чудову книгу « Вступ до емпіричного байєса» . Я вважав, що книга чудова, але будувати пріорі з даних почувалося не так. Мене навчали, що ви придумали план аналізу, потім ви збираєте дані, потім перевіряєте гіпотезу, яку ви визначили раніше в своєму плані аналізу. Коли ви …

1
Що таке варіаційні автокодери та до яких навчальних завдань вони використовуються?
Відповідно до цього та цієї відповіді, автоенкодери здаються технікою, яка використовує нейронні мережі для зменшення розмірів. Мені хотілося б додатково знати, що таке варіаційний автокодер (його основні відмінності / переваги перед «традиційними» автоенкодерами), а також, які основні навчальні завдання для цих алгоритмів використовуються.

1
Розрахунок граничної ймовірності зразків MCMC
Це питання, що повторюється (див. Цю публікацію , цю публікацію та цю публікацію ), але у мене інший виток. Припустимо, у мене є купа зразків із загального пробовідбору MCMC. Для кожного зразка я знаю значення ймовірності журналу та журналу попереднього . Якщо це допомагає, я також знаю значення ймовірності журналу …

2
Мішок слів для класифікації тексту: Чому б не просто використовувати частоту слова замість TFIDF?
Поширеним підходом до класифікації тексту є підготовка класифікатора від «мішечок слів». Користувач приймає текст для класифікації та підраховує частоти слів у кожному об'єкті з подальшим обрізанням, щоб зберегти отриману матрицю керованого розміру. Часто я бачу, як користувачі конструюють свій функціональний вектор за допомогою TFIDF. Іншими словами, зазначені вище частоти тексту …

3
Чому силові або журнальні перетворення мало навчаються в машинному навчанні?
Машинне навчання (МЛ) активно використовує лінійні та логістичні методи регресії. Він також спирається на особливість інженерних методів ( feature transform, kernel, і т.д.). Чому нічого не згадується про variable transformation(наприклад power transformation) в ML? (Наприклад, я ніколи не чую про те, щоб увімкнути або ввійти до функцій; вони, як правило, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.