Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

5
Як впоратися з моделлю прогнозування, яка перемогла себе?
Я спостерігав за презентацією спеціаліста з МЛ у великого ритейлера, де вони розробили модель прогнозування подій на складі. Припустимо на мить, що з часом їх модель стає дуже точною, чи не так чи інакше це "самозакохане"? Тобто, якщо модель справді добре працює, тоді вони зможуть передбачити події на складі та …

3
Що слід врахувати щодо магістерських програм зі статистики
Настає сезон прийому для аспірантів. Я (і багато студентів, як я) зараз намагаюся вирішити, яку програму статистики вибрати. Які речі ви пропонуєте нам розглянути щодо магістерських програм зі статистики? Чи є загальні підводні камені або помилки, які допускають учні (можливо, що стосується репутації школи)? Щодо зайнятості, чи варто орієнтуватися на …

4
Платформи хмарних обчислень для машинного навчання [закрито]
У мене є невеликий список компаній, які надають платформу для запуску сценаріїв R, python або octave на кластерах, побудованих на вершині amazon EC2. Чи є інші імена, які я повинен додати? Хмарні числа Опані crdata

3
Створення «оцінки визначеності» з голосів у випадкових лісах?
Я хочу підготувати класифікатора, який буде розмежовувати об'єкти Type Aта Type Bоб'єкти з досить великим навчальним набором з приблизно 10000 об'єктів, приблизно половина з яких є, Type Aа половина - Type B. Набір даних складається з 100 безперервних функцій, що деталізують фізичні властивості комірок (розмір, середній радіус тощо). Візуалізація даних …

3
Машинне навчання: Чи слід використовувати категоричну перехресну ентропію або бінарну поперечну втрату ентропії для двійкових прогнозів?
Перш за все, я зрозумів, що якщо мені потрібно виконувати двійкові прогнози, я повинен створити принаймні два класи за допомогою кодування з гарячим кодуванням. Це правильно? Однак чи є бінарна перехресна ентропія лише для прогнозів, що мають лише один клас? Якби я використовував категоричну перехресну втрату ентропії, яка зазвичай зустрічається …

1
Варіаційний висновок проти MCMC: коли вибрати один над іншим?
Я думаю, що я знаю загальне уявлення про VI та MCMC, включаючи різні аромати MCMC, такі як відбір проб Гіббса, Metropolis Hastings тощо. Цей документ пропонує чудову експозицію обох методів. У мене є такі питання: Якщо я хочу зробити байєсівський висновок, чому я б обрав один метод над іншим? Які …

2
Підвищення градієнта для лінійної регресії - чому це не працює?
Дізнаючись про Gradient Boosting, я не чув про обмеження щодо властивостей "слабкого класифікатора", який метод використовує для побудови та ансамблю моделі. Однак я не міг уявити додаток ГБ, що використовує лінійну регресію, і насправді, коли я виконував деякі тести - це не працює. Я випробовував найбільш стандартний підхід з градієнтом …

3
PCA і поїзд / тест розділилися
У мене є набір даних, для якого у мене є кілька наборів двійкових міток. Для кожного набору міток я готую класифікатор, оцінюючи його за допомогою перехресної перевірки. Я хочу зменшити розмірність за допомогою аналізу основних компонентів (PCA). Моє запитання: Чи можливо зробити PCA один раз для всього набору даних, а …

4
Які відмінності між розрідженим кодуванням та автокодером?
Рідке кодування визначається як вивчення надмірно повного набору базових векторів для представлення вхідних векторів (<- чому ми цього хочемо). Які відмінності між розрідженим кодуванням та автокодером? Коли ми будемо використовувати розріджене кодування та автокодер?

5
Безкоштовний набір даних для дуже високої розмірної класифікації [закрито]
Що таке вільно доступний набір даних для класифікації з більш ніж 1000 ознаками (або зразкові точки, якщо вони містять криві)? Вже існує спільнота вікі про безкоштовні набори даних: Розміщення вільно доступних зразків даних Але тут було б непогано мати більш цілеспрямований список, який можна зручніше використовувати , також я пропоную …

5
Чи можете ви переобладнати, навчаючи алгоритми машинного навчання за допомогою CV / Bootstrap?
Це питання може бути занадто відкритим, щоб отримати остаточну відповідь, але, сподіваємось, ні. Алгоритми машинного навчання, такі як SVM, GBM, Random Forest тощо, як правило, мають деякі вільні параметри, які, крім деякого правила керівництва, повинні бути налаштовані на кожен набір даних. Як правило, це робиться за допомогою певної техніки повторного …

3
Як інтерпретувати середнє зниження точності та середнє зниження GINI у моделях випадкових лісів
У мене виникають труднощі з розумінням того, як інтерпретувати вихідний показник важливості з пакету Random Forest. Середнє зниження точності зазвичай характеризується як "зниження точності моделі від перестановки значень у кожній функції". Це твердження про функцію в цілому або про конкретні значення в межах функції? В будь-якому випадку, чи означає середнє …

5
Що саме є байєсівська модель?
Чи можу я назвати модель, у якій теорема Байєса використовується "баєсовою моделлю"? Боюся, таке визначення може бути занадто широким. Отже, що саме є байєсівською моделлю?

6
Обмін даними: Як мені зайнятися пошуком функціональної форми?
Мені цікаво , повторюваних процедур , які можуть бути використані , щоб виявити функціональну форму функції , y = f(A, B, C) + error_termде мій єдиний вхід безліч спостережень ( y, A, Bі C). Зверніть увагу, що функціональна форма fневідома. Розглянемо наступний набір даних: AA BB CC DD EE FF …

4
Яка слабка сторона дерев рішень?
Дерева рішень здаються дуже зрозумілим методом машинного навчання. Після його створення людина може бути легко перевірена людиною, що є великою перевагою в деяких програмах. Які практичні слабкі сторони дерев рішень?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.