Запитання з тегом «classification»

Статистична класифікація - це проблема ідентифікації підгрупи, до якої належать нові спостереження, де ідентичність підгрупи невідома, на основі навчального набору даних, що містять спостереження, субпопуляція яких відома. Тому ці класифікації показуватимуть змінну поведінку, яку можна вивчити статистикою.

5
Що може призвести до того, що PCA погіршить результати класифікатора?
У мене є класифікатор, на якому я роблю перехресну перевірку, разом із сотнею функцій, на які я роблю вибір вперед для пошуку оптимальних комбінацій функцій. Я також порівнюю це з тими ж експериментами з PCA, де я використовую потенційні функції, застосовую SVD, перетворюю вихідні сигнали на новий простір координат і …

1
Чи встановлено перехресне підтвердження належною заміною для перевірки?
У класифікації тексту у мене є навчальний набір з приблизно 800 зразками та тестовий набір з приблизно 150 зразками. Тестовий набір ніколи не використовувався і чекав його використання до кінця. Я використовую цілий 800 навчальний набір зразків, з 10-кратним перехресним підтвердженням під час настройки та налаштування класифікаторів та функцій. Це …

4
Як виміряти / класифікувати "змінну важливість" при використанні CART? (зокрема, використовуючи {rpart} з R)
Створюючи модель CART (конкретно дерево класифікації) за допомогою rpart (в R), часто цікаво знати, яке значення мають різні змінні, що вводяться в модель. Отже, моє запитання таке: які спільні заходи існують для ранжирування / вимірювання значущості важливості змінних, що беруть участь у моделі CART? І як це можна обчислити за …

7
У Наївних Бейсах, чому турбуватися згладжуванням Лапласа, коли в тестовому наборі є невідомі слова?
Я читав сьогодні класифікацію Naive Bayes. Я читав під заголовком Оцінка параметрів з додаванням 1 згладжування : Нехай посилається на клас (наприклад, позитивний чи негативний), а позначає маркер або слово.cccwww Максимальний показник ймовірності для -P(w|c)P(w|c)P(w|c)count(w,c)count(c)=counts w in class ccounts of words in class c.count(w,c)count(c)=counts w in class ccounts of words …

2
Коли доцільно використовувати неправильне бальне правило?
Merkle & Steyvers (2013) пишуть: Для формального визначення правильного бального правила нехай - імовірнісний прогноз випробування Бернуллі d з істинною ймовірністю успіху p . Правильні правила балів - це показники, очікувані значення яких мінімізовано, якщо f = p .fffггdpppf= рf=pf = p Я вважаю, що це добре, тому що ми …

1
One-vs-All і One-vs-One у svm?
Яка різниця між класифікатором SVM один-проти-всіх? Чи означає один класифікатор один проти всіх класифікацію всіх типів / категорій нового зображення, а один проти одного означає, що кожен тип / категорія нового зображення класифікується з різним класифікатором (кожна категорія обробляється спеціальним класифікатором)? Наприклад, якщо нове зображення слід класифікувати на коло, прямокутник, …

2
Три варіанти дискримінаційного аналізу: відмінності та способи їх використання
Чи може хтось пояснити відмінності та навести конкретні приклади, як використовувати ці три аналізи? LDA - лінійний дискримінантний аналіз FDA - дискримінантний аналіз Фішера QDA - Квадратичний дискримінантний аналіз Я шукав всюди, але не міг знайти реальних прикладів з реальними значеннями, щоб побачити, як використовуються ці аналізи та обчислюють дані, …

2
Нейронна мережа: Для двійкової класифікації використовуйте 1 або 2 вихідних нейрона?
Припустимо, я хочу зробити бінарну класифікацію (щось належить до класу A або класу B). Є кілька можливостей зробити це у вихідному шарі нейронної мережі: Використовуйте 1 вихідний вузол. Вихід 0 (<0,5) вважається класом A, а 1 (> = 0,5) вважається класом B (у випадку сигмоїдної) Використовуйте 2 вихідних вузла. Вхід …

4
Прогнозування як безперервних, так і категоричних особливостей
Деякі методи моделювання прогнозування більш розроблені для роботи з безперервними прогнозами, а інші - для управління категоричними або дискретними змінними. Звичайно, існують методи перетворення одного типу в інший (дискретизація, фіктивні змінні тощо). Однак чи існують методи прогнозування моделювання, призначені для обробки обох типів введення одночасно, не просто перетворюючи тип функцій? …

1
Чи є алгоритм, що поєднує класифікацію та регресію?
Мені цікаво, чи може якийсь алгоритм одночасно робити класифікацію та регресію. Наприклад, я хотів би дозволити алгоритму вивчити класифікатор, і в той же час в межах кожної мітки він також дізнається безперервну ціль. Таким чином, для кожного прикладу навчання він має категоричну етикетку та постійне значення. Спочатку я міг би …

5
Як найважливіші основні компоненти можуть утримати силу прогнозування залежної змінної (або навіть призвести до кращих прогнозів)?
Припустимо , що я біжу регресію Y∼XY∼XY \sim X . Чому, вибираючи компоненти kkk принципу XXX , модель зберігає свою прогнозовану потужність на YYY ? Я розумію , що з розмірністю-відновлювальних / функція відбору точки зору, якщо v1,v2,...vkv1,v2,...vkv_1, v_2, ... v_k - власні вектори матриці коваріації з верхніми власними значеннями, …


2
Чи є сенс поєднувати PCA та LDA?
Припустимо, у мене є набір даних для контрольованої статистичної задачі класифікації, наприклад, через класифікатор Байєса. Цей набір даних складається з 20 функцій, і я хочу звести його до двох функцій за допомогою методів зменшення розмірності, таких як аналіз основних компонентів (PCA) та / або лінійний дискримінантний аналіз (LDA). Обидві методи …

3
П'ять найкращих класифікаторів, які слід спробувати першими
Крім очевидних характеристик класифікатора, як обчислювальна вартість, очікувані типи даних функцій / міток та придатність для певних розмірів і розмірів наборів даних, які перші п’ять (або 10, 20?) класифікаторів спробувати спершу на новому наборі даних, про який ще не відомо багато (наприклад, семантика та співвідношення окремих ознак)? Зазвичай я пробую …

2
Виявлення шаблонів обману на іспиті на багато запитань
ПИТАННЯ: У мене є двійкові дані щодо іспитових питань (правильні / неправильні). Деякі люди, можливо, мали попередній доступ до набору питань та їх правильних відповідей. Я не знаю, хто, скільки чи хто. Якби не було обману, припустимо, я б моделював вірогідність правильної відповіді для пунктуiii як, деявляє собою складність питання, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.