Запитання з тегом «classification»

Статистична класифікація - це проблема ідентифікації підгрупи, до якої належать нові спостереження, де ідентичність підгрупи невідома, на основі навчального набору даних, що містять спостереження, субпопуляція яких відома. Тому ці класифікації показуватимуть змінну поведінку, яку можна вивчити статистикою.

2
Класифікація з частково "невідомими" даними
Припустимо, я хочу вивчити класифікатор, який приймає вектор чисел як вхідний і дає мітку класу як вихід. Мої дані навчання складаються з великої кількості пар вхід-вихід. Однак, коли я приходжу до тестування деяких нових даних, ці дані, як правило, лише частково завершені. Наприклад, якщо вектор вводу має довжину 100, лише …


1
Коли використовувати домішки Джині і коли використовувати інформаційний приріст?
Може хтось, будь ласка, пояснить мені, коли слід використовувати домішки Джині та отримання інформації для дерев рішень? Чи можете ви надати мені ситуації / приклади, коли найкраще використовувати який?

3
Інтервал довіри для точності перехресної перевірки класифікації
Я працюю над проблемою класифікації, яка обчислює метрику подібності між двома вхідними рентгенівськими зображеннями. Якщо зображення однакової особи (мітка "праворуч"), буде обчислена вища метрика; Вхідні зображення двох різних людей (мітка "неправильно") призведе до нижчої метрики. Я використовував стратифіковану 10-кратну перехресну перевірку для обчислення ймовірності помилкової класифікації. Мій поточний розмір вибірки …

1
Усереднення точності та відкликання при використанні перехресної перевірки
Я здійснив класифікацію, використовуючи декілька класифікаторів для даних, позначених двома класами, і використовував 5-кратну перехресну перевірку. На кожну складку я обчислював tp, tn, fp і fn. Тоді я підрахував точність, точність, відкликання та F-бал для кожного тесту. Моє запитання полягає в тому, що, коли я хочу оцінити результати, я взяв …

2
Класифікація часових рядів - дуже погані результати
Я працюю над проблемою класифікації часових рядів, де вхід - це дані про використання голосу часових рядів (у секундах) протягом перших 21 днів рахунку стільникового телефону. Відповідна цільова змінна - це чи скасовано цей обліковий запис у межах 35-45 днів. Отже, це проблема бінарної класифікації. Я отримую дуже погані результати …

2
Порівняйте класифікатори на основі AUROC чи точності?
У мене є проблема бінарної класифікації, і я експериментую на ній з різними класифікаторами: я хочу порівняти класифікатори. який з них є кращим показником AUC або точності? І чому? Raondom Forest: AUC: 0.828 Accuracy: 79.6667 % SVM: AUC: 0.542 Accuracy: 85.6667 %

3
Важливість змінних у логістичній регресії
Я, мабуть, маю справу з проблемою, яка, ймовірно, була вирішена сто разів раніше, але я не знаю, де знайти відповідь. Використовуючи логістичну регресію, враховуючи багато функцій і намагаючись передбачити двійкове категоричне значення , мені цікаво вибрати підмножину функцій, яка прогнозує добре.x1,...,xnx1,...,xnx_1,...,x_nyyyyyyy Чи існує процедура, схожа на ласо, яку можна використовувати? …

2
Заходи відокремленості класу в задачах класифікації
Прикладом гарної міри відокремленості класів у лінійних дискримінантних учнів є лінійне дискримінантне відношення Фішера. Чи є інші корисні показники для визначення того, чи забезпечують набори функцій гарне розділення класів між цільовими змінними? Зокрема, мені цікаво знайти хороші багатовимірні атрибути введення для максимізації поділу цільових класів, і було б непогано мати …

2
Використання Adaboost з SVM для класифікації
Я знаю, що Adaboost намагається генерувати сильний класифікатор, використовуючи лінійну комбінацію набору слабких класифікаторів. Однак я прочитав деякі документи, які пропонують Adaboost і SVM працювати в гармонії (навіть якщо SVM є сильним класифікатором) у певних умовах та випадках . Я не в змозі зрозуміти з архітектурної та програмної точки зору, …

4
Можна отримати кращу АНН, видаливши деякі з'єднання?
Мені було цікаво, чи можливо за якихось обставин ANN працює краще, якщо відрізати деякі зв’язки на них, наприклад: Побудова однієї ANN, взявши паралельно два багатошарові АН і В (паралельні вузли вводу та виходу), додавши кілька "комунікаційних" зв'язків між прихованими шарами А і В? Чи можна отримати кращі результати узагальнення? Це …

1
Розширення 2-класових моделей на багатокласні проблеми
У цьому документі про Adaboost наведено кілька пропозицій та код (стор. 17) щодо поширення 2-класових моделей на проблеми K-класу. Я хотів би узагальнити цей код таким чином, щоб я міг легко підключити різні моделі 2 класу та порівняти результати. Оскільки більшість моделей класифікації мають інтерфейс формули та predictметод, деякі з …

3
Модель класифікації для прогнозування рейтингу фільмів
Я дещо новачок у видобутку даних, і працюю над класифікаційною моделлю для прогнозування рейтингу фільмів. Я зібрав набори даних від IMDB, і я планую використовувати дерева рішень та підходи найближчого сусіда для своєї моделі. Мені хотілося б знати, який вільно доступний інструмент пошуку даних може забезпечити потрібну мені функціональність.

2
Впорядкування дерева класифікації (в rpart) в набір правил?
Чи існує спосіб побудувати складне дерево класифікації за допомогою rpart (в R) для організації правил прийняття рішень для кожного класу? Отже, замість того, щоб отримати одне величезне дерево, ми отримаємо набір правил для кожного з класів? (якщо так, то як?) Ось простий приклад коду для показу прикладів на: fit <- …
11 r  classification  cart  rpart 

3
Чи існують бібліотеки для методів, схожих на CART, які використовують розріджені прогнози та відповіді?
Я працюю з кількома великими наборами даних, використовуючи пакет gbm в Р. І моя матриця передбачення, і мій вектор відповідей досить рідкісні (тобто більшість записів дорівнює нулю). Я сподівався побудувати дерева рішень за допомогою алгоритму, який використовує цю обмеженість, як це було зроблено тут ). У цій роботі, як і …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.