Запитання з тегом «classification»

Статистична класифікація - це проблема ідентифікації підгрупи, до якої належать нові спостереження, де ідентичність підгрупи невідома, на основі навчального набору даних, що містять спостереження, субпопуляція яких відома. Тому ці класифікації показуватимуть змінну поведінку, яку можна вивчити статистикою.

1
Назва середньої абсолютної помилки, аналог балу Brier?
Вчорашнє запитання Визначте точність моделі, яка оцінює ймовірність події, мене цікавить оцінка ймовірності. Оцінка Brier - середній показник помилки у квадраті. Чи вимірює аналогічне середнє значення абсолютної похибки маєте також ім’я?1N∑i = 1N( р р е дi c t i o ni- р е фe r e n c ei)21N∑i=1N(prегicтiонi-rеfеrенcеi)2\frac{1}{N}\sum\limits …


1
Який алгоритм класифікації слід використовувати, побачивши, що t-SNE добре розділяє класи?
Припустимо, у нас є проблема класифікації, і спочатку ми хочемо отримати деяке розуміння даних і ми робимо t-SNE. Результат t-SNE дуже добре розділяє класи. Це означає, що можна побудувати класифікаційну модель, яка також буде дуже добре розділяти класи (якщо t-SNE не відокремлюється добре, то це не означає багато). Знаючи, що …

2
оптимізація auc vs logloss в проблемах бінарної класифікації
Я виконую завдання бінарної класифікації, коли ймовірність результату є досить низькою (близько 3%). Я намагаюся вирішити, чи оптимізувати AUC чи втрату журналу. Наскільки я зрозумів, AUC максимізує здатність моделі розрізняти класи, в той час як logloss карає розбіжність між фактичними та оціненими ймовірностями. У моєму завданні надзвичайно важливо відточити точність …

1
Як зменшити кількість помилкових позитивних результатів?
Я намагаюся вирішити завдання, яке називається пішохідним виявленням, і треную двійковий клацифер на двох позитивних категоріях - люди, негативи - на тлі. У мене є набір даних: кількість позитивів = 3752 кількість від’ємника = 3800 Я використовую поїзд \ test split 80 \ 20% і RandomForestClassifier форму scikit-learn з параметрами: …

1
Стратифікована класифікація з випадковими лісами (або іншим класифікатором)
Отже, у мене є матриця розміром приблизно 60 х 1000. Я розглядаю її як 60 об'єктів з 1000 особливостями; 60 об’єктів об’єднані в 3 класи (a, b, c). 20 предметів у кожному класі, і ми знаємо справжню класифікацію. Мені хотілося б вивчити під контролем цей набір з 60 прикладів навчання, …

3
Зовнішнє виявлення в дуже малих наборах
Мені потрібно отримати максимально точне значення для яскравості головного стабільного джерела світла з урахуванням дванадцяти значень освітленості зразка. Датчик недосконалий, і світло може час від часу «мерехтіти» яскравішим або темнішим, що можна ігнорувати, отже, моя потреба у зовнішньому виявленні (я думаю?). Я трохи прочитав тут різні підходи і не можу …


3
Чому важливий вимір ВК?
У Вікіпедії сказано, що: Вимір VC - це кардинальність найбільшого набору точок, який алгоритм може зруйнувати. Наприклад, лінійний класифікатор має кардинальність n + 1. Моє запитання, чому нас хвилює? Більшість наборів даних, на яких ви робите лінійну класифікацію, мають тенденцію до дуже великих розмірів і містять багато точок.

3
Як побудувати матрицю плутанини для багатокласового класифікатора?
У мене проблема з 6 класами. Таким чином, я будую класифікатор багатокласового класу таким чином: для кожного класу я маю один класифікатор логістичної регресії, використовуючи один проти всіх, це означає, що у мене є 6 різних класифікаторів. Я можу повідомити про матрицю плутанини для кожного з моїх класифікаторів. Але я …

1
Як використовувати пень рішення як слабкого учня в Adaboost?
Я хочу реалізувати Adaboost за допомогою рішення Stump. Чи правильно робити стільки рішень, скільки можливостей нашого набору даних у кожній ітерації Adaboost? Наприклад, якщо у мене є набір даних з 24 функціями, чи повинен я мати 24 класифікатори пеньки для кожної ітерації? Або я повинен випадковим чином вибрати деякі функції …

5
Чому ми відкидаємо нульову гіпотезу на рівні 0,05, а не на рівні 0,5 (як це робимо в Класифікації)
Тестування гіпотез схоже на проблему Класифікації. Отже, скажімо, у нас є 2 можливі мітки для спостереження (суб'єкта) - "Винні проти Невинні". Нехай невинувачений є нікчемною гіпотезою. Якщо ми розглянули проблему з точки зору Класифікації, ми би підготували Класифікатор, який би передбачив ймовірність приналежності суб'єкта в кожному з 2 класів за …

2
Інкрементальне навчання класифікаційним моделям в R
Припустимо, у мене є класифікатор (це може бути будь-який із стандартних класифікаторів, як дерево рішень, випадковий ліс, логістична регресія ... тощо) для виявлення шахрайства за допомогою наведеного нижче коду library(randomForest) rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier Say, Y is a …

2
Чому класифікатор Байєса є ідеальним класифікатором?
Вважається ідеальним випадком, коли структура ймовірностей, що лежать в основі категорій, досконало відома. Чому саме завдяки класифікатору Bayes ми досягаємо найкращих показників, яких можна досягти? Яке формальне підтвердження / пояснення цьому? Ми завжди використовуємо класифікатор Байєса як орієнтир для порівняння продуктивності всіх інших класифікаторів.

3
Яку функцію втрати слід використовувати для отримання високої точності або високого виклику бінарного класифікатора?
Я намагаюся зробити детектор об'єктів, які трапляються дуже рідко (на зображеннях), планую використовувати двійковий класифікатор CNN, застосований у розсувному / зміненому вікні. Я сконструював збалансований набір для позитивних і негативних тренувань 1: 1 (чи правильно це робити в такому випадку btw?), І класифікатор добре працює на тестовому наборі з точки …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.