Запитання з тегом «classification»

Статистична класифікація - це проблема ідентифікації підгрупи, до якої належать нові спостереження, де ідентичність підгрупи невідома, на основі навчального набору даних, що містять спостереження, субпопуляція яких відома. Тому ці класифікації показуватимуть змінну поведінку, яку можна вивчити статистикою.

4
Функція Softmax vs Sigmoid в логістичному класифікаторі?
Що визначає вибір функції (Softmax vs Sigmoid) у логістичному класифікаторі? Припустимо, є 4 вихідні класи. Кожна з наведених вище функцій дає ймовірність правильного виходу кожного класу. То який із них взяти за класифікатор?

8
Як я можу допомогти гарантувати, що дані тестування не просочуються до даних про навчання?
Припустимо, у нас є хтось, який будує модель прогнозування, але хтось не обов'язково добре розбирається в правильних статистичних або машинних принципах навчання. Можливо, ми допомагаємо цій людині, коли вона навчається, або, можливо, вона використовує якийсь програмний пакет, для використання якого потрібні мінімальні знання. Тепер ця людина може цілком зрозуміти, що …

6
Альтернативи логістичній регресії в R
Мені б хотілося стільки алгоритмів, які виконують те саме завдання, що і логістична регресія. Це алгоритми / моделі, які можуть передбачити двійкову відповідь (Y) з деякою пояснювальною змінною (X). Буду радий, якби ви назвали алгоритм, ви також показали, як його реалізувати в R. Ось код, який можна оновити за допомогою …

6
Двійкова класифікація з сильно незбалансованими класами
У мене є набір даних у вигляді (функції, двійковий вихід 0 або 1), але 1 трапляється досить рідко, тому просто передбачуючи 0, я отримую точність між 70% і 90% (залежно від конкретних даних, на які я дивлюся ). Методи МЛ дають мені приблизно таку саму точність, і я вважаю, що …

5
Коли незбалансовані дані насправді є проблемою в машинному навчанні?
Ми вже мали кілька питань про незбалансоване даних при використанні логістичної регресії , SVM , дерева рішень , упаковки в пакети і ряд інших подібних питань, що робить його дуже популярною темою! На жаль, кожне з питань, схоже, відповідає алгоритму, і я не знайшов загальних рекомендацій щодо поводження з незбалансованими …


4
Чому б не підходити до класифікації через регресію?
Деякий матеріал, який я бачив на машинному навчанні, говорив, що погана ідея підходити до проблеми класифікації шляхом регресії. Але я думаю, що завжди можна зробити безперервну регресію, щоб відповідати даним і скоротити безперервний прогноз, щоб отримати дискретні класифікації. То чому це погана ідея?

4
Поріг ймовірності класифікації
У мене взагалі питання щодо класифікації. Нехай f - класифікатор, який виводить набір ймовірностей, заданих деякими даними D. Зазвичай, можна сказати: добре, якщо P (c | D)> 0,5, ми призначимо клас 1, інакше 0 (нехай це буде двійковий класифікація). Моє запитання полягає в тому, що якщо я дізнаюся, що якщо …

3
Чому логістична регресія є лінійним класифікатором?
Оскільки ми використовуємо логістичну функцію для перетворення лінійної комбінації вхідних даних у нелінійний вихід, як можна вважати логістичну регресію лінійним класифікатором? Лінійна регресія подібна до нейронної мережі без прихованого шару, тому чому нейронні мережі вважаються нелінійними класифікаторами, а логістична регресія - лінійною?

2
Лінійне ядро ​​та нелінійне ядро ​​для підтримуючої векторної машини?
Використовуючи векторну машину підтримки, чи є якісь вказівки щодо вибору лінійного ядра проти нелінійного ядра, наприклад, RBF? Я колись чув, що нелінійне ядро, як правило, не працює добре, коли кількість функцій велика. Чи є посилання на це питання?

2
Випадкові лісові припущення
Я є новим випадковим лісом, тому все ще борюся з деякими основними поняттями. При лінійній регресії ми передбачаємо незалежні спостереження, постійну дисперсію ... Які основні припущення / гіпотези, які ми робимо, використовуючи випадковий ліс? Які ключові відмінності між випадковими лісовими та наївними затоками з точки зору припущень моделі?

6
Особливості класифікації часових рядів
Я розглядаю проблему (багатокласової) класифікації на основі часових рядів змінної довжини , тобто знайти функцію за допомогою глобального представлення серії часу набором вибраних функцій фіксованого розміру незалежно від , а потім використовувати стандартні методи класифікації для цього набору функцій. Мене не цікавить прогнозування, тобто прогнозуванняf ( X T ) = …

4
Навчання дерева рішень проти незбалансованих даних
Я новачок у видобутку даних і намагаюся навчити дерево рішень щодо набору даних, який є вкрай незбалансованим. Однак у мене проблеми із поганою точністю прогнозування. Дані складаються з студентів, які вивчають курси, а змінна класу - це статус курсу, який має два значення - Відкликаний або Поточний. Вік Етнічність Стать …

6
Чому саме вибірка?
Припустимо, я хочу вивчити класифікатор, який передбачає, чи електронний лист є спамом. І припустимо, що лише 1% електронних листів - це спам. Найпростіше зробити це - дізнатися тривіальний класифікатор, який говорить, що жоден з електронних листів не є спамом. Цей класифікатор дав би нам 99% точності, але він не дізнався …

9
Як інтерпретувати значення F-вимірювання?
Я хотів би знати, як інтерпретувати різницю значень f-вимірювання. Я знаю, що f-міра - це збалансоване середнє значення між точністю та відкликанням, але я запитую про практичне значення різниці у F-мірах. Наприклад, якщо класифікатор C1 має точність 0,4, а інший класифікатор C2 - точність 0,8, то можна сказати, що C2 …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.