Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

3
Яким чином можна отримати хорошу лінійну регресійну модель, коли немає суттєвої кореляції між результатами та прогнокторами?
Я тренував лінійну регресійну модель, використовуючи набір змінних / особливостей. І модель має хороші показники. Однак я зрозумів, що немає змінної, яка б добре співвідносилась із прогнозованою змінною. Як це можливо?

1
Тест: Повідомте класифікатора за його межею рішення
Нижче наведено 6 меж рішення. Межі рішення - фіолетові лінії. Точки та хрестики - це два різних набори даних. Ми повинні вирішити, який з них: Лінійний SVM Кернелізоване SVM (Поліномне ядро ​​порядку 2) Перцепрон Логістична регресія Нейронна мережа (1 прихований шар з 10 випрямленими лінійними одиницями) Нейронна мережа (1 прихований …

5
Розуміння, які особливості були найважливішими для логістичної регресії
Я створив класифікатор логістичної регресії, який є дуже точним для моїх даних. Тепер я хочу краще зрозуміти, чому це так добре працює. Зокрема, я хотів би оцінити, які функції роблять найбільший внесок (які функції є найважливішими) і, в ідеалі, кількісно оцінити, наскільки кожна функція сприяє точності загальної моделі (або чогось …

1
Які теоретичні гарантії пакування
Я (приблизно) чув, що: пакетування - це методика зменшення дисперсії алгоритму прогнозування / оцінки / навчання. Однак я ніколи не бачив формального математичного підтвердження цього твердження. Хтось знає, чому це математично вірно? Це, мабуть, є таким широко прийнятим / відомим фактом, що я очікую прямого посилання на це. Я був …

3
Чому ми розділяємо стандартне відхилення, а не якийсь інший стандартизуючий коефіцієнт, перш ніж робити PCA?
Я читав таке обґрунтування (із записів до курсу cs229) про те, чому ми ділимо вихідні дані на його стандартне відхилення: незважаючи на те, що я розумію, про що йдеться в поясненні, мені незрозуміло, чому поділ на стандартне відхилення дозволить досягти такої мети. Це говорить так, що всі більше на тій …

1
Чи відповідає значення R-квадрата для порівняння моделей?
Я намагаюся визначити найкращу модель для прогнозування цін на автомобілі, використовуючи ціни та можливості, доступні на сайтах рекламних оголошень для автомобілів. Для цього я використав пару моделей з бібліотеки scikit-learn та моделей нейронної мережі з пібраїну та нейролаб. Я використовував поки що підхід - це запустити фіксовану кількість даних через …

1
Коли Naive Bayes працює краще, ніж SVM?
У невеликій проблемі класифікації тексту, яку я розглядав, Naive Bayes демонстрував виставу, схожу на SVM або більше, і я дуже розгубився. Мені було цікаво, які фактори визначають тріумф одного алгоритму над іншим. Чи бувають ситуації, коли немає сенсу використовувати Naive Bayes над SVM? Чи може хтось пролити на це світло?

4
Що означає "ступінь свободи" в нейронних мережах?
У книзі Бішопа «Класифікація візерунків та машинне навчання» він описує техніку регуляризації в контексті нейронних мереж. Однак я не розумію абзац, що описує, що під час тренувального процесу кількість ступенів свободи збільшується разом зі складністю моделі. Відповідна цитата: Альтернативою регуляризації як способу контролю ефективної складності мережі є процедура раннього припинення. …

1
Я хочу побудувати індекс злочинності та індекс політичної нестабільності на основі новин
У мене є цей побічний проект, де я переглядаю веб-сайти місцевих новин у своїй країні і хочу створити індекс злочинності та індекс політичної нестабільності. Я вже висвітлював інформаційно-пошукову частину проекту. Мій план: Непідконтрольне вилучення теми. Виявлення дублікатів поблизу. Контрольована класифікація та рівень інцидентів (злочинність / політичний - високий / середній …

3
Використання нейронної мережі для торгівлі на біржі
Я пірнув у поле нейронних мереж і захопився ними. Нарешті я розробив прикладну систему для тестування торговельних систем на біржах, і тепер я збираюся реалізувати свою першу нейронну мережу в ній. Дуже простий і примітивний, не призначений для реальної торгівлі, а лише для початківців. Я хочу лише знати, чи хороший …

3
Порівняння двох результатів точності класифікатора за статистичною значимістю з t-тестом
Хочу порівняти точність двох класифікаторів за статистичною значимістю. Обидва класифікатори виконуються в одному наборі даних. Це змушує мене вважати, що я повинен використовувати тестовий тест з одного зразка з того, що я читав . Наприклад: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 Це правильний тест для …

1
Вхідні параметри для використання прихованого розподілу Діріхле
Під час використання моделювання тем (Latent Dirichlet Allocation) кількість тем є вхідним параметром, який потрібно вказати користувачеві. Мені здається, що ми також повинні запропонувати збірку наборів тем кандидатів, проти яких повинен діяти процес Діріхле? Чи правильно я розумію? На практиці, як налаштувати такий тип набору кандидатів?

12
Кращі книги для вступу до аналізу статистичних даних?
Заблокований . Це питання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Я купив цю книгу: Як виміряти що-небудь: пошук цінностей нематеріальних речей у бізнесі і Перший аналіз даних: Посібник для учнів щодо великих чисел, статистики та хороших …

3
Які алгоритми потребують масштабування функцій, крім SVM?
Я працюю з багатьма алгоритмами: RandomForest, DecisionTrees, NaiveBayes, SVM (ядро = лінійне та rbf), KNN, LDA та XGBoost. Усі вони були досить швидкими, за винятком SVM. Саме тоді я дізнався, що для швидшого роботи потрібне масштабування функцій. Тоді я задумався, чи варто робити те ж саме для інших алгоритмів.

1
Як побудувати остаточну модель та налаштувати поріг ймовірності після вкладеної перехресної перевірки?
По-перше, вибачення за розміщення питання, про яке вже обговорювались тут , тут , тут , тут , тутта для повторного розігрівання старої теми. Я знаю, що @DikranMarsupial досить довго писав про цю тему у публікаціях та журнальних статтях, але я все ще плутаюся, і, судячи з кількості подібних публікацій тут, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.