Статистика та великі дані machine-learning

3

Яким чином можна отримати хорошу лінійну регресійну модель, коли немає суттєвої кореляції між результатами та прогнокторами?

Я тренував лінійну регресійну модель, використовуючи набір змінних / особливостей. І модель має хороші показники. Однак я зрозумів, що немає змінної, яка б добре співвідносилась із прогнозованою змінною. Як це можливо?

17 regression machine-learning correlation multiple-regression linear-model

1

Тест: Повідомте класифікатора за його межею рішення

Нижче наведено 6 меж рішення. Межі рішення - фіолетові лінії. Точки та хрестики - це два різних набори даних. Ми повинні вирішити, який з них: Лінійний SVM Кернелізоване SVM (Поліномне ядро порядку 2) Перцепрон Логістична регресія Нейронна мережа (1 прихований шар з 10 випрямленими лінійними одиницями) Нейронна мережа (1 прихований …

17 machine-learning self-study classification neural-networks svm

5

Розуміння, які особливості були найважливішими для логістичної регресії

Я створив класифікатор логістичної регресії, який є дуже точним для моїх даних. Тепер я хочу краще зрозуміти, чому це так добре працює. Зокрема, я хотів би оцінити, які функції роблять найбільший внесок (які функції є найважливішими) і, в ідеалі, кількісно оцінити, наскільки кожна функція сприяє точності загальної моделі (або чогось …

17 machine-learning logistic feature-selection importance

1

Які теоретичні гарантії пакування

Я (приблизно) чув, що: пакетування - це методика зменшення дисперсії алгоритму прогнозування / оцінки / навчання. Однак я ніколи не бачив формального математичного підтвердження цього твердження. Хтось знає, чому це математично вірно? Це, мабуть, є таким широко прийнятим / відомим фактом, що я очікую прямого посилання на це. Я був …

17 machine-learning mathematical-statistics bagging

3

Чому ми розділяємо стандартне відхилення, а не якийсь інший стандартизуючий коефіцієнт, перш ніж робити PCA?

Я читав таке обґрунтування (із записів до курсу cs229) про те, чому ми ділимо вихідні дані на його стандартне відхилення: незважаючи на те, що я розумію, про що йдеться в поясненні, мені незрозуміло, чому поділ на стандартне відхилення дозволить досягти такої мети. Це говорить так, що всі більше на тій …

17 machine-learning pca mathematical-statistics

1

Чи відповідає значення R-квадрата для порівняння моделей?

Я намагаюся визначити найкращу модель для прогнозування цін на автомобілі, використовуючи ціни та можливості, доступні на сайтах рекламних оголошень для автомобілів. Для цього я використав пару моделей з бібліотеки scikit-learn та моделей нейронної мережі з пібраїну та нейролаб. Я використовував поки що підхід - це запустити фіксовану кількість даних через …

17 machine-learning neural-networks random-forest r-squared elastic-net

1

Коли Naive Bayes працює краще, ніж SVM?

У невеликій проблемі класифікації тексту, яку я розглядав, Naive Bayes демонстрував виставу, схожу на SVM або більше, і я дуже розгубився. Мені було цікаво, які фактори визначають тріумф одного алгоритму над іншим. Чи бувають ситуації, коли немає сенсу використовувати Naive Bayes над SVM? Чи може хтось пролити на це світло?

17 machine-learning classification svm naive-bayes

4

Що означає "ступінь свободи" в нейронних мережах?

У книзі Бішопа «Класифікація візерунків та машинне навчання» він описує техніку регуляризації в контексті нейронних мереж. Однак я не розумію абзац, що описує, що під час тренувального процесу кількість ступенів свободи збільшується разом зі складністю моделі. Відповідна цитата: Альтернативою регуляризації як способу контролю ефективної складності мережі є процедура раннього припинення. …

17 machine-learning neural-networks regularization degrees-of-freedom

1

Я хочу побудувати індекс злочинності та індекс політичної нестабільності на основі новин

У мене є цей побічний проект, де я переглядаю веб-сайти місцевих новин у своїй країні і хочу створити індекс злочинності та індекс політичної нестабільності. Я вже висвітлював інформаційно-пошукову частину проекту. Мій план: Непідконтрольне вилучення теми. Виявлення дублікатів поблизу. Контрольована класифікація та рівень інцидентів (злочинність / політичний - високий / середній …

17 machine-learning classification text-mining

3

Використання нейронної мережі для торгівлі на біржі

Я пірнув у поле нейронних мереж і захопився ними. Нарешті я розробив прикладну систему для тестування торговельних систем на біржах, і тепер я збираюся реалізувати свою першу нейронну мережу в ній. Дуже простий і примітивний, не призначений для реальної торгівлі, а лише для початківців. Я хочу лише знати, чи хороший …

17 machine-learning neural-networks

3

Порівняння двох результатів точності класифікатора за статистичною значимістю з t-тестом

Хочу порівняти точність двох класифікаторів за статистичною значимістю. Обидва класифікатори виконуються в одному наборі даних. Це змушує мене вважати, що я повинен використовувати тестовий тест з одного зразка з того, що я читав . Наприклад: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 Це правильний тест для …

17 machine-learning statistical-significance classification t-test

1

Вхідні параметри для використання прихованого розподілу Діріхле

Під час використання моделювання тем (Latent Dirichlet Allocation) кількість тем є вхідним параметром, який потрібно вказати користувачеві. Мені здається, що ми також повинні запропонувати збірку наборів тем кандидатів, проти яких повинен діяти процес Діріхле? Чи правильно я розумію? На практиці, як налаштувати такий тип набору кандидатів?

17 machine-learning bayesian clustering text-mining dirichlet-distribution

12

Кращі книги для вступу до аналізу статистичних даних?

Заблокований . Це питання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Я купив цю книгу: Як виміряти що-небудь: пошук цінностей нематеріальних речей у бізнесі і Перший аналіз даних: Посібник для учнів щодо великих чисел, статистики та хороших …

17 machine-learning bayesian references

3

Які алгоритми потребують масштабування функцій, крім SVM?

Я працюю з багатьма алгоритмами: RandomForest, DecisionTrees, NaiveBayes, SVM (ядро = лінійне та rbf), KNN, LDA та XGBoost. Усі вони були досить швидкими, за винятком SVM. Саме тоді я дізнався, що для швидшого роботи потрібне масштабування функцій. Тоді я задумався, чи варто робити те ж саме для інших алгоритмів.

17 machine-learning svm random-forest naive-bayes xgboost

1

Як побудувати остаточну модель та налаштувати поріг ймовірності після вкладеної перехресної перевірки?

По-перше, вибачення за розміщення питання, про яке вже обговорювались тут , тут , тут , тут , тутта для повторного розігрівання старої теми. Я знаю, що @DikranMarsupial досить довго писав про цю тему у публікаціях та журнальних статтях, але я все ще плутаюся, і, судячи з кількості подібних публікацій тут, …

17 machine-learning cross-validation model-selection glmnet hyperparameter

Запитання з тегом «machine-learning»