Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

4
Відмінність ядер у SVM?
Може хтось, будь ласка, скажіть мені різницю між ядрами в SVM: Лінійний Поліном Гаусс (RBF) Сигмоїдний Тому що, як ми знаємо, ядро ​​використовується для відображення нашого вхідного простору у простір з великими розмірами. І в цьому просторі властивостей ми знаходимо межу, що розділяється лінійно. Коли вони використовуються (за яких умов) …

2
Оцінки варіацій у k-кратній перехресній валідації
Перехресна перевірка K-кратна може бути використана для оцінки можливостей узагальнення даного класифікатора. Чи можу я (або я повинен) також обчислити об'єднану дисперсію з усіх циклів перевірки, щоб отримати кращу оцінку її дисперсії? Якщо ні, то чому? Я знайшов документи, які використовують об'єднане стандартне відхилення через крос перехресної перевірки . Я …

3
Як судити, чи керована модель машинного навчання є придатною чи ні?
Хто-небудь може сказати мені, як судити, чи керована модель машинного навчання є придатною чи ні? Якщо у мене немає зовнішнього набору даних перевірки, я хочу знати, чи можу я використовувати ROC в 10-кратну перехресну валідацію для пояснення перевиконання. Якщо у мене є зовнішній набір даних перевірки, що мені робити далі?

5
Чи може глибока нейронна мережа наближати функцію множення без нормалізації?
Скажімо, ми хочемо зробити регресію для простого f = x * yвикористання стандартної глибокої нейронної мережі. Я пам’ятаю, що є повторні дослідження, які говорять про те, що NN з одним прихованим шаром може апоксимувати будь-яку функцію, але я спробував і без нормалізації NN не зміг наблизити навіть це просте множення. …


1
Що таке дослідження абляції? І чи є систематичний спосіб її виконання?
Що таке дослідження абляції? І чи є систематичний спосіб її виконання? Наприклад, у мене є ннn предикторів лінійної регресії, яку я назву своєю моделлю. Як я проведу дослідження абляції до цього? Які показники я повинен використовувати? Всеосяжне джерело чи підручник будуть вдячні.

1
Чому PCA чутливий до людей, що втрачають спокій?
У цій SE є багато публікацій, в яких обговорюються надійні підходи до аналізу основних компонентів (PCA), але я не можу знайти єдиного хорошого пояснення того, чому PCA чутливий в першу чергу до людей, що переживають люди.

1
Які класичні позначення статистики, лінійної алгебри та машинного навчання? І які зв’язки між цими позначеннями?
Коли ми читаємо книгу, розуміння позначень відіграє дуже важливу роль у розумінні змісту. На жаль, різні спільноти мають різні умовні позначення для формулювання моделі та проблеми оптимізації. Чи міг би хтось узагальнити деякі формулювальні позначення тут і навести можливі причини? Я наведу приклад тут: У літературі лінійної алгебри класичною книгою …

6
Як вибрати між ROC AUC та F1 балом?
Нещодавно я завершив змагання з Kaggle, в якому оцінку roc auc використовували згідно вимог змагань. Перед цим проектом я зазвичай використовував показник f1 як показник для вимірювання продуктивності моделі. Ідучи вперед, мені цікаво, як мені вибрати між цими двома показниками? Коли використовувати які та які їх плюси і мінуси? До …

1
One-vs-All і One-vs-One у svm?
Яка різниця між класифікатором SVM один-проти-всіх? Чи означає один класифікатор один проти всіх класифікацію всіх типів / категорій нового зображення, а один проти одного означає, що кожен тип / категорія нового зображення класифікується з різним класифікатором (кожна категорія обробляється спеціальним класифікатором)? Наприклад, якщо нове зображення слід класифікувати на коло, прямокутник, …

3
Тематичні моделі та методи спільного виникнення слів
Популярні моделі тем, як LDA, як правило, кластеризують слова, які мають тенденцію спільно зустрічатися в одну тему (кластер). У чому полягає основна відмінність таких моделей тематики від інших простих підходів, заснованих на кластеризації на основі спільного виникнення, таких як PMI? (PMI позначає точку взаємної інформації, і вона використовується для ідентифікації …

1
Зниження тренувань знову зменшується. Що відбувається?
Моя втрата тренувань знижується, а потім знову вгору. Це дуже дивно. Втрата перехресної перевірки відстежує втрати тренувань. Що відбувається? У мене є два складених LSTMS наступним чином (на Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adadelta') Я навчаю це протягом 100 епох: …

2
Нейронна мережа: Для двійкової класифікації використовуйте 1 або 2 вихідних нейрона?
Припустимо, я хочу зробити бінарну класифікацію (щось належить до класу A або класу B). Є кілька можливостей зробити це у вихідному шарі нейронної мережі: Використовуйте 1 вихідний вузол. Вихід 0 (<0,5) вважається класом A, а 1 (> = 0,5) вважається класом B (у випадку сигмоїдної) Використовуйте 2 вихідних вузла. Вхід …

4
Навіщо хтось використовувати KNN для регресії?
З того, що я розумію, ми можемо побудувати лише регресійну функцію, яка лежить в інтервалі навчальних даних. Наприклад (потрібна лише одна з панелей): Як би я передбачив майбутнє за допомогою регресора KNN? Знову ж таки, здається, лише приблизна функція, яка лежить в інтервалі навчальних даних. Моє запитання: Які переваги використання …

2
Що стосується реальності, яка реальна різниця між резюме та повторенням?
Це подібно до методів повторного відбору проб Карета , хоча це дійсно ніколи не відповідало цій частині питання узгоджено. функція поїздів Карет пропонує cvі repeatedcv. Яка різниця в тому, що говорять: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) проти MyTrainControl=trainControl( method = "repeatedcv", number=5, repeats=5 ) Я розумію, cvрозбиває набір …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.