Статистика та великі дані machine-learning

4

Чи є КНН дискримінаційним алгоритмом навчання?

Здається, що KNN - це дискримінаційний алгоритм навчання, але я не можу знайти Інтернет-джерел, які це підтверджували. Чи є КНН дискримінаційним алгоритмом навчання?

17 machine-learning classification k-nearest-neighbour

5

Як класифікувати за випадковими лісами в R, як слід регулювати незбалансовані розміри класів?

Я вивчаю різні методи класифікації проекту, над яким я працюю, і мені цікаво спробувати випадкові ліси. Я намагаюся просвітити себе, коли я йду разом, і буду вдячний за будь-яку допомогу, надану спільнотою CV. Я розділив свої дані на навчальні / тестові набори. Від експериментів зі випадковими лісами в R (використовуючи …

17 r machine-learning random-forest

2

Чи можливий / практичний випадковий ліс з кількома виходами?

Випадкові ліси (RFs) - конкурентоспроможний метод моделювання / видобутку даних. Модель РФ має один вихід - змінну виводу / прогнозування. Наївним підходом до моделювання декількох виходів з радіочастотними сигналами було б побудова RF для кожної вихідної змінної. Таким чином, ми маємо N незалежних моделей, і там, де є кореляція між …

17 machine-learning cart random-forest multilabel

4

Тлумачення негативної косинусної подібності

Моє запитання може бути дурним. Тому я заздалегідь прошу вибачення. Я намагався використовувати модель GLOVE, попередньо підготовлену групою Stanford NLP ( посилання ). Однак я помітив, що результати моєї подібності показали деякі негативні цифри. Це відразу ж підштовхнуло мене переглянути файл файлів даних word-vector. Мабуть, значення у векторах слова мали …

17 machine-learning word2vec cosine-similarity

3

Як математично визначається причинно-наслідковий зв’язок?

Яке математичне визначення причинно-наслідкового зв’язку між двома випадковими змінними? З огляду на вибірку із спільного розподілу двох випадкових величин і , коли ми говоримо, що викликає Y ?XXXYYYXXXYYY З контексту я читаю цей документ про причинно-наслідкове виявлення .

16 machine-learning causality

1

Чи навчається під наглядом підмножина підсилення навчання?

Схоже, визначення контрольованого навчання - це підмножина посиленого навчання з певним видом функції винагороди, яка базується на мічених даних (на відміну від іншої інформації в оточенні). Це точне зображення?

16 machine-learning terminology reinforcement-learning supervised-learning definition

1

Чому інформаційний критерій Akaike більше не використовується в машинному навчанні?

Я щойно натрапив на "критерій інформації Akaike", і я помітив цю велику кількість літератури щодо вибору моделі (також такі речі, як BIC, здається, існують). Чому сучасні методи машинного навчання не скористаються цими критеріями вибору моделі BIC та AIC?

16 machine-learning model-selection aic bic

2

Що відбувається тут, коли я використовую квадратичні втрати для налаштування логістичної регресії?

Я намагаюся використовувати збиток у квадраті, щоб зробити бінарну класифікацію набору даних про іграшки. Я використовую mtcarsнабір даних, використовуйте милю на галон і вагу для прогнозування типу передачі. На графіку нижче показані два типи даних передачі різних кольорів та межа прийняття рішення, породжена різними функціями втрат. Збиток у квадраті - …

16 r machine-learning logistic optimization loss-functions

4

Що вважається хорошою втратою журналу?

Я намагаюсь краще зрозуміти втрату журналу та як це працює, але я не можу знайти, що я вказую номер втрати журналу в якийсь контекст. Якщо моя модель має втрату журналу 0,5, це добре? Що вважається хорошою та поганою оцінкою? Як змінюються ці пороги?

16 machine-learning loss-functions log-loss

5

Як методи ансамблю перевершують усі їх складові?

Я трохи розгублений щодо ансамблевого навчання. Коротше кажучи, він запускає k моделі і отримує середнє значення цих моделей k. Як можна гарантувати, що середнє значення k-моделей було б краще, ніж будь-яка з моделей? Я розумію, що упередженість "розширюється" або "усереднюється". Однак що робити, якщо в ансамблі є дві моделі (тобто …

16 machine-learning ensemble

1

Які теорії причинності я повинен знати?

Які теоретичні підходи до причинності я повинен знати як прикладний статистик / економетрик? Я знаю (дуже небагато) Причинно-наслідкова модель Неймана – Рубіна (і Рой , Хаавелмо тощо) Робота Перла про причинність Причинність Грейнджера (хоча і менш орієнтована на лікування) Які поняття я пропускаю або мені слід знати? Пов'язане: Які теорії …

16 machine-learning causality theory treatment-effect

1

кількість функціональних карт у конволюційних нейронних мережах

Під час вивчення конволюційної нейронної мережі у мене виникають запитання щодо наступного малюнка. 1) C1 у шарі 1 має 6 функціональних карт, чи це означає, що є шість згорткових ядер? Кожне згорнуте ядро використовується для створення карти функцій на основі вхідних даних. 2) S1 у шарі 2 має 6 функціональних …

16 machine-learning neural-networks deep-learning pattern-recognition conv-neural-network

2

Як зробити дослідницький аналіз даних, щоб вибрати відповідний алгоритм машинного навчання

Ми вивчаємо машинне навчання за допомогою машинного навчання: ймовірнісна перспектива (Кевін Мерфі). Хоча текст пояснює теоретичну основу кожного алгоритму, він рідко каже, у якому випадку, який алгоритм кращий, а коли це робиться, він не говорить, як сказати, у якому випадку я перебуваю. Наприклад, для вибору ядра мені сказали робити дослідницький …

16 machine-learning eda

3

Площа під кривою ROC або площа під кривою PR для незбалансованих даних?

У мене є сумніви щодо того, який показник продуктивності використовувати, площа під кривою ROC (TPR як функція FPR) або площа під кривою точності відкликання (точність як функція відкликання). Мої дані незбалансовані, тобто кількість негативних випадків значно більша, ніж позитивних. Я використовую вихідне передбачення Weka, зразок: inst#,actual,predicted,prediction 1,2:0,2:0,0.873 2,2:0,2:0,0.972 3,2:0,2:0,0.97 4,2:0,2:0,0.97 …

16 r machine-learning roc precision-recall auc

2

За яких умов машини для підвищення градієнта перевершують випадкові ліси?

Чи може градієнтний прискорювач Фрідмана досягти кращих показників, ніж з випадковим лісом Бреймана ? Якщо так, то в яких умовах або який набір даних може покращити gbm?

16 machine-learning data-mining random-forest boosting

Запитання з тегом «machine-learning»