Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.


5
Як класифікувати за випадковими лісами в R, як слід регулювати незбалансовані розміри класів?
Я вивчаю різні методи класифікації проекту, над яким я працюю, і мені цікаво спробувати випадкові ліси. Я намагаюся просвітити себе, коли я йду разом, і буду вдячний за будь-яку допомогу, надану спільнотою CV. Я розділив свої дані на навчальні / тестові набори. Від експериментів зі випадковими лісами в R (використовуючи …

2
Чи можливий / практичний випадковий ліс з кількома виходами?
Випадкові ліси (RFs) - конкурентоспроможний метод моделювання / видобутку даних. Модель РФ має один вихід - змінну виводу / прогнозування. Наївним підходом до моделювання декількох виходів з радіочастотними сигналами було б побудова RF для кожної вихідної змінної. Таким чином, ми маємо N незалежних моделей, і там, де є кореляція між …

4
Тлумачення негативної косинусної подібності
Моє запитання може бути дурним. Тому я заздалегідь прошу вибачення. Я намагався використовувати модель GLOVE, попередньо підготовлену групою Stanford NLP ( посилання ). Однак я помітив, що результати моєї подібності показали деякі негативні цифри. Це відразу ж підштовхнуло мене переглянути файл файлів даних word-vector. Мабуть, значення у векторах слова мали …

3
Як математично визначається причинно-наслідковий зв’язок?
Яке математичне визначення причинно-наслідкового зв’язку між двома випадковими змінними? З огляду на вибірку із спільного розподілу двох випадкових величин і , коли ми говоримо, що викликає Y ?XXXYYYXXXYYY З контексту я читаю цей документ про причинно-наслідкове виявлення .

1
Чи навчається під наглядом підмножина підсилення навчання?
Схоже, визначення контрольованого навчання - це підмножина посиленого навчання з певним видом функції винагороди, яка базується на мічених даних (на відміну від іншої інформації в оточенні). Це точне зображення?

1
Чому інформаційний критерій Akaike більше не використовується в машинному навчанні?
Я щойно натрапив на "критерій інформації Akaike", і я помітив цю велику кількість літератури щодо вибору моделі (також такі речі, як BIC, здається, існують). Чому сучасні методи машинного навчання не скористаються цими критеріями вибору моделі BIC та AIC?

2
Що відбувається тут, коли я використовую квадратичні втрати для налаштування логістичної регресії?
Я намагаюся використовувати збиток у квадраті, щоб зробити бінарну класифікацію набору даних про іграшки. Я використовую mtcarsнабір даних, використовуйте милю на галон і вагу для прогнозування типу передачі. На графіку нижче показані два типи даних передачі різних кольорів та межа прийняття рішення, породжена різними функціями втрат. Збиток у квадраті - …

4
Що вважається хорошою втратою журналу?
Я намагаюсь краще зрозуміти втрату журналу та як це працює, але я не можу знайти, що я вказую номер втрати журналу в якийсь контекст. Якщо моя модель має втрату журналу 0,5, це добре? Що вважається хорошою та поганою оцінкою? Як змінюються ці пороги?

5
Як методи ансамблю перевершують усі їх складові?
Я трохи розгублений щодо ансамблевого навчання. Коротше кажучи, він запускає k моделі і отримує середнє значення цих моделей k. Як можна гарантувати, що середнє значення k-моделей було б краще, ніж будь-яка з моделей? Я розумію, що упередженість "розширюється" або "усереднюється". Однак що робити, якщо в ансамблі є дві моделі (тобто …

1
Які теорії причинності я повинен знати?
Які теоретичні підходи до причинності я повинен знати як прикладний статистик / економетрик? Я знаю (дуже небагато) Причинно-наслідкова модель Неймана – Рубіна (і Рой , Хаавелмо тощо) Робота Перла про причинність Причинність Грейнджера (хоча і менш орієнтована на лікування) Які поняття я пропускаю або мені слід знати? Пов'язане: Які теорії …

1
кількість функціональних карт у конволюційних нейронних мережах
Під час вивчення конволюційної нейронної мережі у мене виникають запитання щодо наступного малюнка. 1) C1 у шарі 1 має 6 функціональних карт, чи це означає, що є шість згорткових ядер? Кожне згорнуте ядро ​​використовується для створення карти функцій на основі вхідних даних. 2) S1 у шарі 2 має 6 функціональних …

2
Як зробити дослідницький аналіз даних, щоб вибрати відповідний алгоритм машинного навчання
Ми вивчаємо машинне навчання за допомогою машинного навчання: ймовірнісна перспектива (Кевін Мерфі). Хоча текст пояснює теоретичну основу кожного алгоритму, він рідко каже, у якому випадку, який алгоритм кращий, а коли це робиться, він не говорить, як сказати, у якому випадку я перебуваю. Наприклад, для вибору ядра мені сказали робити дослідницький …

3
Площа під кривою ROC або площа під кривою PR для незбалансованих даних?
У мене є сумніви щодо того, який показник продуктивності використовувати, площа під кривою ROC (TPR як функція FPR) або площа під кривою точності відкликання (точність як функція відкликання). Мої дані незбалансовані, тобто кількість негативних випадків значно більша, ніж позитивних. Я використовую вихідне передбачення Weka, зразок: inst#,actual,predicted,prediction 1,2:0,2:0,0.873 2,2:0,2:0,0.972 3,2:0,2:0,0.97 4,2:0,2:0,0.97 …

2
За яких умов машини для підвищення градієнта перевершують випадкові ліси?
Чи може градієнтний прискорювач Фрідмана досягти кращих показників, ніж з випадковим лісом Бреймана ? Якщо так, то в яких умовах або який набір даних може покращити gbm?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.