Запитання з тегом «machine-learning»

Методи та принципи побудови "комп'ютерних систем, які автоматично вдосконалюються з досвідом".

3
Що таке вага та упередженість у глибокому навчанні?
Я починаю вивчати машинне навчання з веб-сайту Tensorflow. Я розробив дуже рудиментарне розуміння потоку, за яким слідує програма глибокого навчання (цей метод змушує мене швидко вчитися, а не читати книги та великі статті). Я натрапив на кілька заплутаних речей, з них 2: Упередження Вага У навчальному посібнику MNIST на веб-сайті …

2
Які проблеми з навчанням підходять для векторних машин підтримки?
Які ознаки чи властивості вказують на те, що певну проблему навчання можна вирішити за допомогою векторів підтримки? Іншими словами, що це, коли ви бачите проблему з навчанням, змушує вас піти "о, я обов'язково повинен використовувати SVM для цього", а не нейромережі або дерева рішень чи щось інше?

2
Як вибрати функції нейронної мережі?
Я знаю, що на це запитання немає чіткої відповіді, але припустимо, що у мене величезна нейронна мережа з великою кількістю даних, і я хочу додати нову функцію у вхід. "Найкращим" способом було б протестувати мережу за допомогою нової функції та побачити результати, але чи є метод перевірити, чи функція НЕВІДОМНО …

3
Однокласна дискримінаційна класифікація з незбалансованим, гетерогенним негативним фоном?
Я працюю над вдосконаленням існуючого контрольованого класифікатора, щоб класифікувати {протеїнові} послідовності як такі, що належать до певного класу (попередники нейропептидних гормонів), чи ні. Існує близько 1150 відомих "позитивних" на тлі близько 13 мільйонів послідовностей білків ("Невідомий / погано анотований фон") або близько 100 000 рецензованих відповідних білків, анотованих з різними …

6
Яка причина прийняття перетворення журналу кількох безперервних змінних?
Я займався питаннями класифікації, і читав код та підручники багатьох людей. Одне, що я помітив, - це те, що багато людей приймають np.logабо logбезперервну змінну, наприклад, loan_amountі applicant_incomeт.д. Я просто хочу зрозуміти причину цього. Чи допомагає це покращити точність прогнозування нашої моделі. Це обов’язково? чи є якась логіка за цим? …

3
Як отримати прогнози за допомогою predict_generator на потокових тестових даних у Керасі?
У блозі Кераса, який навчає коннетів з нуля , код показує лише мережу, що працює на даних про навчання та перевірку. Що з тестовими даними? Чи збігаються дані перевірки як дані тестування (я думаю, що ні). Якщо в папках поїзда та валідації була окрема тестова папка, схожа на теки поїздів …

3
Як передбачити ймовірності в xgboost?
Нижче наведена функція прогнозування також дає значення -ve, тому ймовірності не можуть бути. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) Я google & спробував, pred_s <- predict(bst, x_mat_s2,type="response") але це не вийшло. Питання …

1
зворотне розповсюдження в CNN
У мене є наступні CNN: Почну з вхідного зображення розміром 5х5 Тоді я застосовую згортку за допомогою ядра 2x2 і stride = 1, що створює карту характеристик розміром 4x4. Тоді я застосовую 2х2 макс-пулінг з кроком = 2, що зменшує мапу функції до розміру 2х2. Тоді я застосовую логістичну сигмоїду. …

2
Чому нам потрібно відмовитись від однієї фіктивної змінної?
Я дізнався, що для створення регресійної моделі ми повинні піклуватися про категоричні змінні, перетворюючи їх у фіктивні змінні. Наприклад, якщо в наборі даних є така змінна, як розташування: Location ---------- Californian NY Florida Ми повинні їх перетворити так: 1 0 0 0 1 0 0 0 1 Однак було запропоновано …

8
Як дізнатися нейронні мережі?
Я студент-першокурсник (згадавши це, щоб ви могли пробачити мою незнайомість), який зараз займається дослідженнями за допомогою нейронних мереж. Я зашифрував тривузлову нейронну мережу (яка працює) на основі вказівок мого професора. Однак я хотів би продовжити кар'єру в галузі AI та Data Science, і я хотів би навчити себе більше про …

3
Яка різниця між RNN на основі слів на основі слів і на основі знаків?
Читаючи про генерування тексту за допомогою періодичних нейронних мереж, я помітив, що деякі приклади були реалізовані для генерації тексту слово за словом, а інші - за символом, не фактично вказуючи чому. Отже, в чому різниця між моделями РНН, котрі пророкують текст кожного слова основи і ті , які пророкують текст …

4
R: машинне навчання на GPU
Чи є пакети машинного навчання для R, які можуть використовувати GPU для підвищення швидкості навчання (щось на зразок Theano із світу python)? Я бачу, що існує пакет під назвою gputools, який дозволяє виконувати код на gpu, але я шукаю більш повну бібліотеку для машинного навчання.

4
Як вказати важливі атрибути?
Припустимо набір слабко структурованих даних (наприклад, веб-таблиці / пов'язані відкриті дані), що складається з багатьох джерел даних. Немає загальної схеми, за якою слідують дані, і кожне джерело може використовувати атрибути синоніму для опису значень (наприклад, "національність" проти "bornIn"). Моя мета - знайти деякі "важливі" атрибути, які якимось чином "визначають" сутності, …

2
Чому функції активації повинні бути монотонними?
Зараз я готуюсь до іспиту з нейронних мереж. У кількох протоколах попередніх іспитів я читав, що функції активації нейронів (у багатошарових персептронах) повинні бути монотонними. Я розумію, що функції активації повинні бути диференційованими, мати похідну, яка не є 0 у більшості точок, і бути нелінійною. Я не розумію, чому бути …

2
Відмінність рекомендацій, що базуються на предметах та користувачах у Mahout
Мені хотілося б знати, чим саме рекомендації Mahout, що базуються на користувача та на основі предметів, відрізняються один від одного. Це визначає це На основі користувачів : рекомендуйте елементи, знайшовши подібних користувачів. Це часто важче масштабувати через динамічний характер користувачів. На основі предметів: обчисліть схожість між елементами та дайте рекомендації. …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.