Запитання з тегом «machine-learning»

Питання щодо впровадження алгоритмів машинного навчання. Загальні питання щодо машинного навчання повинні бути розміщені у їх конкретних спільнотах.

21
Різниця між класифікацією та кластеризацією при обробці даних? [зачинено]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб він зосередив увагу на одній проблемі лише редагуючи цю публікацію . Закритий минулого року . Удосконаліть це питання Чи може хтось пояснити, в чому різниця між класифікацією та кластеризацією при …

7
Чи існує правило про те, як розділити набір даних на набори для навчання та перевірки?
Чи існує чітке правило, як найкраще розділити дані на набори для навчання та перевірки? Чи доцільний рівний 50/50 розкол? Або є чіткі переваги того, що ви маєте більше даних про навчання щодо даних про валідацію (або навпаки)? Або цей вибір в значній мірі залежить від програми? Я в основному використовую …

6
Збережіть класифікатор на диску в scikit-learn
Як я зберегти навчений наївний байесовский класифікатор на диск і використовувати його для передбачати дані? У мене є такий зразок програми з веб-сайту scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % …


14
Найближчі сусіди у великомірних даних?
Я задав запитання кілька днів тому, як знайти найближчих сусідів за заданим вектором. У мого вектора зараз 21 розмір, і перш ніж продовжувати далі, тому що я не з області машинного навчання, ані математики, я починаю задавати собі кілька основних питань: Чи є евклідова відстань хорошим показником для пошуку найближчих …

11
Чому binary_crossentropy та categorical_crossentropy дають різні вистави для однієї проблеми?
Я намагаюся навчити CNN класифікувати текст за темами. Коли я використовую бінарну перехресну ентропію, я отримую ~ 80% точності, при категоричній перехресній ентропії я отримую ~ 50% точності. Я не розумію, чому це. Це багатокласова проблема, чи це не означає, що я повинен використовувати категоричну перехресну ентропію і що результати …

6
Як зрозуміти місцевий чутливий хешинг?
Я помітив, що LSH здається хорошим способом пошуку подібних предметів із властивостями високого розміру. Прочитавши документ http://www.slaney.org/malcolm/yahoo/Slaney2008-LSHTutorial.pdf , я все ще плутаюсь із цими формулами. Хтось знає блог чи статтю, яка пояснює, що це найпростіший спосіб?

21
Як витягти правила рішення з дерева рішень scikit?
Чи можу я витягти основні правила прийняття рішень (або «шляхи прийняття рішень») з навченого дерева в дереві рішень як текстовий список? Щось на зразок: if A>0.4 then if B<0.2 then if C>0.8 then class='X' Спасибі за вашу допомогу.

9
Чому нам доводиться нормалізувати вхід для штучної нейронної мережі?
Це головне питання щодо теорії нейронних мереж: Чому ми повинні нормалізувати вхід для нейронної мережі? Я розумію, що іноді, коли, наприклад, вхідні значення є нечисловими, потрібно здійснити певне перетворення, але коли у нас є числовий вхід? Чому числа повинні бути в певному інтервалі? Що буде, якщо дані не нормалізуються?

5
Як розділити дані на 3 групи (поїзд, валідація та тест)?
У мене є фрейм даних панд, і я хочу поділити його на 3 окремих набори. Я знаю, що, використовуючи train_test_split від sklearn.cross_validation, можна розділити дані на два набори (поїзд та тест). Однак я не зміг знайти жодного рішення щодо розділення даних на три набори. Переважно, я хотів би мати індекси …

4
TensorFlow, чому саме питон був обраною мовою?
Нещодавно я почав вивчати глибоке навчання та інші методики ML, і я почав шукати рамки, які спрощують процес побудови мережі та навчають її, тоді я знайшов TensorFlow, маючи невеликий досвід у цій галузі, для мене, здається, швидкість - це великий фактор для того, щоб зробити велику систему ML ще більше, …

8
Коли я повинен використовувати генетичні алгоритми на відміну від нейронних мереж? [зачинено]
Наразі це запитання не підходить для нашого формату запитань. Ми очікуємо, що відповіді будуть підкріплені фактами, посиланнями або експертними знаннями, але це питання, ймовірно, вимагатиме дискусій, аргументів, опитувань чи розширеної дискусії. Якщо ви вважаєте, що це питання можна вдосконалити та, можливо, знову відкрити, відвідайте довідковий центр для ознайомлення . Закрито …

7
Як навчити штучну нейронну мережу грати в Diablo 2 за допомогою візуального введення?
Наразі я намагаюся отримати АНН, щоб грати у відеоігри, і я сподівався отримати допомогу чудового співтовариства тут. Я зупинився на Diablo 2. Гра, таким чином, відбувається в режимі реального часу і з ізометричної точки зору, при цьому гравець управляє одним аватаром, на якому орієнтована камера. Щоб зробити конкретні речі, завдання …

12
Чому нелінійну функцію активації слід використовувати в нейронній мережі зворотного розповсюдження?
Я читав деякі речі в нейронних мережах і розумію загальний принцип одношарової нейронної мережі. Я розумію необхідність додаткових шарів, але чому використовуються нелінійні функції активації? Після цього питання йде наступне : Що таке похідна функції активації, яка використовується для зворотного розповсюдження?

20
Як можна зробити один гарячий кодування в Python?
У мене є проблема класифікації машинного навчання з 80% категоричними змінними. Чи потрібно використовувати одне гаряче кодування, якщо я хочу використовувати якийсь класифікатор для класифікації? Чи можу я передати дані класифікатору без кодування? Я намагаюся зробити наступне для вибору функції: Я читаю файл поїзда: num_rows_to_read = 10000 train_small = pd.read_csv("../../dataset/train.csv", …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.