Запитання з тегом «python»

Використовуйте для наукових даних питання, пов'язані з мовою програмування Python. Не призначений для загальних питань кодування (-> stackoverflow).

2
Стохастичний градієнтний спуск на основі векторних операцій?
припустимо, що я хочу навчити алгоритм регресії стохастичного градієнта спуску за допомогою набору даних, що містить N зразків. Оскільки розмір набору даних є фіксованим, я повторно використовую дані T разів. Під час кожної ітерації або "епохи" я використовую кожен зразок тренінгу рівно один раз після випадкового переупорядкування всього навчального набору. …

2
Налагодження нейронних мереж
Я створив штучну нейронну мережу в python, використовуючи функцію оптимізації scipy.optimize.minimize (Conjugate gradient). Я здійснив перевірку градієнта, двічі перевірив все тощо, і я впевнений, що він працює правильно. Я запускав його кілька разів, і він досягає "Оптимізація успішно припиняється", але коли я збільшую кількість прихованих шарів, вартість гіпотези збільшується (все …

1
Чому моя модель Кераса вчиться розпізнавати тло?
Я намагаюся навчити цю керасову реалізацію Deeplabv3 + на Pascal VOC2012, використовуючи попередньо перевірену модель (яка також проходила навчання на цьому наборі даних). Я отримав дивні результати з точністю швидко зближення до 1,0: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 …

1
Збалансовані дані, що спричиняють неправильну класифікацію на множині набору даних
Я працюю над класифікацією тексту, де маю 39 категорій / класів та 8,5 мільйонів записів. (У майбутньому дані та категорії будуть збільшуватися). Структура або формат моїх даних наступний. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary …

1
Чи можна HDF5 надійно записувати та читати одночасно окремими процесами python?
Я пишу сценарій для того, щоб записати дані в реальному часі в один файл HDF5, який включає весь мій набір даних для цього проекту. Я працюю з Python 3.6 і вирішив створити інструмент командного рядка clickдля збору даних. Мене хвилює те, що станеться, якщо сценарій збору даних запишеться у файл …
9 python  dataset 

2
Чому швидкість навчання призводить до того, що вага моєї нейронної мережі зростає?
Я використовую tensorflow для написання простих нейронних мереж для невеликих досліджень, і у мене було багато проблем з «нанними» вагами під час тренування. Я спробував багато різних рішень, таких як зміна оптимізатора, зміна втрат, розмір даних тощо, але безрезультатно. Нарешті, я помітив, що зміна рівня навчання внесла неймовірну зміну у …

3
Експорт ваг (формула) з випадкових лісових регресорів у Scikit-Learn
Я підготував модель прогнозування за допомогою Scikit Learn in Python (Random Forest Regressor) і хочу якось витягнути ваги кожної функції, щоб створити інструмент Excel для ручного прогнозування. Єдине, що я знайшов - це, model.feature_importances_але це не допомагає. Чи є спосіб досягти цього? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest …

7
Бібліотека Python, яка може обчислити матрицю плутанини для класифікації на багато міток
Я шукаю бібліотеку Python, яка може обчислити матрицю плутанини для класифікації на багато міток . FYI: scikit-learn не підтримує мульти-мітку для матриці плутанини) Яка різниця між багатокласовою задачею та багаторівневою задачею


2
Реалізація комплементарних наївних баїв у пітоні?
Проблема Я намагався використовувати Naive Bayes на міченому наборі даних про злочини, але отримав дійсно погані результати (7% точність). Naive Bayes працює набагато швидше, ніж інші алогоритми, якими я користувався, тому хотів спробувати з'ясувати, чому оцінка була такою низькою. Дослідження Після прочитання я виявив, що Naive Bayes слід використовувати з …

2
Кластеризація документів із використанням тем, похідних від розподілу прихованого Діріхле
Я хочу використовувати Latent Dirichlet Allocation для проекту, і я використовую Python з бібліотекою gensim. Знайшовши теми, я хотів би згрупувати документи за допомогою такого алгоритму, як k-засоби (в ідеалі я хотів би використовувати хороший для перекриття кластерів, тому будь-яка рекомендація вітається). Мені вдалося отримати теми, але вони є у …

2
Чому регресія Gradient Boosting прогнозує негативні значення, коли в моєму навчальному наборі немає негативних значень y?
Як я можу збільшити кількість дерев в scikit дізнатися «S GradientBoostingRegressor, я отримую більше негативні прогнози, незважаючи на те, немає негативних значень в моєму навчанні або тестування набору. У мене є близько 10 функцій, більшість з яких є бінарними. Деякі з параметрів, які я налаштовував: кількість дерев / ітерацій; глибина …

2
Помилка пам'яті при використанні більше шарів у моделі CNN
На моєму ядро ​​Dell i7 - 16 ГБ оперативної пам’яті - 4 ГБ 960 м графічного процесора, я працюю над проектом, щоб класифікувати зображення легких КТ за допомогою 3D-CNN. Я використовую версію процесора tensorflow. Зображення готуються у вигляді масивного масиву (25,50,50). У моїй моделі CNN було 2 шари конвеєра, два …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.