Наука про дані python

2

Приклад зворотного дзвінка Кераса для збереження моделі після кожної епохи?

Чи може хтось, будь ласка, опублікувати простий приклад Keras, використовуючи зворотний дзвінок, щоб зберегти модель після кожної епохи? Я можу знайти приклади економії ваги, але хочу, щоб я міг зберегти повністю функціонуючу модель після кожної епохи тренувань.

17 python keras

8

Як підрахувати кількість пропущених значень у кожному рядку в рамках даних Pandas?

Як я можу отримати кількість пропущених значень у кожному рядку в даних фрейму даних Pandas. Я хотів би розділити кадр даних на різні рамки даних, у яких однакова кількість відсутніх значень у кожному рядку. Будь-яка пропозиція?

17 python pandas

2

Де в робочому процесі ми маємо мати справу з відсутніми даними?

Я будую робочий процес для створення моделей машинного навчання (в моєму випадку, використовуючи Python pandasі sklearnпакунки) з даних, витягнутих з дуже великої бази даних (тут, Vertica за допомогою SQL і pyodbc), і критичний крок у цьому процесі передбачає введення відсутніх значення предикторів. Це зрозуміло в рамках однієї платформи аналітики чи …

16 machine-learning python pandas scikit-learn

4

Бібліотека Python для сегментованої регресії (також частково регресія)

Я шукаю бібліотеку Python, яка може виконувати сегментовану регресію (також кусочно регресію) . Приклад :

16 python linear-regression library software-recommendation

3

Однокласна дискримінаційна класифікація з незбалансованим, гетерогенним негативним фоном?

Я працюю над вдосконаленням існуючого контрольованого класифікатора, щоб класифікувати {протеїнові} послідовності як такі, що належать до певного класу (попередники нейропептидних гормонів), чи ні. Існує близько 1150 відомих "позитивних" на тлі близько 13 мільйонів послідовностей білків ("Невідомий / погано анотований фон") або близько 100 000 рецензованих відповідних білків, анотованих з різними …

16 machine-learning data-mining python classification

6

Яка причина прийняття перетворення журналу кількох безперервних змінних?

Я займався питаннями класифікації, і читав код та підручники багатьох людей. Одне, що я помітив, - це те, що багато людей приймають np.logабо logбезперервну змінну, наприклад, loan_amountі applicant_incomeт.д. Я просто хочу зрозуміти причину цього. Чи допомагає це покращити точність прогнозування нашої моделі. Це обов’язково? чи є якась логіка за цим? …

16 machine-learning python classification scikit-learn

3

Як отримати прогнози за допомогою predict_generator на потокових тестових даних у Керасі?

У блозі Кераса, який навчає коннетів з нуля , код показує лише мережу, що працює на даних про навчання та перевірку. Що з тестовими даними? Чи збігаються дані перевірки як дані тестування (я думаю, що ні). Якщо в папках поїзда та валідації була окрема тестова папка, схожа на теки поїздів …

16 machine-learning python deep-learning keras confusion-matrix

5

Бібліотека Python для реалізації прихованих моделей Маркова

Яку стабільну бібліотеку Python можна використовувати для реалізації прихованих моделей Маркова? Мені потрібно, щоб це було досить добре зафіксовано, тому що я ніколи не використовував цю модель раніше. Як варіант, чи існує більш прямий підхід до аналізу часових рядів набору даних за допомогою HMM?

15 python time-series markov-process

5

Прогнозування подібності вироку

Я хочу вирішити таку проблему: у мене є набір речень як мій набір даних, і я хочу мати можливість ввести нове речення та знайти речення, яке нове є найбільш подібним до цього в наборі даних. Приклад виглядає так: Нове речення: " I opened a new mailbox" Прогнозування на основі даних: …

15 python nlp scikit-learn similarity text

2

Чому змінні даних поїздів і тестів визначаються за допомогою великої літери (в Python)?

Я сподіваюся, що це питання є найбільш підходящим на цьому сайті ... У Python, як правило, ім'я класу визначається за допомогою великої літери, наприклад, його першого символу class Vehicle: ... Однак у машинному навчальному полі часто дані тренувань і тестів визначаються як Xі Y- ні, xі - y. Наприклад, я …

15 python dataset

2

Як працює SelectKBest?

Я переглядаю цей підручник: https://www.dataquest.io/mission/75/improving-your-submission У розділі 8, знаходячи найкращі функції, відображається наступний код. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the raw p-values …

15 python scikit-learn

1

Чи потрібна стратифікована вибірка (випадковий ліс, Python)?

Я використовую Python для запуску випадкової лісової моделі на моєму незбалансованому наборі даних (цільовою змінною був двійковий клас). Розбиваючи навчальний і тестуючий набір даних, я намагався використати стратифіковану вибірку (наприклад, показаний код) чи ні. Поки я в своєму проекті зауважував, що стратифікований випадок призведе до більш високої продуктивності моделі. Але …

14 machine-learning python random-forest sampling training

2

Модель бінарної класифікації для незбалансованих даних

У мене є набір даних із такими специфікаціями: Навчальний набір даних з 193 176 зразками з 2821 позитивом Тестовий набір даних із 82 887 зразків із 673 позитивними Є 10 функцій. Я хочу виконати двійкову класифікацію (0 або 1). Проблема, з якою я стикаюся, полягає в тому, що дані дуже …

14 machine-learning python classification logistic-regression

1

Тепла карта на карті в Python

У режимі Analytics є приємна функція теплової карти ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Але це не сприятливо для порівняння карт (лише одна на звіт). Те, що вони дозволяють, - це легко перетягувати дані в обгорнуту зошит пітона. І тоді будь-яке зображення в python можна легко додати до звіту. Отже, моє запитання: як …

14 python visualization geospatial

5

Чи сучасні бібліотеки R та / або Python роблять SQL застарілим?

Я працюю в офісі, де SQL Server є основою всього, що ми робимо, від обробки даних до очищення до розміщення. Мій колега спеціалізується на написанні складних функцій і збережених процедур, щоб методично обробляти вхідні дані, щоб вони могли бути стандартизовані та працювати в проектах звітів, візуалізації та аналітики. Перш ніж …

14 python r data-cleaning data sql

Запитання з тегом «python»