Запитання з тегом «python»

Використовуйте для наукових даних питання, пов'язані з мовою програмування Python. Не призначений для загальних питань кодування (-> stackoverflow).

2
Приклад зворотного дзвінка Кераса для збереження моделі після кожної епохи?
Чи може хтось, будь ласка, опублікувати простий приклад Keras, використовуючи зворотний дзвінок, щоб зберегти модель після кожної епохи? Я можу знайти приклади економії ваги, але хочу, щоб я міг зберегти повністю функціонуючу модель після кожної епохи тренувань.
17 python  keras 

8
Як підрахувати кількість пропущених значень у кожному рядку в рамках даних Pandas?
Як я можу отримати кількість пропущених значень у кожному рядку в даних фрейму даних Pandas. Я хотів би розділити кадр даних на різні рамки даних, у яких однакова кількість відсутніх значень у кожному рядку. Будь-яка пропозиція?
17 python  pandas 

2
Де в робочому процесі ми маємо мати справу з відсутніми даними?
Я будую робочий процес для створення моделей машинного навчання (в моєму випадку, використовуючи Python pandasі sklearnпакунки) з даних, витягнутих з дуже великої бази даних (тут, Vertica за допомогою SQL і pyodbc), і критичний крок у цьому процесі передбачає введення відсутніх значення предикторів. Це зрозуміло в рамках однієї платформи аналітики чи …


3
Однокласна дискримінаційна класифікація з незбалансованим, гетерогенним негативним фоном?
Я працюю над вдосконаленням існуючого контрольованого класифікатора, щоб класифікувати {протеїнові} послідовності як такі, що належать до певного класу (попередники нейропептидних гормонів), чи ні. Існує близько 1150 відомих "позитивних" на тлі близько 13 мільйонів послідовностей білків ("Невідомий / погано анотований фон") або близько 100 000 рецензованих відповідних білків, анотованих з різними …

6
Яка причина прийняття перетворення журналу кількох безперервних змінних?
Я займався питаннями класифікації, і читав код та підручники багатьох людей. Одне, що я помітив, - це те, що багато людей приймають np.logабо logбезперервну змінну, наприклад, loan_amountі applicant_incomeт.д. Я просто хочу зрозуміти причину цього. Чи допомагає це покращити точність прогнозування нашої моделі. Це обов’язково? чи є якась логіка за цим? …

3
Як отримати прогнози за допомогою predict_generator на потокових тестових даних у Керасі?
У блозі Кераса, який навчає коннетів з нуля , код показує лише мережу, що працює на даних про навчання та перевірку. Що з тестовими даними? Чи збігаються дані перевірки як дані тестування (я думаю, що ні). Якщо в папках поїзда та валідації була окрема тестова папка, схожа на теки поїздів …

5
Бібліотека Python для реалізації прихованих моделей Маркова
Яку стабільну бібліотеку Python можна використовувати для реалізації прихованих моделей Маркова? Мені потрібно, щоб це було досить добре зафіксовано, тому що я ніколи не використовував цю модель раніше. Як варіант, чи існує більш прямий підхід до аналізу часових рядів набору даних за допомогою HMM?

5
Прогнозування подібності вироку
Я хочу вирішити таку проблему: у мене є набір речень як мій набір даних, і я хочу мати можливість ввести нове речення та знайти речення, яке нове є найбільш подібним до цього в наборі даних. Приклад виглядає так: Нове речення: " I opened a new mailbox" Прогнозування на основі даних: …

2
Чому змінні даних поїздів і тестів визначаються за допомогою великої літери (в Python)?
Я сподіваюся, що це питання є найбільш підходящим на цьому сайті ... У Python, як правило, ім'я класу визначається за допомогою великої літери, наприклад, його першого символу class Vehicle: ... Однак у машинному навчальному полі часто дані тренувань і тестів визначаються як Xі Y- ні, xі - y. Наприклад, я …
15 python  dataset 

2
Як працює SelectKBest?
Я переглядаю цей підручник: https://www.dataquest.io/mission/75/improving-your-submission У розділі 8, знаходячи найкращі функції, відображається наступний код. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the raw p-values …

1
Чи потрібна стратифікована вибірка (випадковий ліс, Python)?
Я використовую Python для запуску випадкової лісової моделі на моєму незбалансованому наборі даних (цільовою змінною був двійковий клас). Розбиваючи навчальний і тестуючий набір даних, я намагався використати стратифіковану вибірку (наприклад, показаний код) чи ні. Поки я в своєму проекті зауважував, що стратифікований випадок призведе до більш високої продуктивності моделі. Але …

2
Модель бінарної класифікації для незбалансованих даних
У мене є набір даних із такими специфікаціями: Навчальний набір даних з 193 176 зразками з 2821 позитивом Тестовий набір даних із 82 887 зразків із 673 позитивними Є 10 функцій. Я хочу виконати двійкову класифікацію (0 або 1). Проблема, з якою я стикаюся, полягає в тому, що дані дуже …

1
Тепла карта на карті в Python
У режимі Analytics є приємна функція теплової карти ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Але це не сприятливо для порівняння карт (лише одна на звіт). Те, що вони дозволяють, - це легко перетягувати дані в обгорнуту зошит пітона. І тоді будь-яке зображення в python можна легко додати до звіту. Отже, моє запитання: як …

5
Чи сучасні бібліотеки R та / або Python роблять SQL застарілим?
Я працюю в офісі, де SQL Server є основою всього, що ми робимо, від обробки даних до очищення до розміщення. Мій колега спеціалізується на написанні складних функцій і збережених процедур, щоб методично обробляти вхідні дані, щоб вони могли бути стандартизовані та працювати в проектах звітів, візуалізації та аналітики. Перш ніж …
14 python  r  data-cleaning  data  sql 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.