Запитання з тегом «python»

Використовуйте для наукових даних питання, пов'язані з мовою програмування Python. Не призначений для загальних питань кодування (-> stackoverflow).


3
Об’єднання декількох фреймів даних у рядку PySpark
У мене є кадри 10 даних pyspark.sql.dataframe.DataFrame, отриманих від , randomSplitяк (td1, td2, td3, td4, td5, td6, td7, td8, td9, td10) = td.randomSplit([.1, .1, .1, .1, .1, .1, .1, .1, .1, .1], seed = 100)зараз , я хочу приєднатися до 9 td«S в один кадр даних, як я повинен робити …

2
Помилка train_test_split (): Знайдено вхідні змінні з невідповідною кількістю зразків
Досить нова у Python, але будую мою першу модель РФ на основі деяких класифікаційних даних. Я перетворив усі мітки в числові дані int64 і завантажив у X і Y як масивний ряд, але я відчуваю помилку, коли намагаюся тренувати моделі. Ось як виглядають мої масиви: >>> X = np.array([[df.tran_cityname, df.tran_signupos, …

2
Керас проти тф.керас
Я трохи заплутався у виборі між Keras (keras-команди / keras) і tf.keras (tensorflow / tensorflow / пітон / keras /) для мого нового дослідницького проекту. Існує дискусія про те, що Керасу ніхто не належить, тому люди щасливіші, щоб внести свій внесок, і в майбутньому буде набагато легше керувати проектом. Сігналы …

1
Способи вирішення функції довготи / широти [закрито]
Закрито . Це питання потребує деталей або ясності . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Додайте деталі та уточніть проблему, відредагувавши цю публікацію . Закрито 3 роки тому . Я працюю над вигаданим набором даних з 25 функціями. Дві особливості - це широта та довгота місця, а інші …

3
Реалізація функції витрат Python в логістичній регресії: чому кратне множення в одному виразі, але елементарне множення в іншому
У мене дуже основне питання, яке стосується Python, нумерування та множення матриць при встановленні логістичної регресії. По-перше, дозвольте мені попросити вибачення за те, що не використовую математичні позначення. Мене плутає використання матричного множення крапок проти мультиплікаційного множення елементів. Функція витрат задається: І в python я написав це як cost = …

3
чи є інструмент для пристосування даних для python / pandas, подібний до інструменту R tidyr?
Я працюю над викликом Kaggle, де деякі змінні представлені рядками, а не стовпцями (Зрив мережі Telstra). Зараз я шукаю еквівалент збирання (), розділення () та поширення (), який можна знайти в інструменті R tidyr.

4
Гіперпараметр пошуку для LSTM-RNN за допомогою Keras (Python)
Із підручника Keras RNN: "RNN - складний. Вибір розміру партії важливий, вибір втрат та оптимізатор є критично важливими тощо. Деякі конфігурації не збігаються". Отже, це більш загальне питання про налаштування гіперпараметрів LSTM-RNN на Керасі. Я хотів би знати про підхід до пошуку найкращих параметрів для вашої RNN. Я почав із …

3
Функція вилучення зображень на Python
У своєму класі я повинен створити додаток, використовуючи два класифікатори, щоб вирішити, чи є об’єкт на зображенні прикладом phylum porifera (seasponge) чи яким-небудь іншим об'єктом. Однак я повністю втрачений, коли мова йде про техніку вилучення особливостей у python. Мій радник переконав мене використовувати зображення, які не були висвітлені в класі. …

4
Підвищити швидкість впровадження t-sne в python для величезних даних
Я хотів би зробити скорочення розмірності на майже 1 мільйон векторів кожних 200 вимірювань ( doc2vec). Я використовую для цього TSNEреалізацію з sklearn.manifoldмодуля, і головна проблема - складність у часі. Навіть при method = barnes_hutцьому швидкість обчислення залишається низькою. Деякий час навіть не вистачає пам'яті. Я працюю на 48-ядерному процесорі …

2
Рекомендовані фільми з додатковими функціями за допомогою спільної фільтрації
Я намагаюся побудувати систему рекомендацій за допомогою спільної фільтрації. У мене є звичайна [user, movie, rating]інформація. Я хотів би включити додаткову функцію, наприклад "мова" або "тривалість фільму". Я не впевнений, які методики я міг би використати для такої проблеми. Пропонуйте, будь ласка, посилання або пакети в python / R.

5
збільшують теплову карту для новонароджених
Я створюю corr()df з оригінального df. corr()ДФ вийшов 70 X 70 і неможливо уявити собі Heatmap ... sns.heatmap(df). Якщо я спробую відобразити corr = df.corr()таблицю, таблиця не відповідає екрану, і я бачу всі кореляції. Це спосіб або надрукувати весь, dfнезалежно від його розміру, або контролювати розмір теплової карти?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

4
Яка перевага розбиття файлу tfrecord на черепки?
Я працюю над розпізнаванням мовлення з Tensorflow і планую навчити LSTM NN з масивними наборами хвиль. Через підвищення продуктивності я планую використовувати tfrecords. В Інтернеті є кілька прикладів (Inception for ex.), Де файли tfrecords розбиті на фрагменти. Моє запитання: яка користь від створення файлів tfrecords в черепки? Чи є додаткове …

4
Зараз панди швидше, ніж data.table?
https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Базові показники data.table не оновлювалися з 2014 року. Я чув десь, що Pandasзараз швидше, ніж data.table. Це правда? Хтось робив якісь орієнтири? Я ніколи раніше не використовував Python, але розглядав би можливість перемикання, якщо pandasможна перемогти data.table?
17 python  r  pandas  data  data.table 

3
Шукаєте гарний пакет для виявлення аномалії у часових рядах
Чи є комплексний пакет із відкритим кодом (бажано в пітоні чи R), який можна використовувати для виявлення аномалії у часових рядах? Існує однокласний пакет SVM в scikit-learn, але це не для даних часових рядів. Я шукаю більш складні пакети, які, наприклад, використовують байєсівські мережі для виявлення аномалії.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.