Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

8
Використовуйте .corr, щоб отримати кореляцію між двома стовпцями
У мене є такий фрейм даних Top15: Я створюю стовпець, в якому оцінюється кількість посилаються документів на людину: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Я хочу знати співвідношення між кількістю цінних документів на душу населення та енергопостачанням на …

3
Кілька агрегацій одного і того ж стовпця за допомогою pandas GroupBy.agg ()
Чи існує вбудований спосіб панд застосувати дві різні функції агрегування f1, f2до одного стовпця df["returns"], не потребуючи виклику agg()кілька разів? Приклад фрейму даних: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

10
Як я можу отримати список всіх повторюваних елементів, використовуючи панди в python?
У мене є список товарів, які, ймовірно, мають деякі проблеми з експортом. Я хотів би отримати список повторюваних елементів, щоб я міг їх порівнювати вручну. Коли я намагаюся використовувати дублюваний метод панд , він повертає лише перший дублікат. Чи є спосіб отримати всі дублікати, а не лише перший? Невеликий підрозділ …

14
Як показати ім'я всіх стовпців у фреймі даних pandas?
У мене є фрейм даних, який складається з сотні стовпців, і мені потрібно побачити всі імена стовпців. Що я зробив: In[37]: data_all2.columns Вихід: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) Як показати всі …
127 python  pandas  dataframe  show 

6
Як зберегти індекс при використанні злиття панд
Я хотів би об'єднати два DataFramesта зберегти індекс із першого кадру як індекс на зведеному наборі даних. Однак, коли я зливаю, отриманий DataFrame має цілий індекс. Як я можу вказати, що я хочу зберегти індекс у лівому кадрі даних? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2, 'c': 3}, …
126 python  pandas 

4
Дати часу в пандах read_csv
Я читаю у файлі csv з кількома колонками дати. Мені потрібно встановити типи даних після читання у файлі, але часові дати видаються проблемою. Наприклад: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Коли запуск видає помилку: TypeError: тип даних "datetime" не …

9
Панни python видаляють повторювані стовпці
Який найпростіший спосіб видалити повторювані стовпці з фрейму даних? Я читаю текстовий файл з повторюваними стовпцями через: import pandas as pd df=pd.read_table(fname) Назви стовпців: Time, Time Relative, N2, Time, Time Relative, H2, etc... Усі стовпці часу та часу містять однакові дані. Я хочу: Time, Time Relative, N2, H2 Усі мої …
126 python  pandas 

4
Як сформувати стовпчик кортежу з двох стовпців у Пандах
У мене є DataFrame Pandas, і я хочу поєднати стовпці "lat" і "long", щоб сформувати кортеж. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …

7
Як оцінити, скільки пам'яті знадобиться DataFrame Pandas?
Мені було цікаво ... Якщо я читаю, скажімо, файл csv 400 Мб у кадр даних панди (використовуючи read_csv або read_table), чи є можливість підрахувати, скільки пам'яті знадобиться? Просто намагаюся краще відчути фрейми даних та пам'ять ...
125 python  pandas 

2
Як створити DataFrame з випадкових цілих чисел за допомогою Pandas?
Я знаю, що якщо я буду використовувати randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) дає мені те, що я шукаю, але з елементами звичайного розподілу. Але що робити, якщо я просто хотів випадкових цілих чисел? randintпрацює, надаючи діапазон, але не масив, як randnце …

6
Умовно замініть панди
У мене є DataFrame, і я хочу замінити значення в певному стовпці, що перевищує значення на нуль. Я думав, що це спосіб досягти цього: df[df.my_channel > 20000].my_channel = 0 Якщо я скопіюю канал у новий кадр даних, це просто: df2 = df.my_channel df2[df2 > 20000] = 0 Це робить саме …


3
Знайдіть ім’я стовпця, яке має максимальне значення для кожного рядка
У мене є така DataFrame, як ця: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Тут я хочу запитати, як отримати ім'я стовпця, …
122 python  pandas  dataframe  max 

8
Як додати декілька стовпців до кадру даних панд в одному призначенні?
Я новачок у пандах і намагаюся зрозуміти, як додати декілька стовпців до панд одночасно. Будь-яка допомога тут цінується. В ідеалі я хотів би зробити це одним кроком, а не декількома повторними кроками ... import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]} df …
122 python  pandas  dataframe 

3
отримання індексу рядка в застосуванні функції панди
Я намагаюся отримати доступ до індексу рядка у функції, застосованій у цілому DataFrameв Pandas. У мене є щось подібне: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 і я визначу функцію, яка отримує доступ до елементів із заданим рядком def rowFunc(row): …
121 python  pandas  dataframe 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.