Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

9
Панди: заповнення відсутніх значень середнім значенням у кожній групі
Це має бути просто, але найближчим, що я знайшов, є цей пост: pandas: Заповнення відсутніх значень у групі , і я все ще не можу вирішити свою проблему .... Припустимо, у мене є такий фрейм даних df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', …

1
Часовий ряд Pandas складає графік встановлення головних та другорядних галочок та міток осі х
Я хочу мати можливість встановити великі та другорядні xticks та їх мітки для графіку часового ряду, побудованого з об'єкта часового ряду Pandas. На сторінці Pandas 0.9 "Що нового" сказано: "Ви можете використовувати to_pydatetime або зареєструвати конвертер для типу Timestamp" але я не можу зрозуміти, як це зробити, щоб я міг …

5
Створіть більше однієї діаграми в одній комірці IPython Notebook
Я запустив свій блокнот IPython з ipython notebook --pylab inline Це мій код в одній комірці df['korisnika'].plot() df['osiguranika'].plot() Це працює нормально, він намалює дві лінії, але на тій самій діаграмі. Я хотів би намалювати кожен рядок на окремій діаграмі. І було б чудово, якби таблиці стояли поруч, а не одна …


3
Pandas: як змінити всі значення стовпця?
У мене є кадр даних із стовпчиком, який називається, "Date"і хочу, щоб усі значення з цього стовпця мали однакове значення (лише рік). Приклад: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 Я хочу: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 Ось мій код: fr61_70xls = …

3
Як видалити стовпець, який містить лише нулі в Pandas?
На даний момент у мене є фрейм даних, що складається зі стовпців із значеннями 1 та 0, я хотів би переглядати стовпці та видаляти ті, що складаються лише з 0. Ось те, що я намагався до цього часу: ones = [] zeros = [] for year in years: for i …
87 python  pandas 

5
Видаліть рядки, що містять порожні клітинки, з pandas DataFrame
У мене є, pd.DataFrameякий був створений шляхом аналізу деяких таблиць Excel. Стовпець якого має порожні клітинки. Наприклад, нижче наведено вихідні дані для частоти цього стовпця, 32320 записів мають відсутні значення для Tenant . >>> value_counts(Tenant, normalize=False) 32320 Thunderhead 8170 Big Data Others 5700 Cloud Cruiser 5700 Partnerpedia 5700 Comcast 5700 …
87 python  pandas 

1
Застосувати функцію до кожної комірки в DataFrame
У мене є кадр даних, який може виглядати так: A B C foo bar foo bar bar foo foo bar Я хочу переглянути кожен елемент кожного рядка (або кожен елемент кожного стовпця) і застосувати наступну функцію, щоб отримати наступний DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar …

5
Змістити стовпець у фреймі даних панд вгору на одиницю?
У мене є фрейм даних pandas. Я хочу "відставати" від однієї зі своїх колонок. Це означає, наприклад, зміщення всього стовпця 'gdp' вгору на одиницю, а потім видалення всіх надлишкових даних внизу решти рядків, щоб усі стовпці знову мали однакову довжину. df = y gdp cap 0 1 2 5 1 …

13
ValueError: numpy.dtype має неправильний розмір, спробуйте перекомпілювати
Я щойно встановив пакет pandas і statsmodels на моєму python 2.7. Коли я спробував «імпортувати pand як pd», з’являється це повідомлення про помилку. Хто-небудь може допомогти? Дякую!!! numpy.dtype has the wrong size, try recompiling Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\analytics\ext\python27\lib\site-packages\statsmodels-0.5.0-py2.7-win32.egg\statsmodels\formula\__init__.py", line 4, in …

9
Як зберегти новий аркуш у існуючому файлі Excel за допомогою Pandas?
Я хочу використовувати файли Excel для зберігання даних, розроблених за допомогою python. Моя проблема полягає в тому, що я не можу додавати аркуші до існуючого файлу Excel. Тут я пропоную зразок коду для роботи, щоб вирішити цю проблему import pandas as pd import numpy as np path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" x1 …

3
вилучення днів із значення numpy.timedelta64
Я використовую pandas / python, і у мене є два часові ряди дат s1 і s2, які були сформовані за допомогою функції 'to_datetime' у полі df, що містить дати / час. Коли я віднімаю s1 від s2 s3 = s2 - s1 Я отримую серію типу s3 timedelta64 [ns] 0 …
86 python  numpy  pandas 

1
Сіборн показує наукові позначення в тепловій карті для 3-значних чисел
Я створюю теплову карту із зведеної таблиці панд, як показано нижче: table2 = pd.pivot_table(df,values='control',columns='Year',index='Region',aggfunc=np.sum) sns.heatmap(table2,annot=True,cmap='Blues') Він створює теплову карту, як показано нижче. Ви можете бачити, що цифри не величезні (макс. 750), але це показує їх у наукових позначеннях. Якщо я переглядаю саму таблицю, це не так. Будь-яка ідея про те, …

8
Розділіть великий фрейм даних панд
У мене великий фрейм даних із 423244 рядками. Я хочу поділити це на 4. Я спробував наступний код, який дав помилку?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item Як розділити цей кадр даних на 4 групи?
86 python  pandas 

9
Як писати в нижньому регістрі рядок стовпця кадру даних pandas, якщо в ньому відсутні значення?
Наступний код не працює. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) Як мені його налаштувати, щоб отримати xLower = ['one', 'two', np.nan]? Ефективність важлива, оскільки реальний фрейм даних величезний.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.