Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

7
Вибір панд за міткою іноді повертає Серію, іноді повертає DataFrame
У Pandas, коли я вибираю мітку, яка має лише один запис в індексі, я повертаю серію, але коли я вибираю запис, який має більше одного запису, я отримую кадр даних. Чому так? Чи є спосіб забезпечити, щоб я завжди повертав фрейм даних? In [1]: import pandas as pd In [2]: …

3
Імпортувати стовпець кадру даних pandas як рядок, не int
Я хотів би імпортувати наступні csv як рядки, а не як int64. Pandas read_csv автоматично перетворює його на int64, але мені потрібен цей стовпець як рядок. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824 00013007854817840017963235 00013007854817840018860166 df = read_csv('sample.csv') df.ID >> 0 -9223372036854775808 1 -9223372036854775808 2 -9223372036854775808 3 -9223372036854775808 4 -9223372036854775808 5 …
97 python  pandas 

5
pandas read_csv та фільтруйте стовпці з використанням колі
У мене є файл CSV, який неправильно надходить, pandas.read_csvколи я фільтрую стовпці за допомогою usecolsі використовую кілька індексів. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f = open('foo.csv', 'w') f.write(csv) f.close() df1 = pd.read_csv('foo.csv', header=0, names=["dummy", "date", "loc", "x"], index_col=["date", "loc"], usecols=["dummy", "date", "loc", …

2
видалення рядків з фрейму даних на основі стану „не в“ [дублікат]
Тут вже є відповіді на це питання : Як фільтрувати фрейм даних Pandas за допомогою 'in' та 'not in', як у SQL (9 відповідей) Закрито 4 місяці тому . Я хочу скинути рядки з кадру даних pandas, коли значення стовпця дати є у списку дат. Наступний код не працює: a=['2015-01-01' …
97 python  pandas 


4
Як побудувати два стовпці кадру даних панд за допомогою точок?
У мене є фрейм даних pandas, і я хотів би побудувати значення з одного стовпця порівняно зі значеннями з іншого стовпця. На щастя, існує plotметод, пов’язаний з фреймами даних, який, здається, робить те, що мені потрібно: df.plot(x='col_name_1', y='col_name_2') На жаль, схоже, серед стилів сюжету (перелічених тут після kindпараметра) немає пунктів. …

4
Рядки в DataFrame, але dtype є об'єктом
Чому Пандас каже мені, що у мене є об'єкти, хоча кожен елемент у вибраному стовпці є рядком - навіть після явного перетворення. Це мій DataFrame: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values …
96 python  pandas  numpy  types  series 

5
Як я можу зробити заголовки стовпців кадру даних pandas малими?
Я хочу зробити усі заголовки стовпців у моєму фреймі даних pandas малими літерами Приклад Якщо я маю: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Я хотів би змінити XRAT на …

6
Чи є у індрів панд проблеми з продуктивністю?
Я помітив дуже низьку продуктивність при використанні стрілок із панд. Це те, що переживають інші? Це специфічно для ітерацій і чи слід уникати цієї функції для даних певного розміру (я працюю з 2-3 мільйонами рядків)? Ця дискусія на GitHub привела мене до думки, що це спричинено змішуванням dтипів у фреймі …

13
Перелічити найвищі пари кореляції з великої кореляційної матриці у панд?
Як знайти найкращі кореляції в кореляційній матриці з Пандами? Є багато відповідей про те, як це зробити за допомогою R ( Показати кореляції як упорядкований список, а не як велику матрицю або Ефективний спосіб отримати висококорельовані пари з великого набору даних у Python або R ), але мені цікаво, як …

6
Як обертати мітки галочок на осі х на штанговій площі Pandas
З таким кодом: import matplotlib matplotlib.style.use('ggplot') import matplotlib.pyplot as plt import pandas as pd df = pd.DataFrame({ 'celltype':["foo","bar","qux","woz"], 's1':[5,9,1,7], 's2':[12,90,13,87]}) df = df[["celltype","s1","s2"]] df.set_index(["celltype"],inplace=True) df.plot(kind='bar',alpha=0.75) plt.xlabel("") Я зробив цей сюжет: Як я можу повернути мітки галочок на осі х на 0 градусів? Я спробував додати це, але не вдалося: plt.set_xticklabels(df.index,rotation=90)

2
Оновіть значення рядків там, де певна умова виконується в пандах
Скажімо, у мене є такий фрейм даних: Який найефективніший спосіб оновити значення стовпців feat та another_feat, де потік номер 2 ? Це це? for index, row in df.iterrows(): if df1.loc[index,'stream'] == 2: # do something ОНОВЛЕННЯ: Що робити, якщо у мене більше 100 стовпців? Я не хочу чітко називати стовпці, …

5
Як я можу фільтрувати рядки під навантаженням у функції Pandas read_csv?
Як я можу відфільтрувати, які рядки CSV завантажуються в пам’ять за допомогою панд? Це здається варіантом, який слід знайти read_csv. Мені чогось не вистачає? Приклад: у нас CSV із стовпчиком позначки часу, і ми хотіли б завантажити лише ті рядки, які з позначкою часу перевищують задану константу.
95 python  pandas 

5
Додавання міток значень на гістограму matplotlib
Я застряг у чомусь, що, здається, має бути відносно легким. Код, який я наводжу нижче, є зразком на основі більш масштабного проекту, над яким я працюю. Я не бачив підстав розміщувати всі деталі, тому, будь ласка, прийміть структури даних, які я надаю, як є. По суті, я створюю стовпчасту діаграму, …

5
Додати стовпець у фрейм даних зі списку
У мене є фрейм даних із такими стовпцями: A B C 0 4 5 6 7 7 6 5 Можливий діапазон значень в межах від 0 до 7 . Крім того, у мене є список з 8 таких елементів: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Якщо елемент …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.