Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

10
панди отримують середній / середній стовпчик
Я не можу отримати середнє значення або середнє значення стовпця в пандах. А є фрейм даних. Жодне з речей, які я спробував нижче, не дає мені середнього значення стовпцяweight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033 1963 1.3123124 3 624870 1987 0.94212 …
155 python  pandas 



5
Як отримати доступ до груп даних панди за допомогою ключа даних
Як я можу отримати доступ до відповідного фрейму даних groupby в об'єкті groupby за допомогою ключа? З наступною групою: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я можу повторити його, щоб отримати ключі та групи: In [11]: for …

10
Знайдіть індекс елемента в серії pandas
Я знаю, що це дуже основне питання, але я чомусь не можу знайти відповідь. Як я можу отримати індекс певного елемента серії в пандах python? (перше виникнення буде достатньо) Тобто, мені б хотілося чогось типу: import pandas as pd myseries = pd.Series([1,4,0,7,5], index=[0,1,2,3,4]) print myseries.find(7) # should output 3 Безумовно, …
154 python  pandas 

3
Логічні оператори для булевої індексації в Pandas
Я працюю з булевим індексом у Pandas. Питання, чому твердження: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] добре працює тоді a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] виходить із помилкою? Приклад: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …



8
Чи можуть панди автоматично розпізнавати дати?
Сьогодні я був позитивно здивований тим фактом, що під час читання даних із файлу даних (наприклад) панди здатні розпізнавати типи значень: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Наприклад, це можна перевірити таким чином: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) Зокрема цілі числа, поплавці та рядки були розпізнані правильно. …
151 python  date  types  dataframe  pandas 

3
Панди створюють порожні DataFrame з лише іменами стовпців
У мене є динамічний DataFrame, який працює чудово, але коли немає даних, які потрібно додати до DataFrame, я отримую помилку. І тому мені потрібно рішення створити порожній DataFrame з лише назвами стовпців. Наразі у мене є щось подібне: df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. …
151 python  pandas  dataframe 

12
Заміна порожніх значень (пробіл) на NaN у пандах
Я хочу знайти всі значення у фреймі даних Pandas, які містять пробіл (будь-яку довільну кількість) і замінити ці значення NaN. Будь-які ідеї, як це можна вдосконалити? В основному я хочу перетворити це: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz …
150 python  pandas  dataframe 

6
Ефективний спосіб застосувати декілька фільтрів до панд DataFrame або Series
У мене є сценарій, коли користувач хоче застосувати кілька фільтрів до об'єкта Pandas DataFrame або Series. По суті, я хочу ефективно зв'язати купу фільтруючих (порівняльних операцій) разом, які задаються користувачем під час виконання. Фільтри повинні бути добавками (але кожен застосований повинен звужувати результати). Зараз я використовую, reindex()але це створює новий …
148 python  algorithm  pandas 

14
Відсоток панди від загальної групи
Це, очевидно, просто, але, як онімілий новач, я застрягаю. У мене є файл CSV, який містить 3 стовпці, штат, ідентифікатор Office та продажі для цього офісу. Я хочу підрахувати відсоток продажів за офіс у даному стані (загальний обсяг усіх відсотків у кожному штаті - 100%). df = pd.DataFrame({'state': ['CA', 'WA', …
148 python  pandas 

4
Панди python: застосувати функцію з аргументами до ряду
Я хочу застосувати функцію з аргументами до ряду в пандах python: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... Документація описує підтримку застосувати метод, але він не приймає ніяких аргументів. Чи є інший метод, який приймає аргументи? Як варіант, я пропускаю просте рішення? Оновлення (жовтень 2017 р.): Зауважте, що …
147 python  pandas  apply 

9
колонки pandas GroupBy зі значеннями NaN (відсутні)
У мене є DataFrame з багатьма відсутніми значеннями в стовпцях, які я хочу згрупувати: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} подивіться, що Pandas скинув рядки з цільовими значеннями NaN. (Я …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.