Запитання з тегом «pandas-groupby»

Використовується для групування змінних разом на основі заданої умови. І лише для використання для бібліотеки `pandas`

9
Перетворення результатів групи Pandas GroupBy із Series у DataFrame
Я починаю з таких вхідних даних df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Що при друкуванні відображається так: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 …

7
Отримайте статистику для кожної групи (наприклад, кількість, середнє значення тощо) за допомогою pandas GroupBy?
У мене є кадр даних, dfі я використовую кілька його стовпців для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Вищенаведеним способом я майже отримую потрібну мені таблицю (кадр даних). Не вистачає додаткового стовпця, який містить кількість рядків у кожній групі. Іншими словами, я маю на увазі, але я також хотів би знати, скільки було використано …

2
Як зібрати кадр даних
Що таке стрижень? Як зробити шарнір? Це стрижень? Довгий формат до широкого формату? Я бачив безліч питань, які задають питання про зведені таблиці. Навіть якщо вони не знають, що запитують про зведені таблиці, вони зазвичай є. Написати канонічне запитання та відповідь практично неможливо, що охоплює всі аспекти повороту…. ... Але …

11
Як згрупувати рядки фреймів даних у список у групах панд?
У мене є кадр даних панди на dfзразок: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу згрупувати за першим стовпцем і отримати другий стовпчик у вигляді списків у рядках : A [1,2] B [5,5,4] C [6] Чи можливо зробити щось подібне, використовуючи …

11
Отримайте рядки, які мають максимальну кількість у групах, що використовують groupby
Як знайти групи рядків у фреймі даних панди, які мають максимальне значення для countстовпця, після групування за ['Sp','Mt']стовпцями? Приклад 1: наступні рамки даних, за якими я групую ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 …

5
Як отримати доступ до груп даних панди за допомогою ключа даних
Як я можу отримати доступ до відповідного фрейму даних groupby в об'єкті groupby за допомогою ключа? З наступною групою: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я можу повторити його, щоб отримати ключі та групи: In [11]: for …

9
колонки pandas GroupBy зі значеннями NaN (відсутні)
У мене є DataFrame з багатьма відсутніми значеннями в стовпцях, які я хочу згрупувати: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} подивіться, що Pandas скинув рядки з цільовими значеннями NaN. (Я …

3
Кілька агрегацій одного і того ж стовпця за допомогою pandas GroupBy.agg ()
Чи існує вбудований спосіб панд застосувати дві різні функції агрегування f1, f2до одного стовпця df["returns"], не потребуючи виклику agg()кілька разів? Приклад фрейму даних: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

10
GroupBy за допомогою pandas DataFrame і виберіть найбільш поширене значення
У мене є кадр даних із трьома рядковими стовпцями. Я знаю, що єдине значення в 3-му стовпці є дійсним для кожної комбінації перших двох. Для очищення даних мені доводиться групувати за фреймом даних за першими двома стовпцями та вибирати найбільш поширене значення третього стовпця для кожної комбінації. Мій код: import …

4
Об’єднайте рядки з декількох рядків за допомогою Pandas groupby
Я хочу об'єднати кілька рядків у фреймі даних на основі згрупованого в Pandas. Наразі це мій код: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) # add …

4
група кадрів даних pandas за датою та місяцем
Розглянемо файл csv: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Я можу прочитати це та переформатувати стовпець дати у формат datetime: b=pd.read_csv('b.dat') b['date']=pd.to_datetime(b['date'],format='%m/%d/%y …

9
Панди: заповнення відсутніх значень середнім значенням у кожній групі
Це має бути просто, але найближчим, що я знайшов, є цей пост: pandas: Заповнення відсутніх значень у групі , і я все ще не можу вирішити свою проблему .... Припустимо, у мене є такий фрейм даних df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', …

2
Як створити новий стовпець з виводу pandas groupby (). Sum ()?
Спроба створити новий стовпець з groupbyрозрахунку. У наведеному нижче коді я отримую правильні обчислені значення для кожної дати (див. Групу нижче), але коли я намагаюся створити новий стовпець ( df['Data4']) з ним, я отримую NaN. Тому я намагаюся створити новий стовпець у фреймі даних із сумою Data3всіх дат і застосувати …


2
Як знайти найвищі N мінімальних значень у DataFrame, Python-3
У мене нижче Dataframe з полем "Age", потреби знаходять верхній 3 мінімальний вік від DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Хочете двох найкращих віків, тобто 18, 23 у списку, як цього досягти? …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.