У мене є такий кадр даних:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
Дзвінок
In [10]: print df.groupby("A")["B"].sum()
повернеться
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
Тепер я хотів би зробити "те саме" для стовпця "C". Оскільки цей стовпець містить рядки, sum () не працює (хоча ви можете подумати, що він об'єднав би рядки). Те, що я дуже хотів би побачити, - це список або набір рядків для кожної групи, тобто
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
Я намагався знайти способи це зробити.
Series.unique () ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html ) не працює, хоча
df.groupby("A")["B"]
це
pandas.core.groupby.SeriesGroupBy object
тому я сподівався, що будь-який метод серії буде спрацьовувати. Будь-які ідеї?
apply
іlambda
. Я прийшов сюди, цікавлячись, чомуpandas
насправді конкрети і не повернути помилку підсумовування рядків.