Я використовую панди як замінник db, оскільки у мене є кілька баз даних (oracle, mssql тощо), і я не в змозі скласти послідовність команд до еквівалента SQL.
У мене таблиця завантажена в DataFrame з деякими стовпцями:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
У SQL підрахувати кількість різних клієнтів на рік було б:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
І результат був би
201301 5000
201302 13245
Як я можу це зробити в пандах?
value_counts
можливо, відповідь, яку ви шукаєте: pandas.pydata.org/pandas-docs/stable/generated/…