Ця pandas
drop_duplicates
функція чудово підходить для «уніфікації» фрейму даних. Тим НЕ менше, один з іменованих аргументів , щоб передати це take_last=True
або take_last=False
, в той час як я хотів би, щоб видалити всі рядки , які дублюють через підмножина стовпців. Чи можливо це?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
Як приклад, я хотів би опустити рядки, які відповідають стовпцям, A
і C
таким чином слід випустити рядки 0 і 1.