У мене є фрейм даних з повторюваними значеннями у стовпці А. Я хочу скинути дублікати, зберігаючи рядок з найвищим значенням у стовпці B.
Отже це:
A B
1 10
1 20
2 30
2 40
3 10
Слід перетворитись на це:
A B
1 20
2 40
3 10
Уес додав кілька приємних функцій для видалення дублікатів: http://wesmckinney.com/blog/?p=340 . Але AFAICT, він розроблений для точних дублікатів, тому немає жодних згадок про критерії вибору, які рядки зберігатимуться.
Я здогадуюсь, мабуть, простий спосіб зробити це --- можливо так просто, як сортування фрейму даних перед тим, як скидати дублікати ---, але я не знаю внутрішньої логіки groupby досить добре, щоб це зрозуміти. Будь-які пропозиції?