Я шукаю спосіб зробити еквівалент SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
Порівняння pandas sql не має нічого distinct
.
.unique()
працює лише для одного стовпця, тож я гадаю, що я міг би конкретизувати стовпці, або помістити їх у список / кортеж і порівняти це, але це здається, що щось має робити панди більш рідним способом.
Я пропускаю щось очевидне, чи немає способу це зробити?
df.apply(pd.Series.unique)
цього, але це не спрацює, якщо кількість унікальних значень змінюється в стовпцях, тож вам доведеться побудувати дикт із імен стовпців як ключових, а унікальних - як значень