Один із способів полягає у зворотному сортуванні даних та використанні duplicated
для скидання всіх дублікатів. Для мене цей метод концептуально простіший, ніж застосовуються ті, які застосовують. Я думаю, що це має бути дуже швидким.
# Some data to start with:
z <- data.frame(id=c(1,1,2,2,3,4),var=c(2,4,1,3,5,2))
# id var
# 1 2
# 1 4
# 2 1
# 2 3
# 3 5
# 4 2
# Reverse sort
z <- z[order(z$id, z$var, decreasing=TRUE),]
# id var
# 4 2
# 3 5
# 2 3
# 2 1
# 1 4
# 1 2
# Keep only the first row for each duplicate of z$id; this row will have the
# largest value for z$var
z <- z[!duplicated(z$id),]
# Sort so it looks nice
z <- z[order(z$id, z$var),]
# id var
# 1 4
# 2 3
# 3 5
# 4 2
Редагувати: Я щойно зрозумів, що зворотне сортування вище навіть не потрібно сортувати id
. Ви можете просто використовувати z[order(z$var, decreasing=TRUE),]
замість цього, і він буде працювати так само добре.
Ще одна думка ... Якщо var
стовпець чисельний, то існує простий спосіб сортування так, що id
є висхідним, але var
спадаючим. Це виключає потребу в сортуванні наприкінці (припускаючи, що ви навіть хотіли, щоб він був відсортований).
z <- data.frame(id=c(1,1,2,2,3,4),var=c(2,4,1,3,5,2))
# Sort: id ascending, var descending
z <- z[order(z$id, -z$var),]
# Remove duplicates
z <- z[!duplicated(z$id),]
# id var
# 1 4
# 2 3
# 3 5
# 4 2