Як сортувати один вектор на основі значень іншого


112

У мене є вектор x, який я хотів би сортувати на основі порядку значень у векторі y. Два вектори не однакової довжини.

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

Очікуваним результатом буде:

[1] 4 4 4 2 2 1 3 3 3

Відповіді:


70

Ось один лайнер ...

y[sort(order(y)[x])]

[ред .:] Це руйнується так:

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders

1
Це дуже лаконічно, але мені важко зрозуміти, що там відбувається. Не могли б ви трохи допрацювати?
Метт Паркер

3
Це досить і показує добре розуміння вбудованих R. +1
Годеке

6
Взагалі можна зробити це, навіть якщо y не є перестановка 1: length (y). У цьому випадку це рішення не працює, але рішення gd047 внизу, x [order (match (x, y))]) ", так і є.
Рахул Савані

5
Я насправді здивований, чому це має 40 оновлень. Не вдається стільки простих варіацій на xі y. x <- c(1,4,2); y <- c(1,2,4)наприклад.
thelatemail

1
@thelatemail Я згоден. Зупиніть божевілля і спростуйте цю відповідь!
Ian Fellows

185

як щодо цього

x[order(match(x,y))]

29
Це дуже приємно, краще, ніж прийнята відповідь ІМХО, оскільки вона більш загальна.
відмітка

2
Я б сказав, що це повинно бути в базі GNU-R.
катастрофа-невдача

Ця відповідь добре працювала для мене, коли я використовував символи для x та y. Додавання декомпозиції / невеликої розробки, як у прийнятій відповіді, було б непогано
mavericks

4

Ви можете перетворити xв упорядкований фактор:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

Очевидно, що зміна ваших чисел на фактори може докорінно змінити спосіб реагування коду нижче за течією x. Але оскільки ви не дали нам жодного контексту щодо того, що буде далі, я подумав, що запропоную це як варіант.


1
це має бути найкращою відповіддю, оскільки воно буде працювати для не цілих випадків; або також працювати, коли є значення в xне в сортувальному векторі yз незначною зміною:x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
rawr


2

Якщо вам потрібно замовити "y", незалежно від того, чи це цифри чи символи:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

По кроках:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

1

[ Редагувати: Ясно, що Іан має правильний підхід, але я залишу це для нащадків.]

Це можна зробити без циклів, індексуючи свій вектор y. Додайте до у зростаюче числове значення і об'єднайте їх:

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

0
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

Результат в z: 4 4 4 2 2 1 3 3 3

Важливі кроки:

  1. for (i in y) - петлі над цікавими елементами.

  2. z <- c (z, ...) - Зв'язує по черзі кожну суб-вираз

  3. rep (i, sum (x == i)) - Повторює i (поточний елемент, що цікавить) суму (x == i) разів (кількість разів, яку ми знайшли i в x).


0

Крім того, ви можете використовувати sqldfта виконувати joinфункцію за допомогою таких функцій sql:

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.