Сортування списку на основі значень з іншого списку?


369

У мене є список таких рядків:

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,   0,   1,   2,   2,   0,   1 ]

Який найкоротший спосіб сортування X за допомогою значень Y, щоб отримати наступний вихід?

["a", "d", "h", "b", "c", "e", "i", "f", "g"]

Порядок елементів, що мають однаковий «ключ», значення не має. Я можу вдатися до використання forконструкцій, але мені цікаво, якщо є коротший шлях. Будь-які пропозиції?


Відповідь riza може бути корисною при побудові даних, оскільки zip (* сортовано (zip (X, Y), ключ = пара лямбда: пара [0])) повертає як відсортовані X, так і Y, відсортовані зі значеннями X.
jojo

Відповіді:


479

Найкоротший код

[x for _,x in sorted(zip(Y,X))]

Приклад:

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

Z = [x for _,x in sorted(zip(Y,X))]
print(Z)  # ["a", "d", "h", "b", "c", "e", "i", "f", "g"]

Загалом

[x for _, x in sorted(zip(Y,X), key=lambda pair: pair[0])]

Пояснили:

  1. zipдва listс.
  2. створити новий, відсортований listна основі zipвикористання sorted().
  3. за допомогою списку розуміння витягнути перші елементи кожної пари з відсортованого, блискавичного list.

Для отримання додаткової інформації про те, як встановити \ використовувати keyпараметр, а також sortedфункцію взагалі, погляньте на це .



117
Це правильно, але я додам зауваження, що якщо ви намагаєтесь сортувати декілька масивів за одним і тим же масивом, це не обов'язково спрацює, як очікувалося, оскільки ключ, який використовується для сортування, є (y, x) , а не лише у. Натомість слід використовувати [x for (y, x) у сортованому (zip (Y, X), key = пара лямбда: пара [0])]
gms7777

1
гарне рішення! Але так має бути: Список упорядкований щодо першого елемента пар, і розуміння витягує "другий" елемент пар.
MasterControlProgram

Це рішення погано, якщо мова йде про зберігання. Сорт на місці бажаний, коли це можливо.
Hatefiend

107

Складайте два списки разом, сортуйте їх, а потім візьміть потрібні частини:

>>> yx = zip(Y, X)
>>> yx
[(0, 'a'), (1, 'b'), (1, 'c'), (0, 'd'), (1, 'e'), (2, 'f'), (2, 'g'), (0, 'h'), (1, 'i')]
>>> yx.sort()
>>> yx
[(0, 'a'), (0, 'd'), (0, 'h'), (1, 'b'), (1, 'c'), (1, 'e'), (1, 'i'), (2, 'f'), (2, 'g')]
>>> x_sorted = [x for y, x in yx]
>>> x_sorted
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

Об’єднайте їх разом, щоб отримати:

[x for y, x in sorted(zip(Y, X))]

1
Це добре, якщо Xце список str, але будьте обережні, якщо є можливість, яка <не визначена для деяких пар предметів X, наприклад, - якщо деякі з них булиNone
Джон Ла Руй

1
Коли ми намагаємось використовувати сортування по об'єкту zip, AttributeError: 'zip' object has no attribute 'sort'я зараз отримую те, що я отримую.
Еш Упадхей

2
Ви використовуєте Python 3. У Python 2, zip створив список. Тепер він виробляє ітерабельний об’єкт. sorted(zip(...))повинні ще працювати, або: them = list(zip(...)); them.sort()
Нед Батчелдер,

77

Крім того, якщо ви не заперечуєте з використанням numpy масивів (або насправді вже мають справу з numpy масивами ...), ось ще одне приємне рішення:

people = ['Jim', 'Pam', 'Micheal', 'Dwight']
ages = [27, 25, 4, 9]

import numpy
people = numpy.array(people)
ages = numpy.array(ages)
inds = ages.argsort()
sortedPeople = people[inds]

Я знайшов це тут: http://scienceoss.com/sort-one-list-by-another-list/


1
Для більших масивів / векторів це рішення з numpy є вигідним!
MasterControlProgram

1
Якщо вони вже нудні масиви, то це просто sortedArray1= array1[array2.argsort()]. Це також полегшує сортування декількох списків за певним стовпцем 2D масиву: наприклад, sortedArray1= array1[array2[:,2].argsort()]для сортування масиву1 (який може мати кілька стовпців) за значеннями у третьому стовпці масиву2.
Аарон Брамсон

40

Найбільш очевидне рішення для мене - використовувати keyключове слово arg.

>>> X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
>>> Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]
>>> keydict = dict(zip(X, Y))
>>> X.sort(key=keydict.get)
>>> X
['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

Зауважте, що ви можете скоротити це до однолінійного, якщо вам потрібно:

>>> X.sort(key=dict(zip(X, Y)).get)

2
Чи вимагає цього, щоб значення в X були нерівними?
Джек Пен

15

Справді я прийшов сюди, шукаючи сортувати список за списком, за яким співпадали значення.

list_a = ['foo', 'bar', 'baz']
list_b = ['baz', 'bar', 'foo']
sorted(list_b, key=lambda x: list_a.index(x))
# ['foo', 'bar', 'baz']

1
Це виконавець?
AFP_555

Ніякої підказки. Повідомте про те, що знайдете.
nackjicholson

1
Це погана ідея. indexздійснить пошук O (N) за list_aрезультатами O(N² log N)сортування.
Річард

Спасибі, не робіть цього, коли продуктивність має значення!
nackjicholson

15

more_itertools має інструмент для сортування ітерабелів паралельно:

Дано

from more_itertools import sort_together


X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

Демо

sort_together([Y, X])[1]
# ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')

13

Мені подобається мати список відсортованих індексів. Таким чином, я можу сортувати будь-який список у тому ж порядку, що і список джерел. Після того, як у вас є список відсортованих індексів, просте розуміння списку зробить трюк:

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

sorted_y_idx_list = sorted(range(len(Y)),key=lambda x:Y[x])
Xs = [X[i] for i in sorted_y_idx_list ]

print( "Xs:", Xs )
# prints: Xs: ["a", "d", "h", "b", "c", "e", "i", "f", "g"]

Зауважте, що відсортований список індексів також можна отримати за допомогою numpy.argsort().


12

Ще одна альтернатива - поєднання декількох відповідей.

zip(*sorted(zip(Y,X)))[1]

Для того, щоб працювати на python3:

list(zip(*sorted(zip(B,A))))[1]

7

zip, сортувати за другим стовпцем, повернути перший стовпець.

zip(*sorted(zip(X,Y), key=operator.itemgetter(1)))[0]

Примітка: ключ = operator.itemgetter (1) вирішує проблему, що повторюється
Кіт

zip не можна підписати ... Ви фактично повинні користуватисяlist(zip(*sorted(zip(X,Y), key=operator.itemgetter(1))))[0]
raphael

@Keith яка дублікат?
Джош

Якщо зустрічається більше одного, він отримує перший
Кіт

3

Швидкий однолінійний.

list_a = [5,4,3,2,1]
list_b = [1,1.5,1.75,2,3,3.5,3.75,4,5]

Скажіть, ви хочете, щоб список a відповідав списку b.

orderedList =  sorted(list_a, key=lambda x: list_b.index(x))

Це корисно, коли потрібно замовити менший список для значень більших розмірів. Якщо припустити, що більший список містить усі значення в меншому списку, це можна зробити.


Це не вирішує питання ОП. Ви спробували це зі зразками списків Xі Y?
Aryeh Leib Taurog

Це погана ідея. indexздійснить пошук O (N) за list_bрезультатами O(N² log N)сортування.
Річард

1

Ви можете створити pandas Series, використовуючи основний список як dataта інший список як index, а потім просто сортувати за індексом:

import pandas as pd
pd.Series(data=X,index=Y).sort_index().tolist()

вихід:

['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

1

Ось відповідь Whatangs, якщо ви хочете отримати обидва відсортовані списки (python3).

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,    0,   1,   2,   2,   0,   1]

Zx, Zy = zip(*[(x, y) for x, y in sorted(zip(Y, X))])

print(list(Zx))  # [0, 0, 0, 1, 1, 1, 1, 2, 2]
print(list(Zy))  # ['a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g']

Пам'ятайте лише, що Zx і Zy - кортежі. Я також блукаю, чи є кращий спосіб зробити це.

Попередження: Якщо ви запускаєте його з порожніми списками, він виходить з ладу.


1

Я створив більш загальну функцію, яка сортує більше двох списків на основі іншого, натхненного відповіддю @ Whatang.

def parallel_sort(*lists):
    """
    Sorts the given lists, based on the first one.
    :param lists: lists to be sorted

    :return: a tuple containing the sorted lists
    """

    # Create the initially empty lists to later store the sorted items
    sorted_lists = tuple([] for _ in range(len(lists)))

    # Unpack the lists, sort them, zip them and iterate over them
    for t in sorted(zip(*lists)):
        # list items are now sorted based on the first list
        for i, item in enumerate(t):    # for each item...
            sorted_lists[i].append(item)  # ...store it in the appropriate list

    return sorted_lists

0
list1 = ['a','b','c','d','e','f','g','h','i']
list2 = [0,1,1,0,1,2,2,0,1]

output=[]
cur_loclist = []

Щоб отримати унікальні цінності в list2

list_set = set(list2)

Щоб знайти місце індексу в list2

list_str = ''.join(str(s) for s in list2)

Розташування індексу в list2відстежується за допомогоюcur_loclist

[0, 3, 7, 1, 2, 4, 8, 5, 6]

for i in list_set:
cur_loc = list_str.find(str(i))

while cur_loc >= 0:
    cur_loclist.append(cur_loc)
    cur_loc = list_str.find(str(i),cur_loc+1)

print(cur_loclist)

for i in range(0,len(cur_loclist)):
output.append(list1[cur_loclist[i]])
print(output)

0

Це давнє запитання, але деякі відповіді, які я бачу, опубліковані насправді не працюють, тому що zipце не можливо. Інші відповіді не турбувались import operatorта надайте тут більше інформації про цей модуль та його переваги.

Для цієї проблеми є щонайменше дві хороші фразеології. Починаючи з наведеного вами прикладу:

X = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
Y = [ 0,   1,   1,   0,   1,   2,   2,   0,   1 ]

Використання ідіоми " Прикрасити-сортувати-підкреслити "

Це також відоме під назвою " Шварцзіанський транспорт" після Р. Шварца, який популяризував цю модель в Перлі в 90-х роках:

# Zip (decorate), sort and unzip (undecorate).
# Converting to list to script the output and extract X
list(zip(*(sorted(zip(Y,X)))))[1]                                                                                                                       
# Results in: ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')

Зауважимо, що в цьому випадку Yі Xсортуються та порівнюються лексикографічно. Тобто перші пункти (з Y) порівнюються; і якщо вони однакові X, порівнюються другі елементи (з ) тощо. Це може створити нестабільні вихідні дані, якщо ви не включите оригінальні індекси списку для лексикографічного впорядкування для збереження дублікатів у їх первісному порядку.

Використання operatorмодуля

Це дає вам більше безпосереднього контролю над тим, як сортувати вхід, так що ви можете отримати стабільність сортування , просто вказавши конкретний ключ для сортування. Дивіться більше прикладів тут .

import operator    

# Sort by Y (1) and extract X [0]
list(zip(*sorted(zip(X,Y), key=operator.itemgetter(1))))[0]                                                                                                 
# Results in: ('a', 'd', 'h', 'b', 'c', 'e', 'i', 'f', 'g')
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.