EDIT 2: Відповісти на нову вимогу OP
ranges = []
for key, group in groupby(enumerate(data), lambda (index, item): index - item):
group = map(itemgetter(1), group)
if len(group) > 1:
ranges.append(xrange(group[0], group[-1]))
else:
ranges.append(group[0])
Вихід:
[xrange(2, 5), xrange(12, 17), 20]
Ви можете замінити xrange на діапазон або будь-який інший користувацький клас.
Документи Python мають дуже акуратний рецепт для цього:
from operator import itemgetter
from itertools import groupby
data = [2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
print map(itemgetter(1), g)
Вихід:
[2, 3, 4, 5]
[12, 13, 14, 15, 16, 17]
Якщо ви хочете отримати точно такий же результат, ви можете зробити це:
ranges = []
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
group = map(itemgetter(1), g)
ranges.append((group[0], group[-1]))
вихід:
[(2, 5), (12, 17)]
EDIT: Приклад вже пояснено в документації, але, можливо, мені слід пояснити його більше:
Ключ до рішення - це розходження з діапазоном, так що послідовні числа відображаються в одній групі.
Якщо дані були: [2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
Тоді groupby(enumerate(data), lambda (i,x):i-x)
це еквівалент наступного:
groupby(
[(0, 2), (1, 3), (2, 4), (3, 5), (4, 12),
(5, 13), (6, 14), (7, 15), (8, 16), (9, 17)],
lambda (i,x):i-x
)
Лямбда-функція віднімає індекс елемента від значення елемента. Отже, коли ви застосовуєте лямбду до кожного елемента. Ви отримаєте такі ключі для groupby:
[-2, -2, -2, -2, -8, -8, -8, -8, -8, -8]
groupby групує елементи за однаковим значенням ключа, тому перші 4 елементи будуть згруповані разом тощо.
Сподіваюсь, це робить його більш читабельним.
python 3
версія може бути корисною для початківців
спершу імпортуйте потрібні бібліотеки
from itertools import groupby
from operator import itemgetter
ranges =[]
for k,g in groupby(enumerate(data),lambda x:x[0]-x[1]):
group = (map(itemgetter(1),g))
group = list(map(int,group))
ranges.append((group[0],group[-1]))