Я щойно переглядав старий код, написаний для до-8.4 PostgreSQL , і побачив щось справді чудове. Я пам’ятаю, як користувальницька функція робила щось із цього дня, але я забула, як це було раніше array_agg()
. Для огляду сучасна агрегація написана так.
SELECT array_agg(x ORDER BY x DESC) FROM foobar;
Однак колись було написано так,
SELECT ARRAY(SELECT x FROM foobar ORDER BY x DESC);
Отже, я спробував це з деякими тестовими даними ..
CREATE TEMP TABLE foobar AS
SELECT * FROM generate_series(1,1e7)
AS t(x);
Результати були дивовижними. Шлях #OldSchoolCool був значно швидшим: 25% швидкість. Більше того, спрощення його без ЗАМОВЛЕННЯ показало таку ж повільність.
# EXPLAIN ANALYZE SELECT ARRAY(SELECT x FROM foobar);
QUERY PLAN
-----------------------------------------------------------------------------------------------------------------------------
Result (cost=104425.28..104425.29 rows=1 width=0) (actual time=1665.948..1665.949 rows=1 loops=1)
InitPlan 1 (returns $0)
-> Seq Scan on foobar (cost=0.00..104425.28 rows=6017728 width=32) (actual time=0.032..716.793 rows=10000000 loops=1)
Planning time: 0.068 ms
Execution time: 1671.482 ms
(5 rows)
test=# EXPLAIN ANALYZE SELECT array_agg(x) FROM foobar;
QUERY PLAN
---------------------------------------------------------------------------------------------------------------------------
Aggregate (cost=119469.60..119469.61 rows=1 width=32) (actual time=2155.154..2155.154 rows=1 loops=1)
-> Seq Scan on foobar (cost=0.00..104425.28 rows=6017728 width=32) (actual time=0.031..717.831 rows=10000000 loops=1)
Planning time: 0.054 ms
Execution time: 2174.753 ms
(4 rows)
Отже, що тут відбувається. Чому внутрішня функція array_agg набагато повільніше, ніж вуду SQL планувальника?
Використання " PostgreSQL 9.5.5 для x86_64-pc-linux-gnu, складеного gcc (Ubuntu 6.2.0-5ubuntu12) 6.2.0 20161005, 64-розрядний"
array_agg()
або аналогічними агрегатними функціями може ще важелі індекси з підзапитом , як:SELECT ARRAY_AGG(c) FROM (SELECT c FROM t ORDER BY id) sub
.ORDER BY
Застереження про сукупність - це те, що виключає використання індексу у вашому прикладі. Конструктор масиву швидший, ніжarray_agg()
коли може використовувати один і той же індекс (або жоден). Це просто не так універсально. Дивіться: dba.stackexchange.com/a/213724/3684