Використовуючи PostgreSQL 9.2, у мене виникають проблеми з повільними запитами щодо відносно великої таблиці (200+ мільйонів рядків). Я не намагаюся нічого божевільного, просто додаю історичні цінності. Нижче наведено запит та вихідний план запиту.
Моя таблиця:
Table "public.energy_energyentry"
Column | Type | Modifiers
-----------+--------------------------+-----------------------------------------------------------------
id | integer | not null default nextval('energy_energyentry_id_seq'::regclass)
prop_id | integer | not null
timestamp | timestamp with time zone | not null
value | double precision | not null
Indexes:
"energy_energyentry_pkey" PRIMARY KEY, btree (id)
"energy_energyentry_prop_id" btree (prop_id)
"energy_energyentry_prop_id_timestamp_idx" btree (prop_id, "timestamp")
Foreign-key constraints:
"energy_energyentry_prop_id_fkey" FOREIGN KEY (prop_id) REFERENCES gateway_peripheralproperty(id) DEFERRABLE INITIALLY DEFERRED
Дані коливаються від 2012-01-01 до теперішнього часу, постійно додаються нові дані. У prop_id
зовнішньому ключі є близько 2,2 тис. Чітких значень , розподілених рівномірно.
Я зауважую, що рядкові оцінки не за горами, але оцінки витрат здаються більшими на 4 рази. Це, мабуть, не проблема, але чи я щось можу зробити з цього приводу?
Я думаю, що проблема доступу до диска може бути проблемою, оскільки таблиця не знаходиться в пам'яті весь час.
EXPLAIN ANALYZE
SELECT SUM("value")
FROM "energy_energyentry"
WHERE
"prop_id"=82411
AND "timestamp">'2014-06-11'
AND "timestamp"<'2014-11-11'
;
Aggregate (cost=214481.45..214481.46 rows=1 width=8) (actual time=51504.814..51504.814 rows=1 loops=1) -> Index Scan using energy_energyentry_prop_id_timestamp_idx on energy_energyentry (cost=0.00..214434.08 rows=18947 width=8) (actual time=136.030..51488.321 rows=13578 loops=1) Index Cond: ((prop_id = 82411) AND ("timestamp" > '2014-06-11 00:00:00+00'::timestamp with time zone) AND ("timestamp" < '2014-11-11 00:00:00+00'::timestamp with time zone)) Total runtime: 51504.841 ms
Будь-які пропозиції, як зробити це швидше?
Я також добре, лише почувши, що я нічого дивного не робив.
prop_time_idx
, але визначення таблиці показує entry_prop_id_timestamp_idx
. Це той самий показник? Виправте, будь ласка.
prop
)? Якби лише невеликий відсоток, можливо, індекс на ("timestamp", prop)
було б краще. Кілька індексів з однаковими провідними стовпцями ( prop
у вашому випадку) також часто є зайвими.