Я намагаюся провести перехрестя між двома шарами:
- Полілінійний шар, що представляє деякі дороги (~ 5500 рядків)
- Шар багатокутника, що представляє буфери неправильної форми навколо різних точок інтересу (~ 47 000 рядків)
Зрештою, те, що я намагаюся зробити, це підключити полілінії до цих багатьох (іноді перекриваються) буферів, а потім підсумувати загальну довжину проїжджої частини, що міститься у кожному буфері.
Проблема полягає в тому, що все працює повільно. Я не впевнений, скільки часу це має зайняти, але я просто перервав запит через> 34 години. Я сподіваюся, що хтось може або вказати, де я помилився зі своїм SQL-запитом, або може вказати на кращий спосіб зробити це.
CREATE TABLE clip_roads AS
SELECT
ST_Intersection(b.the_geom, z.the_geom) AS clip_geom,
b.*
FROM
public."roads" b,
public."buffer1KM" z
WHERE ST_Intersects(b.the_geom, z.the_geom);
CREATE INDEX "clip_roads_clip_geom_gist"
ON "clip_roads"
USING gist
(clip_geom);
CREATE TABLE buffer1km_join AS
SELECT
z.name, z.the_geom,
sum(ST_Length(b.clip_geom)) AS sum_length_m
FROM
public."clip_roads" b,
public."buffer1KM" z
WHERE
ST_Contains(z.the_geom, b.the_geom)
GROUP BY z.name, z.the_geom;
У мене є індекс GiST, створений для оригінальної таблиці доріг, і (тільки щоб бути безпечним?) Створити індекс, перш ніж робити другу таблицю.
План запитів від PGAdmin III виглядає приблизно так, хоча я боюся, що я не маю особливих навичок його інтерпретувати:
"Nested Loop (cost=0.00..29169.98 rows=35129 width=49364)"
" Output: st_intersection(b.the_geom, z.the_geom), b.gid, b.geo_id, b.address_l, b.address_r, b.lf_name, b.lfn_id, b.lfn_name, b.lfn_type_c, b.lfn_type_d, b.lfn_dir_co, b.lfn_dir_de, b.lfn_desc, b.oe_flag_l, b.oe_flag_r, b.fcode_desc, b.fcode, b.fnode, b.tnode, b.metrd_num, b.lo_num_l, b.lo_n_suf_l, b.hi_num_l, b.hi_n_suf_l, b.lo_num_r, b.lo_n_suf_r, b.hi_num_r, b.hi_n_suf_r, b.juris_code, b.dir_code, b.dir_code_d, b.cp_type, b.length, b.the_geom"
" Join Filter: _st_intersects(b.the_geom, z.the_geom)"
" -> Seq Scan on public."roads" b (cost=0.00..306.72 rows=5472 width=918)"
" Output: b.gid, b.geo_id, b.address_l, b.address_r, b.lf_name, b.lfn_id, b.lfn_name, b.lfn_type_c, b.lfn_type_d, b.lfn_dir_co, b.lfn_dir_de, b.lfn_desc, b.oe_flag_l, b.oe_flag_r, b.fcode_desc, b.fcode, b.fnode, b.tnode, b.metrd_num, b.lo_num_l, b.lo_n_suf_l, b.hi_num_l, b.hi_n_suf_l, b.lo_num_r, b.lo_n_suf_r, b.hi_num_r, b.hi_n_suf_r, b.juris_code, b.dir_code, b.dir_code_d, b.cp_type, b.length, b.the_geom"
" -> Index Scan using "buffer1KM_index_the_geom" on public."buffer1KM" z (cost=0.00..3.41 rows=1 width=48446)"
" Output: z.gid, z.objectid, z.facilityid, z.name, z.frombreak, z.tobreak, z.postal_cod, z.pc_area, z.ct_id, z.da_id, z.taz_id, z.edge_poly, z.cchs_0708, z.tts_06, z.the_geom"
" Index Cond: (b.the_geom && z.the_geom)"
Невже ця операція приречена на кілька днів? Зараз я працюю на PostGIS для Windows, але теоретично я міг би кинути більше обладнання на цю проблему, поставивши її на Amazon EC2. Однак я бачу, що запит використовує лише одне ядро за один раз (чи є спосіб змусити його використовувати більше?).