У мене на Debian працює Postgres 9.4.4, і я отримую таку ORDER BY
поведінку:
veure_test=# show LC_COLLATE;
lc_collate
-------------
en_US.UTF-8
(1 row)
veure_test=# SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') ORDER BY 1;
regexp_split_to_table
-----------------------
a
A
b
c
Capacitor
CD
d
D
(8 rows)
І uname -a
:
Linux ---- 3.2.0-4-amd64 #1 SMP Debian 3.2.65-1 x86_64 GNU/Linux
Однак на моєму iMac з Postgres 9.3.4 я отримую наступне:
veure_test=# show LC_COLLATE;
lc_collate
-------------
en_US.UTF-8
(1 row)
veure_test=# SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') ORDER BY 1;
regexp_split_to_table
-----------------------
A
CD
Capacitor
D
a
b
c
d
(8 rows)
І uname -a
:
Darwin ---- 14.4.0 Darwin Kernel Version 14.4.0: Thu May 28 11:35:04 PDT 2015; root:xnu-2782.30.5~1/RELEASE_X86_64 x86_64
Мене загадує, чому версія Debian видається нечутливою до регістру, а версія OS X - ні. Що мені не вистачає чи яку іншу інформацію мені потрібно надати?
Оновлення : У моєму Mac pg_collation
таблиця показує, що у мене є en_US.UTF-8
порівняння, а на Debian - en_US.utf8
порівняння. Таким чином, на моєму Mac:
veure_test=# with foo as (
SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') as bar
)
SELECT bar FROM foo
ORDER BY bar collate "en_US.UTF-8";
bar
-----------
A
CD
Capacitor
D
a
b
c
d
(8 rows)
І на Debian:
veure_test=# with foo as (
SELECT regexp_split_to_table('D d a A c b CD Capacitor', ' ') as bar
)
SELECT bar FROM foo
ORDER BY bar collate "en_US.utf8";
bar
-----------
a
A
b
c
Capacitor
CD
d
D
(8 rows)
Так en_US.UTF-8
і чи en_US.utf8
є різні замовлення на сортування?
select * from pg_collation
показано, що у вікні Debian є en_US.utf8
, а в OS X є en_US.UTF-8
. Використовуючи їх для явного примусового порівняння у відповідних полях, показано різні порядки сортування :(
'D d a A c b CD Capacitor'
не буде передано якtext
поле на Mac? IE, спробуйтеSELECT regexp_split_to_table('D d a A c b CD Capacitor'::text, ' ') ORDER BY 1;
і подивіться, що станеться ...