Як вибрати набір останніх не-NULL значень на стовпчик у групі?


9

Я використовую SQL Server 2016, і дані, які я споживаю, мають таку форму.

CREATE TABLE #tab (cat CHAR(1), t CHAR(2), val1 INT, val2 CHAR(1));

INSERT INTO #tab VALUES 
    ('A','Q1',2,NULL),('A','Q2',NULL,'P'),('A','Q3',1,NULL),('A','Q3',NULL,NULL),
    ('B','Q1',5,NULL),('B','Q2',NULL,'P'),('B','Q3',NULL,'C'),('B','Q3',10,NULL);

SELECT *
FROM    #tab;

введіть тут опис зображення

Я хотів би отримати останні значення ненульових за стовпцями val1і val2згруповані по catі по замовленню t. Я шукаю результат

cat  val1 val2
A    1    P
B    10   C

Найближче, до якого я дійшов, використовує LAST_VALUE, ігноруючи те, ORDER BYщо не буде працювати, оскільки мені потрібно впорядковане останнє ненулеве значення.

SELECT DISTINCT 
        cat, 
        LAST_VALUE(val1) OVER(PARTITION BY cat ORDER BY (SELECT NULL) ) AS val1,
        LAST_VALUE(val2) OVER(PARTITION BY cat ORDER BY (SELECT NULL) ) AS val2
FROM    #tab
cat  val1 val2
A    NULL NULL
B    10   NULL

Фактична таблиця містить більше стовпців для cat( стовпці дати та рядки) та більше стовпців val (стовпці дати, рядки та числа) для вибору останнього ненульового значення.

Будь-які ідеї, як зробити цей вибір.


1
@ Verace Згруповані за catзамовленням t.
Едмунд

1
@ ypercubeᵀᴹ Ні, немає значення Q4, tзначення повторюються. Дані не дуже добре поводяться.
Едмунд

4
Гаразд, але в цьому випадку ви повинні надати замовлення, яке визначає ідеальне замовлення. PARTITION BY cat ORDER BY t, idнаприклад. В іншому випадку один і той же запит (будь-який запит) може давати різні результати при окремих виконання. Якщо стовпці таблиці є лише тими, які ти показуєш, я не бачу, як ми можемо мати визначений порядок!
ypercubeᵀᴹ

1
@ ypercubeᵀᴹ У цьому полягає виклик. У даних немає стовпця ідентифікатора. Є кілька стовпчиків групування, стовпчик рядків, який можна використовувати в межах групового впорядкування, а потім стовпчики з декількома значеннями з нульовими змінами.
Едмунд

1
Якщо ви не можете детерміновано сказати SQL Server, яким повинен бути порядок, як будь-який споживач цих даних дізнається різницю?
Аарон Бертран

Відповіді:


10

Використовуючи техніку конкатенації з Останньої головоломки, що не стосується NULL, від Ітзіка Бен Гана, це виглядатиме так із вашими типовими таблицями та типами даних стовпців.

select T.cat,
       cast(substring(
                     max(cast(T.t as binary(2)) + cast(T.val1 as binary(4))),
                     3,
                     4
                     ) as int),
       cast(substring(
                     max(cast(T.t as binary(2)) + cast(T.val2 as binary(1))),
                     3,
                     1
                     ) as char(1))
from #tab as T
group by T.cat;

введіть тут опис зображення

Ще один спосіб написати цей запит, який розділяє кроки на CTE, щоб, можливо, краще показати, що відбувається. Він дає такий самий план виконання, як і запит вище.

with C1 as
(
  -- Concatenate the ordering column with the value column
  select T.cat,
        cast(T.t as binary(2)) + cast(T.val1 as binary(4)) as val1,
        cast(T.t as binary(2)) + cast(T.val2 as binary(1)) as val2
  from #tab as T
),
C2 as
(
  -- Get the max concatenated value per group
  select C1.cat,
         max(C1.val1) as val1,
         max(C1.val2) as val2
  from C1
  group by C1.cat
)
-- Extract the value from the concatenated column
select C2.cat,
       cast(substring(C2.val1, 3, 4) as int) as val1,
       cast(substring(C2.val2, 3, 1) as char(1)) as val2
from C2;

Це рішення використовує той факт, що об'єднання нульового значення з чимось призводить до нульового значення. SET CONCAT_NULL_YIELDS_NULL (Transact-SQL)


Дуже добре дистильований Мікаель. Це рішення врятувало мене не раз, хоча я спочатку вважав закінчення статті Іціка заплутаним. Тим, що він позначив це "кроком 2", коли насправді це більше нагадувало реалізацію логіки за кроком 1.
pimbrouwers

2

Просто додайте чек на NULL у розділі

SELECT DISTINCT 
        cat, 
        FIRST_VALUE(val1) OVER(PARTITION BY cat ORDER BY CASE WHEN val1 is NULL then 0 else 1 END DESC, t desc) AS val1,
        FIRST_VALUE(val2) OVER(PARTITION BY cat ORDER BY CASE WHEN val2 is NULL then 0 else 1 END DESC, t desc) AS val2
FROM    #tab

0

Це має робити. row_number () та з'єднання

Якщо у вас немає хорошого сорту, ви повинні сподіватися, що лише один із Q3 не є нульовим.

declare @t TABLE (cat CHAR(1), t CHAR(2), val1 INT, val2 CHAR(1));
INSERT INTO @t VALUES 
    ('A','Q1',2,NULL),('A','Q2',NULL,'P'),('A','Q3',1,NULL),('A','Q3',NULL,NULL),
    ('B','Q1',5,NULL),('B','Q2',NULL,'P'),('B','Q3',NULL,'C'),('B','Q3',10,NULL);

--SELECT *
--     , row_number() over (partition by cat order by t) as rn
--FROM   @t
--where val1 is not null or val2 is not null;

select t1.cat, t1.val1, t2.val2 
from  ( SELECT t.cat, t.val1
             , row_number() over (partition by cat order by t desc) as rn
        FROM   @t t
        where val1 is not null 
       ) t1
join   ( SELECT t.cat, t.val2
             , row_number() over (partition by cat order by t desc) as rn
        FROM   @t t
        where val2 is not null 
       ) t2
   on t1.cat = t2.cat
  and t1.rn = 1
  and t2.rn = 1
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.