Як знайти «розрив» у запущеному лічильнику з SQL?


106

Я хотів би знайти перший "пробіл" у стовпці лічильника в таблиці SQL. Наприклад, якщо є значення 1,2,4 і 5, я хотів би дізнатися 3.

Я, звичайно, можу отримати значення в порядку і пройти через нього вручну, але хотілося б знати, чи знайдеться спосіб зробити це в SQL.

Крім того, це повинен бути цілком стандартний SQL, що працює з різними СУБД.


На сервері Sql 2008 і вище ви можете використовувати LAG(id, 1, null)функцію з OVER (ORDER BY id)пунктом.
ajeh

Відповіді:


184

В MySQLі PostgreSQL:

SELECT  id + 1
FROM    mytable mo
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    mytable mi 
        WHERE   mi.id = mo.id + 1
        )
ORDER BY
        id
LIMIT 1

В SQL Server:

SELECT  TOP 1
        id + 1
FROM    mytable mo
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    mytable mi 
        WHERE   mi.id = mo.id + 1
        )
ORDER BY
        id

В Oracle:

SELECT  *
FROM    (
        SELECT  id + 1 AS gap
        FROM    mytable mo
        WHERE   NOT EXISTS
                (
                SELECT  NULL
                FROM    mytable mi 
                WHERE   mi.id = mo.id + 1
                )
        ORDER BY
                id
        )
WHERE   rownum = 1

ANSI (працює скрізь, найменш ефективно):

SELECT  MIN(id) + 1
FROM    mytable mo
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    mytable mi 
        WHERE   mi.id = mo.id + 1
        )

Системи, що підтримують розсувні вікна:

SELECT  -- TOP 1
        -- Uncomment above for SQL Server 2012+
        previd
FROM    (
        SELECT  id,
                LAG(id) OVER (ORDER BY id) previd
        FROM    mytable
        ) q
WHERE   previd <> id - 1
ORDER BY
        id
-- LIMIT 1
-- Uncomment above for PostgreSQL

39
@vulkanino: попросіть їх зберегти відступ. Також зауважте, що ліцензія Creative Commons вимагає від вас татуювання мого ніка, а також питання URL, хоча я думаю, що це QR-код.
Quassnoi

4
Це чудово, але якби я мав [1, 2, 11, 12], то це знайшов би лише 3. Я хотів би знайти це 3-10 замість цього - в основному початок і кінець кожного прогалини. Я розумію, що мені, можливо, доведеться написати свій власний скрипт python, який використовує SQL (у моєму випадку MySql), але було б добре, якби SQL міг наблизити мене до того, що я хочу (у мене є таблиця з 2 мільйонами рядків, яка має прогалини, тому мені потрібно буде нарізати його на більш дрібні шматки та запустити на ньому деякі SQL). Я припускаю, що я міг би запустити один запит, щоб знайти початок пробілу, потім інший, щоб знайти кінець розриву, і вони "зливають сортування" двох послідовностей.
Гаміш Грубіян

1
@HamishGrubijan: будь ласка, опублікуйте це як інше запитання
Quassnoi

2
@Malkocoglu: ви отримаєте NULL, ні 0, якщо таблиця порожня. Це справедливо для всіх баз даних.
Quassnoi

5
це не знайде початкові прогалини належним чином. якщо у вас 3,4,5,6,8. цей код повідомить про 7, оскільки він НІ 1, з яким навіть перевірити. Тож якщо у вас відсутні стартові номери, вам доведеться перевірити це.
ttomsen

12

Усі ваші відповіді працюють добре, якщо у вас є перше значення id = 1, інакше цей розрив не буде виявлено. Наприклад, якщо значення вашого ідентифікатора таблиці 3,4,5, ваші запити повернуть 6.

Я зробив щось подібне

SELECT MIN(ID+1) FROM (
    SELECT 0 AS ID UNION ALL 
    SELECT  
        MIN(ID + 1)
    FROM    
        TableX) AS T1
WHERE
    ID+1 NOT IN (SELECT ID FROM TableX) 

У цьому знайдеться перша прогалина. Якщо у вас ідентифікатор 0, 2,3,4. Відповідь 1. Я шукав відповідь, щоб знайти найбільшу прогалину. Скажімо, послідовність становить 0,2,3,4, 100,101,102. Я хочу знайти розрив 4-99.
Kemin Zhou

8

Насправді не існує надзвичайно стандартного способу SQL для цього, але ви можете зробити це з певною формою обмежувального пункту

SELECT `table`.`num` + 1
FROM `table`
LEFT JOIN `table` AS `alt`
ON `alt`.`num` = `table`.`num` + 1
WHERE `alt`.`num` IS NULL
LIMIT 1

(MySQL, PostgreSQL)

або

SELECT TOP 1 `num` + 1
FROM `table`
LEFT JOIN `table` AS `alt`
ON `alt`.`num` = `table`.`num` + 1
WHERE `alt`.`num` IS NULL

(SQL Server)

або

SELECT `num` + 1
FROM `table`
LEFT JOIN `table` AS `alt`
ON `alt`.`num` = `table`.`num` + 1
WHERE `alt`.`num` IS NULL
AND ROWNUM = 1

(Oracle)


якщо є діапазон пробілів, для запиту після пошти буде повернуто лише перший рядок у діапазоні.
Джон Haugeland

Це має для мене найбільш сенс, використання об’єднання також дозволить вам змінити ТОП-значення, щоб показати більше результатів розриву.
AJ_

1
Дякую, це працює дуже добре, і якщо ви хочете побачити всі точки, де є розрив, ви можете зняти ліміт.
mekbib.будив

8

Перше, що впало мені в голову. Не впевнений, чи гарна ідея взагалі йти цим шляхом, але має працювати. Припустимо, таблиця є, tа стовпець c:

SELECT t1.c+1 AS gap FROM t as t1 LEFT OUTER JOIN t as t2 ON (t1.c+1=t2.c) WHERE t2.c IS NULL ORDER BY gap ASC LIMIT 1

Редагувати: ця кнопка може бути швидкою (і коротшою!):

SELECT min(t1.c)+1 AS gap FROM t as t1 LEFT OUTER JOIN t as t2 ON (t1.c+1=t2.c) WHERE t2.c IS NULL


ЛЕВІШНІЙ ПРИЄДНАЙТЕСЬ t ==>
ЛІВНІЙ ВІДПОЛУЧАЙТЕ приєднуйтесь

1
Ні-ні, Еймон, LEFT OUTER JOING t2вимагає від тебе t2стіл, який є лише псевдонімом.
Майкл Крелін - хакер

6

Це працює в SQL Server - неможливо протестувати його в інших системах, але це здається стандартним ...

SELECT MIN(t1.ID)+1 FROM mytable t1 WHERE NOT EXISTS (SELECT ID FROM mytable WHERE ID = (t1.ID + 1))

Ви також можете додати початкову точку до пункту де ...

SELECT MIN(t1.ID)+1 FROM mytable t1 WHERE NOT EXISTS (SELECT ID FROM mytable WHERE ID = (t1.ID + 1)) AND ID > 2000

Отже, якби у вас були 2000, 2001, 2002 та 2005 роки, де 2003 та 2004 років не існувало, він повернувся б у 2003 році.


3

Наступне рішення:

  • надає дані випробувань;
  • внутрішній запит, який створює інші прогалини; і
  • він працює в SQL Server 2012.

Число упорядкованих рядків послідовно в пункті " з ", а потім повторно використовує результат двічі з внутрішнім з'єднанням номера рядка, але зміщується на 1, щоб порівняти рядок до рядка після, шукаючи ідентифікатори з проміжком, більшим за 1. Більше, ніж просять, але широко застосовують.

create table #ID ( id integer );

insert into #ID values (1),(2),    (4),(5),(6),(7),(8),    (12),(13),(14),(15);

with Source as (
    select
         row_number()over ( order by A.id ) as seq
        ,A.id                               as id
    from #ID as A WITH(NOLOCK)
)
Select top 1 gap_start from (
    Select 
         (J.id+1) as gap_start
        ,(K.id-1) as gap_end
    from       Source as J
    inner join Source as K
    on (J.seq+1) = K.seq
    where (J.id - (K.id-1)) <> 0
) as G

Внутрішній запит виробляє:

gap_start   gap_end

3           3

9           11

Зовнішній запит виробляє:

gap_start

3

2

Внутрішнє приєднання до подання або послідовності, яка має всі можливі значення.

Немає столу? Складіть таблицю. Я завжди тримаю навколо себе підставний стіл тільки для цього.

create table artificial_range( 
  id int not null primary key auto_increment, 
  name varchar( 20 ) null ) ;

-- or whatever your database requires for an auto increment column

insert into artificial_range( name ) values ( null )
-- create one row.

insert into artificial_range( name ) select name from artificial_range;
-- you now have two rows

insert into artificial_range( name ) select name from artificial_range;
-- you now have four rows

insert into artificial_range( name ) select name from artificial_range;
-- you now have eight rows

--etc.

insert into artificial_range( name ) select name from artificial_range;
-- you now have 1024 rows, with ids 1-1024

Тоді,

 select a.id from artificial_range a
 where not exists ( select * from your_table b
 where b.counter = a.id) ;

2

Для PostgreSQL

Приклад, який використовує рекурсивний запит.

Це може бути корисно, якщо ви хочете знайти пробіл у певному діапазоні (він буде працювати, навіть якщо таблиця порожня, тоді як інші приклади не будуть)

WITH    
    RECURSIVE a(id) AS (VALUES (1) UNION ALL SELECT id + 1 FROM a WHERE id < 100), -- range 1..100  
    b AS (SELECT id FROM my_table) -- your table ID list    
SELECT a.id -- find numbers from the range that do not exist in main table
FROM a
LEFT JOIN b ON b.id = a.id
WHERE b.id IS NULL
-- LIMIT 1 -- uncomment if only the first value is needed

1

Моя здогадка:

SELECT MIN(p1.field) + 1 as gap
FROM table1 AS p1  
INNER JOIN table1 as p3 ON (p1.field = p3.field + 2)
LEFT OUTER JOIN table1 AS p2 ON (p1.field = p2.field + 1)
WHERE p2.field is null;

1

Цей пояснює все згадане дотепер. Він включає 0 як вихідну точку, до якої він буде за замовчуванням, якщо також немає значень. Я також додав відповідні місця для інших частин багатозначного ключа. Це було протестовано лише на SQL Server.

select
    MIN(ID)
from (
    select
        0 ID
    union all
    select
        [YourIdColumn]+1
    from
        [YourTable]
    where
        --Filter the rest of your key--
    ) foo
left join
    [YourTable]
    on [YourIdColumn]=ID
    and --Filter the rest of your key--
where
    [YourIdColumn] is null

1

Я записав швидкий спосіб зробити це. Не впевнений, що це найефективніше, але робота виконується. Зауважте, що він не повідомляє вам пробіл, а повідомляє вам ідентифікатор до і після розриву (майте на увазі, що розрив може бути декількома значеннями, наприклад, 1,2,4,7,11 тощо)

Я використовую sqlite як приклад

Якщо це ваша структура таблиці

create table sequential(id int not null, name varchar(10) null);

і це твої ряди

id|name
1|one
2|two
4|four
5|five
9|nine

Запит є

select a.* from sequential a left join sequential b on a.id = b.id + 1 where b.id is null and a.id <> (select min(id) from sequential)
union
select a.* from sequential a left join sequential b on a.id = b.id - 1 where b.id is null and a.id <> (select max(id) from sequential);

https://gist.github.com/wkimeria/7787ffe84d1c54216f1b320996b17b7e


0
select min([ColumnName]) from [TableName]
where [ColumnName]-1 not in (select [ColumnName] from [TableName])
and [ColumnName] <> (select min([ColumnName]) from [TableName])

0

Ось стандартне рішення SQL, яке працює на всіх серверах баз даних без змін:

select min(counter + 1) FIRST_GAP
    from my_table a
    where not exists (select 'x' from my_table b where b.counter = a.counter + 1)
        and a.counter <> (select max(c.counter) from my_table c);

Бачити в дії для;


0

Він також працює для порожніх таблиць або з негативними значеннями. Щойно перевірена в SQL Server 2012

 select min(n) from (
select  case when lead(i,1,0) over(order by i)>i+1 then i+1 else null end n from MyTable) w

0

Якщо ви використовуєте Firebird 3, це найелегантніше і простіше:

select RowID
  from (
    select `ID_Column`, Row_Number() over(order by `ID_Column`) as RowID
      from `Your_Table`
        order by `ID_Column`)
    where `ID_Column` <> RowID
    rows 1

0
            -- PUT THE TABLE NAME AND COLUMN NAME BELOW
            -- IN MY EXAMPLE, THE TABLE NAME IS = SHOW_GAPS AND COLUMN NAME IS = ID

            -- PUT THESE TWO VALUES AND EXECUTE THE QUERY

            DECLARE @TABLE_NAME VARCHAR(100) = 'SHOW_GAPS'
            DECLARE @COLUMN_NAME VARCHAR(100) = 'ID'


            DECLARE @SQL VARCHAR(MAX)
            SET @SQL = 
            'SELECT  TOP 1
                    '+@COLUMN_NAME+' + 1
            FROM    '+@TABLE_NAME+' mo
            WHERE   NOT EXISTS
                    (
                    SELECT  NULL
                    FROM    '+@TABLE_NAME+' mi 
                    WHERE   mi.'+@COLUMN_NAME+' = mo.'+@COLUMN_NAME+' + 1
                    )
            ORDER BY
                    '+@COLUMN_NAME

            -- SELECT @SQL

            DECLARE @MISSING_ID TABLE (ID INT)

            INSERT INTO @MISSING_ID
            EXEC (@SQL)

            --select * from @MISSING_ID

            declare @var_for_cursor int
            DECLARE @LOW INT
            DECLARE @HIGH INT
            DECLARE @FINAL_RANGE TABLE (LOWER_MISSING_RANGE INT, HIGHER_MISSING_RANGE INT)
            DECLARE IdentityGapCursor CURSOR FOR   
            select * from @MISSING_ID
            ORDER BY 1;  

            open IdentityGapCursor

            fetch next from IdentityGapCursor
            into @var_for_cursor

            WHILE @@FETCH_STATUS = 0  
            BEGIN
            SET @SQL = '
            DECLARE @LOW INT
            SELECT @LOW = MAX('+@COLUMN_NAME+') + 1 FROM '+@TABLE_NAME
                    +' WHERE '+@COLUMN_NAME+' < ' + cast( @var_for_cursor as VARCHAR(MAX))

            SET @SQL = @sql + '
            DECLARE @HIGH INT
            SELECT @HIGH = MIN('+@COLUMN_NAME+') - 1 FROM '+@TABLE_NAME
                    +' WHERE '+@COLUMN_NAME+' > ' + cast( @var_for_cursor as VARCHAR(MAX))

            SET @SQL = @sql + 'SELECT @LOW,@HIGH'

            INSERT INTO @FINAL_RANGE
             EXEC( @SQL)
            fetch next from IdentityGapCursor
            into @var_for_cursor
            END

            CLOSE IdentityGapCursor;  
            DEALLOCATE IdentityGapCursor;  

            SELECT ROW_NUMBER() OVER(ORDER BY LOWER_MISSING_RANGE) AS 'Gap Number',* FROM @FINAL_RANGE

0

Виявлено, що більшість підходів працює дуже, дуже повільно mysql. Ось моє рішення для mysql < 8.0. Тестовано на 1М записах із зазором біля кінця ~ 1 сек до кінця. Не впевнений, чи відповідає він іншим SQL-ароматам.

SELECT cardNumber - 1
FROM
    (SELECT @row_number := 0) as t,
    (
        SELECT (@row_number:=@row_number+1), cardNumber, cardNumber-@row_number AS diff
        FROM cards
        ORDER BY cardNumber
    ) as x
WHERE diff >= 1
LIMIT 0,1
Я припускаю, що послідовність починається з `1`.

0

Якщо ваш лічильник починається з 1 і ви хочете генерувати перше число послідовності (1), коли порожнє, ось виправлений фрагмент коду з першої відповіді, дійсного для Oracle:

SELECT
  NVL(MIN(id + 1),1) AS gap
FROM
  mytable mo  
WHERE 1=1
  AND NOT EXISTS
      (
       SELECT  NULL
       FROM    mytable mi 
       WHERE   mi.id = mo.id + 1
      )
  AND EXISTS
     (
       SELECT  NULL
       FROM    mytable mi 
       WHERE   mi.id = 1
     )  

0
DECLARE @Table AS TABLE(
[Value] int
)

INSERT INTO @Table ([Value])
VALUES
 (1),(2),(4),(5),(6),(10),(20),(21),(22),(50),(51),(52),(53),(54),(55)
 --Gaps
 --Start    End     Size
 --3        3       1
 --7        9       3
 --11       19      9
 --23       49      27


SELECT [startTable].[Value]+1 [Start]
     ,[EndTable].[Value]-1 [End]
     ,([EndTable].[Value]-1) - ([startTable].[Value]) Size 
 FROM 
    (
SELECT [Value]
    ,ROW_NUMBER() OVER(PARTITION BY 1 ORDER BY [Value]) Record
FROM @Table
)AS startTable
JOIN 
(
SELECT [Value]
,ROW_NUMBER() OVER(PARTITION BY 1 ORDER BY [Value]) Record
FROM @Table
)AS EndTable
ON [EndTable].Record = [startTable].Record+1
WHERE [startTable].[Value]+1 <>[EndTable].[Value]

0

Якщо числа в стовпці є натуральними цілими числами (починаючи з 1), то ось як це легко вирішити. (якщо ІД - це назва вашого стовпця)

    SELECT TEMP.ID 
    FROM (SELECT ROW_NUMBER() OVER () AS NUM FROM 'TABLE-NAME') AS TEMP 
    WHERE ID NOT IN (SELECT ID FROM 'TABLE-NAME')
    ORDER BY 1 ASC LIMIT 1

він знайде прогалини лише до кількості рядків у "TABLE-NAME" як "SELECT ROW_NUMBER () OVER () AS NUM OF" TABLE-NAME "" дасть ідентифікатори до кількості рядків
vijay
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.