Я часто читав, коли треба перевіряти наявність рядка завжди слід робити з EXISTS, а не з COUNT.
Але в кількох останніх сценаріях я вимірював поліпшення продуктивності при використанні підрахунку.
Шаблон виглядає так:
LEFT JOIN (
SELECT
someID
, COUNT(*)
FROM someTable
GROUP BY someID
) AS Alias ON (
Alias.someID = mainTable.ID
)
Я не знайомий з методами розповісти про те, що відбувається "всередині" SQL Server, тому мені було цікаво, чи існує нечувана вада з ІСНУЮЧИМИ, що надає ідеальний сенс вимірюванням, які я робив (чи можуть ІСНОВНІ бути RBAR ?!).
Чи є у вас якесь пояснення цим явищам?
Редагувати:
Ось повний сценарій, який ви можете запустити:
SET NOCOUNT ON
SET STATISTICS IO OFF
DECLARE @tmp1 TABLE (
ID INT UNIQUE
)
DECLARE @tmp2 TABLE (
ID INT
, X INT IDENTITY
, UNIQUE (ID, X)
)
; WITH T(n) AS (
SELECT
ROW_NUMBER() OVER (ORDER BY (SELECT NULL))
FROM master.dbo.spt_values AS S
)
, tally(n) AS (
SELECT
T2.n * 100 + T1.n
FROM T AS T1
CROSS JOIN T AS T2
WHERE T1.n <= 100
AND T2.n <= 100
)
INSERT @tmp1
SELECT n
FROM tally AS T1
WHERE n < 10000
; WITH T(n) AS (
SELECT
ROW_NUMBER() OVER (ORDER BY (SELECT NULL))
FROM master.dbo.spt_values AS S
)
, tally(n) AS (
SELECT
T2.n * 100 + T1.n
FROM T AS T1
CROSS JOIN T AS T2
WHERE T1.n <= 100
AND T2.n <= 100
)
INSERT @tmp2
SELECT T1.n
FROM tally AS T1
CROSS JOIN T AS T2
WHERE T1.n < 10000
AND T1.n % 3 <> 0
AND T2.n < 1 + T1.n % 15
PRINT '
COUNT Version:
'
WAITFOR DELAY '00:00:01'
SET STATISTICS IO ON
SET STATISTICS TIME ON
SELECT
T1.ID
, CASE WHEN n > 0 THEN 1 ELSE 0 END AS DoesExist
FROM @tmp1 AS T1
LEFT JOIN (
SELECT
T2.ID
, COUNT(*) AS n
FROM @tmp2 AS T2
GROUP BY T2.ID
) AS T2 ON (
T2.ID = T1.ID
)
WHERE T1.ID BETWEEN 5000 AND 7000
OPTION (RECOMPILE) -- Required since table are filled within the same scope
SET STATISTICS TIME OFF
PRINT '
EXISTS Version:'
WAITFOR DELAY '00:00:01'
SET STATISTICS TIME ON
SELECT
T1.ID
, CASE WHEN EXISTS (
SELECT 1
FROM @tmp2 AS T2
WHERE T2.ID = T1.ID
) THEN 1 ELSE 0 END AS DoesExist
FROM @tmp1 AS T1
WHERE T1.ID BETWEEN 5000 AND 7000
OPTION (RECOMPILE) -- Required since table are filled within the same scope
SET STATISTICS TIME OFF
На SQL Server 2008R2 (сім 64 біт) я отримую цей результат
COUNT
Версія:
Таблиця '# 455F344D'. Кількість сканувань 1, логічне зчитування 8, фізичне зчитування 0, зчитування вперед-зчитування 0, логічне зчитування лобі 0, лобічне фізичне зчитування 0, лобічне зчитування вперед-0.
лобі Таблиця '# 492FC531'. Кількість сканувань 1, логічне зчитування 30, фізичне зчитування 0, зчитування вперед-зчитування 0, логічне зчитування лобі 0, лобічне фізичне зчитування 0, лобічне зчитування попереднє зчитування 0.Часи виконання SQL Server:
час процесора = 0 мс, минулий час = 81 мс.
EXISTS
Версія:
Таблиця '# 492FC531'. Кількість сканувань 1, логічне зчитування 96, фізичне зчитування 0, зчитування вперед читання 0, логічне зчитування
лобі 0, лобічне фізичне зчитування 0, лобічне зчитування лобове читання 0. Таблиця '# 455F344D'. Кількість сканувань 1, логічне зчитування 8, фізичне зчитування 0, зчитування вперед-зчитування 0, логічне зчитування лобі 0, лобічне фізичне зчитування 0, лобічне зчитування попереднє зчитування 0.Часи виконання SQL Server:
час процесора = 0 мс, минулий час = 76 мс.