Як знайти найбільші об’єкти в базі даних SQL Server?


136

Як би я міг шукати найбільші об’єкти в базі даних SQL Server? По-перше, визначивши, які таблиці (та пов'язані з ними індекси) є найбільшими, а потім визначимо, які рядки в певній таблиці є найбільшими (ми зберігаємо двійкові дані в BLOB)?

Чи є там інструменти для допомоги у подібному аналізі баз даних? Або є кілька простих запитів, з якими я можу працювати проти системних таблиць?

Відповіді:


280

Я використовував цей SQL-скрипт (який я отримав від когось, десь - не можу реконструювати, від кого він походить) протягом століть, і це допомогло мені трохи зрозуміти та визначити розмір індексів та таблиць:

SELECT 
    t.name AS TableName,
    i.name as indexName,
    sum(p.rows) as RowCounts,
    sum(a.total_pages) as TotalPages, 
    sum(a.used_pages) as UsedPages, 
    sum(a.data_pages) as DataPages,
    (sum(a.total_pages) * 8) / 1024 as TotalSpaceMB, 
    (sum(a.used_pages) * 8) / 1024 as UsedSpaceMB, 
    (sum(a.data_pages) * 8) / 1024 as DataSpaceMB
FROM 
    sys.tables t
INNER JOIN      
    sys.indexes i ON t.object_id = i.object_id
INNER JOIN 
    sys.partitions p ON i.object_id = p.object_id AND i.index_id = p.index_id
INNER JOIN 
    sys.allocation_units a ON p.partition_id = a.container_id
WHERE 
    t.name NOT LIKE 'dt%' AND
    i.object_id > 255 AND  
    i.index_id <= 1
GROUP BY 
    t.name, i.object_id, i.index_id, i.name 
ORDER BY 
    object_name(i.object_id) 

Звичайно, ви можете використовувати інші критерії замовлення, наприклад

ORDER BY SUM(p.rows) DESC

щоб отримати таблиці з найбільшою кількістю рядків, або

ORDER BY SUM(a.total_pages) DESC

щоб отримати таблиці з найбільшою кількістю використаних сторінок (8K блоків).


Відмінно, дякую! Тепер, коли я звузив свій найбільший об’єкт до таблиці, що містить безліч двійкових даних, так чи інакше, щоб зрозуміти, який із рядків двійкових даних є найбільшим?
jamesaharvey

3
для цього вам доведеться зробити вибір у цій таблиці та роздрукувати DATALENGTH (поле) для кожного цікавого вам поля (як правило, VARCHAR (MAX), VARBINARY (MAX) тощо)
marc_s

1
Дякую @marc_s, це було дуже корисно. Стовпець TableName також може містити назву схеми зSELECT OBJECT_SCHEMA_NAME(i.object_id) + '.' + OBJECT_NAME(i.object_id) AS TableName, ...
CruiZen

2
Це, мабуть, найкрасивіший сценарій TSQL, який я коли-небудь бачив
Агустін Мерілес

2
Щоб включити також НЕ КЛАСТИРОВАНІ індекси, видаліть "та i.index_id <= 1" із пункту WHERE.
Гордон Белл

72

У SQL Server 2008 ви також можете просто запустити стандартний звіт "Використання диска" за верхніми таблицями. Це можна дізнатися, натиснувши правою кнопкою миші БД, вибравши Звіти-> Стандартні звіти та вибравши потрібний звіт.


8
Без жартів? Ось така революційна відповідь. Дякуємо за публікацію (Не сарказм. Зараз деякі запити виконуються вручну, і я не можу повірити, що ці звіти вже є!)
Jennifer Zouak,

4

Цей запит допоможе знайти найбільшу таблицю у вашому зв’язку.

SELECT  TOP 1 OBJECT_NAME(OBJECT_ID) TableName, st.row_count
FROM sys.dm_db_partition_stats st
WHERE index_id < 2
ORDER BY st.row_count DESC

Добре мати щось, що ми легко запам’ятаємо. Дякую за стислість.
Девід Бетц

3

Ви також можете використовувати такий код:

USE AdventureWork
GO
CREATE TABLE #GetLargest 
(
  table_name    sysname ,
  row_count     INT,
  reserved_size VARCHAR(50),
  data_size     VARCHAR(50),
  index_size    VARCHAR(50),
  unused_size   VARCHAR(50)
)

SET NOCOUNT ON

INSERT #GetLargest

EXEC sp_msforeachtable 'sp_spaceused ''?'''

SELECT 
  a.table_name,
  a.row_count,
  COUNT(*) AS col_count,
  a.data_size
  FROM #GetLargest a
     INNER JOIN information_schema.columns b
     ON a.table_name collate database_default
     = b.table_name collate database_default
       GROUP BY a.table_name, a.row_count, a.data_size
       ORDER BY CAST(REPLACE(a.data_size, ' KB', '') AS integer) DESC

DROP TABLE #GetLargest

2

Якщо ви використовуєте Sql Server Management Studio 2008, є певні поля даних, які ви можете переглянути у вікні деталей провідника об’єкта. Просто перейдіть до та виберіть папку таблиць. У вікні деталей ви можете клацнути правою кнопкою миші заголовки стовпців і додати поля до "звіту". Ваш пробіг може змінюватися, якщо ви перебуваєте на SSMS 2008 express.


2

Я знайшов цей запит також дуже корисним у SqlServerCentral, ось посилання на оригінальну публікацію

Найбільші таблиці серверів Sql

  select name=object_schema_name(object_id) + '.' + object_name(object_id)
, rows=sum(case when index_id < 2 then row_count else 0 end)
, reserved_kb=8*sum(reserved_page_count)
, data_kb=8*sum( case 
     when index_id<2 then in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count 
     else lob_used_page_count + row_overflow_used_page_count 
    end )
, index_kb=8*(sum(used_page_count) 
    - sum( case 
           when index_id<2 then in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count 
        else lob_used_page_count + row_overflow_used_page_count 
        end )
     )    
, unused_kb=8*sum(reserved_page_count-used_page_count)
from sys.dm_db_partition_stats
where object_id > 1024
group by object_id
order by 
rows desc   

У моїй базі даних вони давали різні результати між цим запитом та першою відповіддю.

Сподіваюся, хтось знайде корисним


1

Відповідь @ marc_s дуже чудова, і я її використовую вже кілька років. Однак я помітив, що сценарій пропускає дані в деяких індексах стовпців і не показує повну картину. Наприклад, якщо ви SUM(TotalSpace)проти цього сценарію і порівнюєте його з властивостями бази даних про загальний простір у програмі Management Studio, у моєму випадку числа не збігаються (Management Studio показує більші числа). Я змінив сценарій, щоб подолати цю проблему і трохи розширив її:

select
    tables.[name] as table_name,
    schemas.[name] as schema_name,
    isnull(db_name(dm_db_index_usage_stats.database_id), 'Unknown') as database_name,
    sum(allocation_units.total_pages) * 8 as total_space_kb,
    cast(round(((sum(allocation_units.total_pages) * 8) / 1024.00), 2) as numeric(36, 2)) as total_space_mb,
    sum(allocation_units.used_pages) * 8 as used_space_kb,
    cast(round(((sum(allocation_units.used_pages) * 8) / 1024.00), 2) as numeric(36, 2)) as used_space_mb,
    (sum(allocation_units.total_pages) - sum(allocation_units.used_pages)) * 8 as unused_space_kb,
    cast(round(((sum(allocation_units.total_pages) - sum(allocation_units.used_pages)) * 8) / 1024.00, 2) as numeric(36, 2)) as unused_space_mb,
    count(distinct indexes.index_id) as indexes_count,
    max(dm_db_partition_stats.row_count) as row_count,
    iif(max(isnull(user_seeks, 0)) = 0 and max(isnull(user_scans, 0)) = 0 and max(isnull(user_lookups, 0)) = 0, 1, 0) as no_reads,
    iif(max(isnull(user_updates, 0)) = 0, 1, 0) as no_writes,
    max(isnull(user_seeks, 0)) as user_seeks,
    max(isnull(user_scans, 0)) as user_scans,
    max(isnull(user_lookups, 0)) as user_lookups,
    max(isnull(user_updates, 0)) as user_updates,
    max(last_user_seek) as last_user_seek,
    max(last_user_scan) as last_user_scan,
    max(last_user_lookup) as last_user_lookup,
    max(last_user_update) as last_user_update,
    max(tables.create_date) as create_date,
    max(tables.modify_date) as modify_date
from 
    sys.tables
    left join sys.schemas on schemas.schema_id = tables.schema_id
    left join sys.indexes on tables.object_id = indexes.object_id
    left join sys.partitions on indexes.object_id = partitions.object_id and indexes.index_id = partitions.index_id
    left join sys.allocation_units on partitions.partition_id = allocation_units.container_id
    left join sys.dm_db_index_usage_stats on tables.object_id = dm_db_index_usage_stats.object_id and indexes.index_id = dm_db_index_usage_stats.index_id
    left join sys.dm_db_partition_stats on tables.object_id = dm_db_partition_stats.object_id and indexes.index_id = dm_db_partition_stats.index_id
group by schemas.[name], tables.[name], isnull(db_name(dm_db_index_usage_stats.database_id), 'Unknown')
order by 5 desc

Сподіваюся, що комусь це буде корисно. Цей сценарій був протестований на великих базах даних про туберкульоз із сотнями різних таблиць, індексів та схем.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.