SQL Server: максимальна кількість рядків у таблиці [закрито]

Question 1

Закрито . Це питання потребує деталей або ясності . Наразі відповіді не приймаються.

Хочете покращити це питання? Додайте деталі та проясніть проблему, відредагувавши цю публікацію .

Закрито 2 місяці тому .

Я розробляю програмне забезпечення, яке зберігає багато даних в одній зі своїх таблиць баз даних (SQL Server версії 8, 9 або 10). Скажімо, щодня в цю таблицю вставляється близько 100 000 записів. Це близько 36 мільйонів записів на рік. Побоюючись втратити продуктивність, я вирішив щодня створювати нову таблицю (таблицю з поточною датою в назві), щоб зменшити кількість записів у таблиці.

Не могли б ви сказати мені, чи це була гарна ідея? Чи існує обмеження записів для таблиць SQL-сервера? Або ви знаєте, скільки записів (більше чи менше) можна зберегти в таблиці до того, як продуктивність значно знизиться?

Question 2

Важко дати загальну відповідь на це. Це насправді залежить від ряду факторів:

якого розміру ваш рядок
які дані ви зберігаєте (рядки, краплі, числа)
що ви робите зі своїми даними (просто зберігайте їх як архів, регулярно надсилайте запити)
у вас на столі є індекси - скільки
які специфікації вашого сервера

тощо

Як відповіли в іншому місці тут, 100 000 на день і, отже, на стіл надмірно - я б запропонував щомісяця або щотижня, можливо, навіть щокварталу. Чим більше таблиць у вас стане, тим більшим кошмаром для обслуговування / запитів він стане.

Question 3

Ось деякі із специфікацій максимальної ємності для SQL Server 2008 R2

Розмір бази даних: 524 272 терабайт
Бази даних на примірник SQL Server: 32,767
Файлові групи в базі даних: 32 767
Файлів у базі даних: 32 767
Розмір файлу (дані): 16 терабайт
Розмір файлу (журналу): 2 терабайти
Рядки за таблицею: обмежено доступним сховищем
Таблиці в базі даних: обмежена кількістю об’єктів у базі даних

Question 4

У мене є таблиця з трьох стовпців із трохи більше 6 мільярдів рядків у SQL Server 2008 R2.

Ми щодня запитуємо, щоб створити щохвилинні схеми системного аналізу для наших клієнтів. Я не помітив жодних звернень до продуктивності бази даних (хоча той факт, що вона зростає ~ 1 ГБ щодня, робить управління резервними копіями дещо більш залученим, ніж я хотів би).

Оновлення липня 2016 р

Ми досягли ~ 24,5 мільярдів рядків до того, як резервні копії стали достатньо великими, щоб ми вирішили скоротити записи старше двох років (~ 700 ГБ, що зберігаються в кількох резервних копіях, у тому числі на дорогих стрічках). Варто зазначити, що результативність не була суттєвим мотиватором у цьому рішенні (тобто вона все ще працювала чудово).

Кожному, хто намагається видалити 20 мільярдів рядків із SQL Server, настійно рекомендую цю статтю . Відповідний код на випадок, якщо посилання загине (прочитайте статтю, щоб отримати повне пояснення):

ALTER DATABASE DeleteRecord SET RECOVERY SIMPLE;
GO

BEGIN TRY
    BEGIN TRANSACTION
        -- Bulk logged 
        SELECT  *
        INTO    dbo.bigtable_intermediate
        FROM    dbo.bigtable
        WHERE   Id % 2 = 0;

        -- minimal logged because DDL-Operation 
        TRUNCATE TABLE dbo.bigtable;  

        -- Bulk logged because target table is exclusivly locked! 
        SET IDENTITY_INSERT dbo.bigTable ON;
        INSERT INTO dbo.bigtable WITH (TABLOCK) (Id, c1, c2, c3)
        SELECT Id, c1, c2, c3 FROM dbo.bigtable_intermediate ORDER BY Id;
        SET IDENTITY_INSERT dbo.bigtable OFF;
    COMMIT
END TRY
BEGIN CATCH
    IF @@TRANCOUNT > 0
        ROLLBACK
END CATCH

ALTER DATABASE DeleteRecord SET RECOVERY FULL;
GO

Оновлення в листопаді 2016 року

Якщо ви плануєте зберігати стільки даних в одній таблиці: не робіть. Я настійно рекомендую вам розглянути розділення таблиць (вручну або з вбудованими функціями, якщо ви використовуєте версію Enterprise). Це робить видалення старих даних настільки ж простим, як скорочення таблиці раз на тиждень / місяць / тощо. Якщо у вас немає Enterprise (чого у нас немає), ви можете просто написати сценарій, який запускається один раз на місяць, скидає таблиці старше 2 років, створює таблицю наступного місяця та регенерує динамічне представлення, яке приєднує весь розділ таблиці разом для зручності запитів. Очевидно, що "раз на місяць" і "старше 2 років" ви повинні визначати виходячи з того, що має сенс для вашого випадку використання.

Question 5

Я не знаю обмеження рядків, але я знаю таблиці з понад 170 мільйонами рядків. Ви можете пришвидшити його, використовуючи секціоновані таблиці (2005+) або подання, які з'єднують кілька таблиць.

Question 6

Я конкретно не знаю MSSQL, але 36 мільйонів рядків не є великим для корпоративної бази даних - працюючи з базами даних мейнфреймів, 100 000 рядків для мене звучить як конфігураційна таблиця :-).

Хоча я не прихильник деяких програм Microsoft, це не Access, про який ми тут говоримо: я припускаю, що вони можуть обробляти досить значні розміри баз даних зі своїми корпоративними СУБД.

Я підозрюю, що дні могли бути занадто тонкою роздільною здатністю, щоб розділити її, якщо вона взагалі потребує розділення.

Question 7

У нас є таблиці в SQL Server 2005 та 2008 з понад 1 мільярдом рядків (додається 30 мільйонів щодня). Я не можу собі уявити, щоб щодня спускатися вниз по щурячому гнізду, розкладаючи це на новий стіл.

Набагато дешевше додати відповідний простір на диску (що все одно вам потрібно) та оперативну пам’ять.

Question 8

Це залежить, але я б сказав, що для простоти краще тримати все в одній таблиці.

100 000 рядків на день - це насправді не така величезна кількість. (Залежно від апаратного забезпечення вашого сервера). Я особисто бачив, як MSSQL без проблем обробляє до 100 мільйонів рядків в одній таблиці. Поки ви тримаєте свої індекси в порядку, все повинно бути добре. Головне - мати купу пам’яті, щоб індекси не потрібно було міняти на диск.

З іншого боку, це залежить від того, як ви використовуєте дані, якщо вам потрібно зробити багато запитів, і його малоймовірні дані будуть потрібні, які охоплюють кілька днів (тому вам не потрібно буде приєднуватися до таблиць), це буде швидше розділити його на кілька таблиць. Це часто використовується в таких додатках, як управління промисловим процесом, де ви можете читати значення на прикладних 50000 приладах кожні 10 секунд. У цьому випадку швидкість надзвичайно важлива, але простота - ні.

Question 9

Ми переповнили цілий первинний ключ один раз (що становить ~ 2,4 мільярда рядків) у таблиці. Якщо існує ліміт рядків, ви, мабуть, ніколи не досягнете його лише 36 мільйонів рядків на рік.

Question 10

Ви можете заповнювати таблицю, поки не вистачить місця на диску. Для кращої продуктивності ви можете спробувати перейти на SQL Server 2005, а потім розділити таблицю та розмістити деталі на різних дисках (якщо у вас є конфігурація RAID, яка дійсно може вам допомогти). Розбиття розділів можливе лише в корпоративній версії SQL Server 2005. Приклад розділення можна переглянути за цим посиланням: http://technet.microsoft.com/en-us/magazine/cc162478.aspx

Також ви можете спробувати створити подання для найбільш використовуваної частини даних, що також є одним із рішень.

Сподіваюся, це допомогло ...

Question 11

Найбільша таблиця, яку я зустрічав на SQL Server 8 у Windows 2003, - 799 мільйонів із 5 стовпцями. Але чи є це доброю волею, це виміряти щодо SLA та випадку використання - наприклад, завантажити 50-100 000 000 записів і перевірити, чи все ще це працює.

Question 12

SELECT Top 1 sysobjects.[name], max(sysindexes.[rows]) AS TableRows, 
  CAST( 
    CASE max(sysindexes.[rows]) 
      WHEN 0 THEN -0 
      ELSE LOG10(max(sysindexes.[rows])) 
    END 
    AS NUMERIC(5,2)) 
  AS L10_TableRows 
FROM sysindexes INNER JOIN sysobjects ON sysindexes.[id] = sysobjects.[id] 
WHERE sysobjects.xtype = 'U' 
GROUP BY sysobjects.[name] 
ORDER BY max(rows) DESC

Question 13

Розділіть таблицю щомісяця. Це найкращий спосіб обробляти таблиці з великим щоденним напливом, будь то оракул або MSSQL.