Тривалість життя сторінки SQL Server 2012 скидається до 0 приблизно через 50 днів


12

Я помітив дивну поведінку на 2-серверному кластері HA і сподівався, що хтось може підтвердити мою підозру або, можливо, запропонувати якесь інше пояснення ... Ось моя настройка:

  • 2-серверна установка SQL 2012 SP1
  • SQL AlwaysOn HA увімкнено для кількох баз даних
  • Процесори - 2,4 ГГц, 4 ядра
  • Оперативна пам’ять - 34 Гб (це екземпляр AWS, отже, непарне число)
  • Використання ресурсів порівняно низьке - кожен сервер має вільну пам'ять 14+ ГБ, а SQL не обмежений кількістю пам'яті, яку потрібно використовувати
  • Час доступу до диска нормально - рідко триває більше 15 мс / читати чи писати
  • Бази даних не великі - 1 ГБ, 1,5 ГБ, 7,5 ГБ
  • Процес SQL-сервера використовує 16 Гб приватних байтів, 15 Гб робочого набору

Загалом жодних проблем із ресурсами не відмічено. Тепер для непарної частини. SQL не перезапускається (процес триває майже 6 місяців), але, схоже, кожні ~ 50 днів лічильник тривалості життя сторінки падає до (майже) 0. До цього моменту він стабільно піднімається, жодних крапель. Ось графік парфумів:

введіть тут опис зображення

Коли я дивлюся на дані лічильника (я не маю точної кількості, лише погодинна агрегація), здається, що значення лічильника PLE досягало приблизно 4 295 000 сек (приблизно за 50 днів) щоразу (принаймні кожен раз, коли у мене є дані).

Моя божевільна теорія полягає в тому, що число PLE утримується в мілісекундах, як непідписаний довгий int (який має обмеження в 4 294 967 295), і на 49,71 день воно скидається, або за дизайном, або через помилку. Це пояснило б поведінку двох серверів та ідентичну схему, яку вони мають. Або це може бути щось зовсім інше, і я просто не маю сенсу. :)

Хтось бачив щось подібне чи може пояснити цю поведінку?

PS Я бачив цей пост, але мій випадок здається дещо іншим.

PPS Це репост - я спочатку розмістив його тут , але порадив аудиторії тут більш доречно.

Дякую!


Коментарі не для розширеного обговорення; ця розмова була переміщена до чату .
Пол Білий 9

Відповіді:


3

Я бачив таку поведінку на клієнтському сайті під керуванням SQL2012 SP1. Особливості тут були NUMA, і PLE, що демонструє «пилоподібний» малюнок, але щогодини.

Кілька тем у SQLServerCentral обговорювались навколо цього:

http://www.sqlservercentral.com/Forums/Topic1415833-2799-1.aspx http://www.sqlservercentral.com/Forums/Topic1424826-2799-1.aspx

кінцевим результатом було те, що застосування SP1 CU4, здавалося, вирішило проблему.

CU4 містить виправданий вигляд виправлення Оновлення доступне для управління пам'яттю SQL Server 2012 KB2845380

Варто спробувати?


Дякуємо, що опублікували це (вибачте за затримку відповіді, чомусь я ніколи не отримував повідомлення про вашу пошту). Я поглянув на посилання - вони виглядають дещо подібними, тому я спробую скопіювати налаштування в QA, застосувати CU4 (або, можливо, навіть перейдіть прямо до SP2), після чого ще раз перевірте. З темпом, який я бачу це (кожні 50 днів), я пройду деякий час, перш ніж я можу підтвердити, але я відправлю повідомлення, коли у мене будуть результати. До речі, мої схеми все ще зберігаються - стійкий підйом ~ 50 днів, потім різке падіння до ~ 0, і підйом знову - всього 4 з моменту запуску служби в грудні.
CRCerr0r

Оновлення ... Я підтвердив це в нашому середовищі якості. Статистика, яку я отримав звідти, є: Загальна кількість днів між скидами - 49,71 (+/- 1 хвилина); Досягнуте максимальне значення PLE - 4,294,961 (за 1 хвилину зразків, тому воно могло бути трохи вище). Це в значній мірі підтверджує виробничі спостереження. Я застосую CU4 і звітую ще через ~ 50 днів ... :)
CRCerr0r

1
Будь-які новини з цього приводу?
Майкл Грін
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.