Тривалість життя сторінки SQL Server 2012 скидається до 0 приблизно через 50 днів

Я помітив дивну поведінку на 2-серверному кластері HA і сподівався, що хтось може підтвердити мою підозру або, можливо, запропонувати якесь інше пояснення ... Ось моя настройка:

2-серверна установка SQL 2012 SP1
SQL AlwaysOn HA увімкнено для кількох баз даних
Процесори - 2,4 ГГц, 4 ядра
Оперативна пам’ять - 34 Гб (це екземпляр AWS, отже, непарне число)
Використання ресурсів порівняно низьке - кожен сервер має вільну пам'ять 14+ ГБ, а SQL не обмежений кількістю пам'яті, яку потрібно використовувати
Час доступу до диска нормально - рідко триває більше 15 мс / читати чи писати
Бази даних не великі - 1 ГБ, 1,5 ГБ, 7,5 ГБ
Процес SQL-сервера використовує 16 Гб приватних байтів, 15 Гб робочого набору

Загалом жодних проблем із ресурсами не відмічено. Тепер для непарної частини. SQL не перезапускається (процес триває майже 6 місяців), але, схоже, кожні ~ 50 днів лічильник тривалості життя сторінки падає до (майже) 0. До цього моменту він стабільно піднімається, жодних крапель. Ось графік парфумів:

введіть тут опис зображення

Коли я дивлюся на дані лічильника (я не маю точної кількості, лише погодинна агрегація), здається, що значення лічильника PLE досягало приблизно 4 295 000 сек (приблизно за 50 днів) щоразу (принаймні кожен раз, коли у мене є дані).

Моя божевільна теорія полягає в тому, що число PLE утримується в мілісекундах, як непідписаний довгий int (який має обмеження в 4 294 967 295), і на 49,71 день воно скидається, або за дизайном, або через помилку. Це пояснило б поведінку двох серверів та ідентичну схему, яку вони мають. Або це може бути щось зовсім інше, і я просто не маю сенсу. :)

Хтось бачив щось подібне чи може пояснити цю поведінку?

PS Я бачив цей пост, але мій випадок здається дещо іншим.

PPS Це репост - я спочатку розмістив його тут , але порадив аудиторії тут більш доречно.

Дякую!

sql-server sql-server-2012 page-life-expectancy

— CRCerr0r
джерело

Коментарі не для розширеного обговорення; ця розмова була переміщена до чату .

— Пол Білий 9

Я бачив таку поведінку на клієнтському сайті під керуванням SQL2012 SP1. Особливості тут були NUMA, і PLE, що демонструє «пилоподібний» малюнок, але щогодини.

Кілька тем у SQLServerCentral обговорювались навколо цього:

http://www.sqlservercentral.com/Forums/Topic1415833-2799-1.aspx http://www.sqlservercentral.com/Forums/Topic1424826-2799-1.aspx

кінцевим результатом було те, що застосування SP1 CU4, здавалося, вирішило проблему.

CU4 містить виправданий вигляд виправлення Оновлення доступне для управління пам'яттю SQL Server 2012 KB2845380

Варто спробувати?

— Кев Райлі
джерело

Дякуємо, що опублікували це (вибачте за затримку відповіді, чомусь я ніколи не отримував повідомлення про вашу пошту). Я поглянув на посилання - вони виглядають дещо подібними, тому я спробую скопіювати налаштування в QA, застосувати CU4 (або, можливо, навіть перейдіть прямо до SP2), після чого ще раз перевірте. З темпом, який я бачу це (кожні 50 днів), я пройду деякий час, перш ніж я можу підтвердити, але я відправлю повідомлення, коли у мене будуть результати. До речі, мої схеми все ще зберігаються - стійкий підйом ~ 50 днів, потім різке падіння до ~ 0, і підйом знову - всього 4 з моменту запуску служби в грудні.

— CRCerr0r

Оновлення ... Я підтвердив це в нашому середовищі якості. Статистика, яку я отримав звідти, є: Загальна кількість днів між скидами - 49,71 (+/- 1 хвилина); Досягнуте максимальне значення PLE - 4,294,961 (за 1 хвилину зразків, тому воно могло бути трохи вище). Це в значній мірі підтверджує виробничі спостереження. Я застосую CU4 і звітую ще через ~ 50 днів ... :)

— CRCerr0r

Будь-які новини з цього приводу?

— Майкл Грін