Ми готуємося здійснити велике оновлення наших SQL серверів і помічаємо деяку незвичну поведінку з групами розподіленої доступності, які я намагаюся вирішити, перш ніж рухатись вперед.
Минулого місяця я модернізував віддалений вторинний сервер із SQL Server 2016 до SQL Server 2017. Цей сервер є частиною декількох груп розподіленої доступності (DAG) та окремої групи доступності (AG) . Коли ми оновили цей сервер, ми не усвідомлювали, що він перейде в нечитабельний стан , тому протягом останнього місяця ми покладалися виключно на основний сервер.
У рамках майбутнього оновлення я застосував патч CU 4 до сервера та перезавантажив його. Коли сервер повернувся до Інтернету, щойно виправлене вторинне повідомлення показало, що всі DAG / AG синхронізуються без проблем.
Однак первинна демонструвала зовсім іншу історію. Це повідомляло
- окремий АГ синхронізувався без жодних питань
- але DAGs були в НЕ Synchronzing / Чи не Здорове стан
Після спочатку паніки я спробував зробити такі речі, щоб знову синхронізуватись у DAG:
- З первинного я зупинився і відновив рух даних. Це не почало синхронізувати дані.
- На вторинному (той, який я щойно латав) я запустив
ALTER DATABASE [<database] SET HADR RESUME;
- який виконується без помилок, але не відновив синхронізацію
Моєю останньою спробою знову синхронізувати дані було ввійти до вторинного та вручну перезапустити службу SQL Server. Перезапуск служби вручну здається трохи екстремальним, тому що я б очікував, що перезавантаження сервера було б достатньо.
Хтось зіткнувся з цією проблемою, коли DAG не починає синхронізуватись із вторинним після перезавантаження? Якщо так, то як це було вирішено?
Я перевірив і журнал помилок SQL Server, і переглядач подій на вторинному сервері, нічого спільного я не міг бачити.