Еван потрапив у деякі непогані моменти, але ось, можливо, якийсь конкретний економічно ефективний спосіб отримати підрядна час відновлення за умови невдач.
Малий бізнес, ймовірно, означає невелике обладнання, тому може не витрачати багато простих речей, які фактично додають значної кількості стійкості в умовах проблем. Основна ідея просто мати додаткове обладнання, готове до роботи.
По-перше, спокійно подумайте про віртуальний IP. Це IP-адреса, з якою користувачі розмовлятимуть, але можуть розміщуватися на будь-якому сервері, якому ви надаєте її. Це IP-адреса, з якою ви користуєтеся, і програми хочуть поговорити. І це буде найбільш корисним для ультимативно будь-якого рішення, на яке ви підете. Наявність VIP означає, що вам не доведеться перенастроювати будь-які додатки, коли ви не працюєте. Також майте на увазі, що наявність надмірного обладнання також впливає на збільшення витрат на адміністрування, роблячи два оновлення конфігурації замість 1.
Якщо ми почнемо з маршрутизації / веб-проксі-сервера, це, мабуть, найпростіше, оскільки їх не буде реальним станом, який потрібно зберігати у самій коробці. Тому просто дістаньте дублікат того самого поля і налаштуйте його однаково. Я б і надалі підключався до сегменту локальної мережі, і припускаючи, що Інтернет є на іншому інтерфейсі, міняйте кабелі, якщо їх не вдалося. З точки зору маршрутизації, ви встановлюєте всіх клієнтів, які ви використовуєте, щоб націлювати на .1 адресу (VIP) за маршрутом за замовчуванням, а проксі-сервер надає серверу A адресу .2 та серверу B адресу .3. Таким чином, ними можна керувати для оновлення конфігурації (стосується обох). І все, що вам потрібно зробити, щоб вийти з ладу, - це видалити призначення .1 IP з .2 та перенести його на .3 та перенести підключення до Інтернету до іншого інтерфейсу. Це не дуже складно, легко зробити і зрозуміти, і коштує додаткове обладнання другої коробки. Якщо ви можете отримати надмірність в Інтернеті, ви можете додати складності та отримати автоматичну відмову, використовуючи щось на зразок VRRP.
Без конкретики важко сказати, але ти веб-сервер може бути таким же простим. Додайте другий сервер з Ідентичною конфігурацією, створіть vIP між двома та перемістіть VIP до резервної копії за умови відмови. Я, як правило, не заперечую, якщо стан сеансу втрачено в режимі відмови (це критична проблема, щоб викликати аварію). Тож якщо користувачам доведеться знову входити в систему, нічого страшного. Знову ж таки, vrrp може бути використаний для автоматичного відмови.
Перейшовши на вашу БД, це значно складніше. Більшість БД мають якусь первинну / вторинну модель, де ви створюєте резервну копію оригінальної БД у вторинну, а потім копіюєте всі журнали транзакцій або зміни БД у вторинну. Знову ж таки, ви можете комбінувати це з VIP-адресами для додатків / користувачів, які фактично отримують доступ до БД. Однак аварійний перебіг ускладнюється. Залежно від несправності основного, можливо, вам потрібно буде фактично запустити накопичувачі та працювати, щоб копіювати та залишати журнали транзакцій. Потім піднесіть вторинну активну. Якщо ви можете терпіти деякі втрачені дані, ви можете вивести вторинну активну відразу. Після відмови, сервер B тепер стає основним, і ви працюєте над тим, щоб відновити сервер A і перетворити його в нову резервну копію, щоб він був готовий до виходу з ладу, коли з сервером b з часом виникнуть проблеми.
Файлові сервери завжди є найважчою частиною, оскільки на відміну від БД, набагато складніше отримати вбудовану функцію файлової системи. Однак деякого рівня стійкості можна досягти, маючи другий сервер і просто написати сценарій, який сканує файлову систему на предмет змін та скопіює будь-які нові файли, щоб ви були вторинними. Ви в основному можете запустити rsync на кроні, я вважаю, що це зробити. Знову ж таки, ви використовуєте VIP, який ви надаєте користувачам, і ви переходите, якщо ви не працюєте на відмову. У вашому сценарії я дуже рекомендую вам перевірити, щоб переконатися, що система є власником VIP, перш ніж передавати файли. Ви насправді дуже не хочете, щоб rsync виконувався в неправильному напрямку та переписував будь-які зміни, які ви вносите користувачам. Це може втратити деякі файли, якщо їх помилка,
Я поняття не маю, що ти міг би зробити із системою телефону ... це дійсно залежить від постачальника та способів його налаштування. Постачальник може мати щось на полиці для стійкості.
Деякі заключні слова попередження. Переконайтесь, що ви ретельно перевірили будь-яку установку, з якою збираєтесь піти. Переконайтеся, що ви знаєте, як її відмовити, не втрачаючи цієї критичної інформації. Перевірте тестовий тест, щоб переконатися, що він спрацює, коли вам потрібно. Переконайтесь, що у вас є процеси, що зміни конфігурації, оновлення програмного забезпечення тощо застосовуються належним чином як до первинних, так і до резервних копій. Хороша новина полягає в тому, що ви, ймовірно, можете робити контрольовані відмовки, коли хочете звести сервер до оновлення тощо. Це не активна активна настройка, тому ви не маєте уявлення, чи буде вторинний працювати, коли вам це потрібно.
Я працюю в телекомунікаціях, і наше обладнання дуже надлишкове, включаючи в більшості випадків географічну надмірність. Наша помилка № 1 - це надмірність не перевіряється після змін, і користувачі, які вносять зміни, які не знають, як працює модель надмірності. Однак у нас є додаткова проблема, що все наше обладнання потребує підтримки автоматичного відмови протягом не більше ніж декількох секунд. Ви можете терпіти ручне втручання у відмовників, якщо вам потрібно буде бути лише 30 - 60 хвилин. Вам просто потрібно бути готовим. Удачі.