Як мені безпечно вийти з цієї ситуації?
Деталі такі:
Сервер xen має блокові пристрої, призначені для VM. Але ці пристрої також були встановлені всередині Xen.
Насправді 44 з цих блокових пристроїв встановлені так. Що ще гірше, кожен фізичний пристрій бачиться на 4 контурах, і кожен з них встановлюється на окремій точці кріплення. Іншими словами, пристрої фактично змонтовані 5 разів кожен.
Гостьова ОС VM бачить шлях через псевдопристрій PowerPath (виділяється як phy: блокувати пристрій до domU)
Деякі пристрої відформатовані як ext2 та reiserfs.
Не потрібно мені пояснювати ризики корупції файлової системи.
Я боюся, що навіть просто відключення файлових систем може призвести до корупції, і я вважаю, що в цей момент витягнення живлення з хоста є найбезпечнішим варіантом .
Зауважте, що додатки, бази даних Oracle здебільшого, у всіх VM все ще працюють і використовуються.
Я виявив це, коли досліджував високе використання процесора на dom0. Існує нерозбірливий процес "знайти", з cwd -> / media / disk-12, який монтується з / dev / sdf1, що належить / dev / emcpowerr
Перш ніж хтось запитує, я, коли я бачив, як процеси не можуть бути вбиті і продовжують використовувати процесор і оперативну пам’ять (на відміну від неіснуючого / зомбі-процесу), це коли є видатний зафіксований ввід / вивід, наприклад синхронізація повернута, але фізично ще не на диску . Частіше це трапляється на стрічкових введеннях / виводах.
Пропозиції !?
PS Я б очікував, що пристрої будуть "зарезервовані" після встановлення, щоб не допустити подібних речей? Або це неможливо в Linux?
EDIT: По-перше, я переконаний, що винуватець KDE в гіпервізорі). Схоже, KDE монтує пристрої, які він може вести в журнал, щоб створювати піктограми на робочому столі. Те ж саме не відбувається і на інших серверах Xen, але всі інші сервери мають набагато більш стару версію SLES та KDE ... Здається, що V4 ображає, а 3.4 веде себе краще).
Крім того, вивісили два некритичні ВМ. Після їх вимкнення вони не завантажуватимуться знову через пошкодження файлової системи. Основний / виробничий VM все ще працює, і база даних на ньому все ще працює, але очевидно, що це бомба часу. Замовник намагається відновити середовище на іншому VM на іншому сервері, але він застряг у питаннях налаштування деяких компонентів, тому ми чекаємо ...
У будь-якому випадку я відчуваю, що жодна з відповідей досі не була більше, ніж "найкраща практика завжди граціозно закривається". І я сподіваюся отримати щось більш конкретне ... У будь-якому випадку, я відчуваю, що ця ситуація може бути підставою для більш обережних мислення. Чи призведе до вимкнення синхронізованих вводу-виводу, зокрема оновлення метаданих файлової системи від гіпервізора, і спричинить потенційно серйозне пошкодження файлової системи?