Я розглядав MTTF, MTBF, MTBR і MTBF для серверів HP Gen9, що працюють в нашому виробничому середовищі.
Корінь мого питання, варто хвилюватися чи ні.
Я не можу отримати хороших даних, оскільки кожен сервер має поєднання обладнання.
У моїй останній компанії ми працювали близько 2000 сервера dell r210 r410 r710, я б сказав, що в середньому у нас було близько 5 серверів на день, які мали певний збій. Таким чином, приблизно 0,25% сервера важко знизилися і потрібно було замінити його частину, перш ніж можна було знову використовувати.
У моїй останній компанії все було налаштовано на пару HA, інфраструктуру N + 2, так що це не впливало на виробництво. Нам вдалося замінити сервери і продовжувати роботу
У моєму офісі ми запускаємо 9 серверів (HP Gen9, 56 VM's Hyper-V), ми не тримаємо багато запасних частин під рукою, також центр обробки даних не керується, тому якщо щось вмирає, нам доведеться їхати приблизно 45 хвилин, щоб замінити що завгодно.
Мій CTO, ні менеджер з інформаційних технологій, схоже, не хвилюються, минулого року у них було близько 2,5 днів простою, я запевняю, що нам потрібно кластерувати сервери, але вони не бачать потреби.
Тут неправильно чи правильно? Не впевнений, що робити.
Я знаю, що це не моя відповідальність, якщо щось трапиться на CTO. Це дуже маленька компанія, лише КТО, ІТ-менеджер, я (розробник) та 1 хлопець.
Незважаючи на весь досвід роботи з виробничим середовищем, дуже обмеженим, так, як багато всього налаштовано, я б назвав дуже молодшим рівнем, ні мій CTO, ні ІТ-менеджер не знали багато про групування, перш ніж я туди потрапив. Вони опинилися в середині проекту по встановленню ДР без ВА, проти якого я боровся, але програв.