Що стосується вашого питання - так, ви втратите доступ до всіх машин у цьому фізичному хості. Звичайно, залежить, який компонент не вдався. Якщо це диск - це певна проблема, якщо це материнська плата - це набагато простіше. Загалом відновлення апаратури простіше, оскільки гіпервізор апаратно-агностичний. На даний момент існує велика кількість технологій, пов'язаних з постачальниками, які можна використовувати для високодоступних послуг.
Ресурсні пули (vmware) - НЕ здатні агрегувати декілька фізичних ресурсів хоста (процесор, пам'ять тощо), як хтось згаданий вище, тому якщо у вас є 2 фізичні хости (скажімо, 1CPU чотирьохядерний без гіперточення - 8GBRAM кожен), це НЕ буде можливо, там 5VCPU-12Gb VM. Пул ресурсів є логічним, вони не в змозі створити суперкомп'ютерні системи. Зараз це спосіб контролювати використання ресурсів.
Доступність (vmware) - можна використовувати такі технології, як High Availability (HA), які дозволяють автоматично автоматичне відновлення (виходячи з мого досвіду протягом 1-2 хв ) всіх віртуальних машин кластера автоматично, якщо ви використовуєте Storage Array (NAS, iSCSI, FC) і зберігати там усі файли VM. Більше HA працює лише у випадку відмови процесора, оперативної пам’яті, материнської плати, очевидно, що це не буде працювати з накопичувальним масивом. Щоб запобігти збоям RAID / контролерів, люди використовують дзеркальне відображення Replication, Storage LUN тощо.
Якщо відновлення протягом 1-2 хв не є можливим, є такі технології, як Fault Tolerance (FT), які дозволяють досягти простою ZERO простою VM у разі відмови, зберігаючи тіньову (запущену) копію налаштованої VM. Але ця технологія також має чимало обмежень - проблема невідповідності VM з декількома vCPU повністю не вирішена.
Загалом, кожне рішення залежить від вашої мети.