Якщо коротко, ми повинні проектувати смерть у наші програми, процеси та нитки на низькому рівні, для блага загальної системи?
Невдачі трапляються. Процеси гинуть. Ми плануємо катастрофу і періодично відновлюємося від неї. Але ми рідко розробляємо та впроваджуємо непередбачувану програму смерті. Ми сподіваємось, що час роботи наших служб триває до тих пір, поки ми дбаємо про те, щоб вони не працювали.
Макро-приклад цієї концепції - Хаоська мавпа Netflix , яка випадковим чином припиняє випадки AWS у деяких сценаріях. Вони стверджують, що це допомогло їм розкрити проблеми та побудувати більш зайві системи.
Про що я говорю - це нижчий рівень. Ідея полягає в тому, щоб традиційно тривалий процес випадковим чином вийшов. Це повинно призвести до надмірності дизайну і, в кінцевому рахунку, створити більш стійкі системи.
Чи має це поняття вже назву? Це вже використовується в галузі?
EDIT
На основі коментарів та відповідей, я боюся, що я не зрозумів у своєму питанні. Для наочності:
- так, я маю на увазі випадково,
- так, я маю на увазі у виробництві, і
- ні, не тільки для тестування.
Для пояснення я хотів би провести аналогію з багатоклітинними організмами.
У природі організми складаються з багатьох клітин. Клітини розщеплюються, щоб створити надмірність, і вони зрештою гинуть. Але для функціонування організму завжди повинно бути достатньо клітин правильного виду. Ця надмірна система також полегшує оздоровлення при травмах. Клітини гинуть, так живе організм.
Включення випадкової смерті в програму змусить більшу систему приймати стратегії надмірності, щоб залишатися життєздатними. Чи допомогли б ці самі стратегії залишатися стабільними в умовах інших видів непередбачуваних збоїв?
І якщо хтось спробував це, як це називається? Я хотів би прочитати більше про це, якщо він уже існує.