Машина часу, ZFS та дедуплікація


8

На даний момент я експортую розділ ZFS за dedup=onдопомогою ubuntu-zfsі netatalk. Однак машина часу наполягає на тому, щоб створити на ній розрідження, і це змусило мене задуматися, чи не вплине це на дедуплікацію, оскільки поняття "файли" зникає, і, ймовірно, вирівнювання блоків теж не буде великим. .

PS Уся моя ідея використання дедуппінгу полягає в тому, що у мене є кілька резервних копій макбуків на тому ж місці, і багато їх файлів рівні.


Додаток: Здається, що вирівнювання на рівні блоку не вдається. Ось мій досвід:

  • Часові копії двох різних комп'ютерів з великою кількістю копій даних (всього 200 Гбіт)
  • CCC дві книги для двох рідких зображень.

Коефіцієнт дедупликації? 1,01x


Будь-які ідеї про те, як налаштувати дефіцит ZFS для правильної роботи з резервними копіями часу? Чи варто починати шукати інші резервні (w / dedup) альтернативи?


Стиснення здається кращим варіантом. Чи може це бути шифрування? Два зашифровані файли з однаковим вмістом можуть дуже «виглядати» по-різному у файловій системі внизу через те, як працює шифрування. Я б міг уявити, що дедуп добре працює на незашифрованому томі, навіть якщо це один величезний файл, а не розріджений пакет.
Олег Лобачов

Відповіді:


7

Дедуплікація на ZFS є блоковим рівнем, тому це не залежить від концепції файлів. Єдиний спосіб дедупликації може бути переможений - якщо зміщення файлу в розрізненому просторі не завжди є однаковим за модулем розміром блоку. Оскільки ZFS може використовувати змінні розміри блоків, що перевищують розмір блоку файлової системи HFS + всередині розрізненого пакета, правильне вирівнювання не гарантується, але також не гарантується, що дедуплікація не завершиться.

Якщо ви турбуєтесь про місце, ви також можете включити компресію в пулі ZFS. Це накладає додаткові накладні витрати на процесор, але фактично може збільшити ефективну пропускну здатність диска.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.