У мене є сервер HP ProLiant DL380 G7, який працює як блок зберігання NexentaStor . Сервер має 36 Гб оперативної пам’яті, 2 контролери SAS 9211-8i SAS (відсутні розширювачі SAS), 2 системні накопичувачі SAS, 12 накопичувачів даних SAS, диск із гарячим запасом, кеш-пам'ять Intel X25-M L2ARC та прискорювач DDRdrive PCI ZIL. Ця система обслуговує NFS для декількох хостів VMWare. У мене також є близько 90-100 ГБ подвійних даних на масиві.
У мене було два інциденти, коли продуктивність несподівано запрацювала, залишивши гостей VM та Nexenta SSH / веб-консолей недоступними та вимагаючи повного перезавантаження масиву для відновлення функціональності. В обох випадках не вдалося або було "відхилено" Intel X-25M L2ARC SSD. NexentaStor не зміг попередити мене про помилку кешу, однак загальне попередження ZFS FMA було видно на екрані консолі (що не відповідає).
Результат zpool status
показав:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Це не викликало жодних сповіщень з боку Nexenta.
У мене було враження, що збій L2ARC не вплине на систему. Але в цьому випадку він, безумовно, був винуватцем. Я ніколи не бачив жодних рекомендацій щодо RAID L2ARC. Видалення поганого SSD повністю з сервера повернуло мене до роботи, але я стурбований наслідком відмови пристрою (а може бути і відсутністю сповіщення від NexentaStor).
Редагувати - Який сьогодні найкращий вибір SSD для кеш-програм L2ARC сьогодні?