Отже, сценарій такий:
У мене є кілька екземплярів веб-служби, яка записує крапку даних у сховище Azure. Мені потрібно вміти групувати крапки в контейнер (або віртуальний каталог) залежно від того, коли він був отриманий. Час від часу (щонайменше щодня) старі краплі обробляються, а потім видаляються.
У мене є два варіанти:
Варіант 1
Я роблю один контейнер, який називається "краплі" (наприклад), а потім зберігаю всі блоги в цьому контейнері. Кожна крапка буде використовувати ім'я стилю каталогу з ім'ям каталогу, що відповідає часу отримання (наприклад, "hr0min0 / data.bin", "hr0min0 / data2.bin", "hr0min30 / data3.bin", "hr1min45 / data.bin ", ...," hr23min0 / dataN.bin "тощо - новий каталог кожні X хвилин). Те, що обробляє ці краплі, спочатку обробляє великі краплі hr0min0, потім hr0minX тощо (а краплі все ще записуються під час обробки).
Варіант 2
У мене є багато контейнерів, кожен з яких має ім'я, засноване на часі прибуття (отже, спочатку буде контейнер з назвою blobs_hr0min0, потім blobs_hr0minX тощо), і всі крапки в контейнері - це ті краплі, які прибули в зазначений час. Те, що обробляє ці блоги, буде обробляти по одному контейнеру за раз.
Тож моє запитання: який варіант кращий? Чи надає мені варіант 2 кращу розпаралелізацію (оскільки контейнери можуть бути на різних серверах), чи варіант 1 кращий, оскільки багато контейнери можуть спричинити інші невідомі проблеми?