Чим відрізняється федеративний та децентралізований склад даних?


9

Я не можу знайти чітких визначень чи пояснень жодного з них. Обидва здаються децентралізованими. Виявляється, що у Federated DWH дані поширюються та не інтегруються в єдине сховище та отримують доступ із розподілених джерел.

Перебуваючи в децентралізованій реалізації DWH, дані інтегруються в одне центральне сховище.

Поясніть, будь ласка, різницю між цими двома реалізаціями.


Відповіді:


6

Децентралізований сховище даних - це, по суті, сукупність сховищ даних, що підтримуються окремими регіонами або бізнес-підрозділами, але доступні централізовано. Вони можуть знаходитися на одному фізичному сервері, ділитися інструментами звітності або бути доступними для організації якось іншим способом. Можуть також бути централізовані компоненти, такі як управління основними даними. Зазвичай це робиться через те, що централізовані сховища даних отримують громіздкість за певний розмір організації. Склад даних повинен реагувати на зміни, і якщо він надто не реагує, то окремі відділи почнуть розробляти власні рішення.

Це можна побачити в інвестиційних банках, де тенденція полягає в створенні сховищ даних, щоб відповідати конкретним вимогам (наприклад, певна регулятивна ініціатива чи якийсь тип фінансової звітності), а не будувати централізований склад для всього бізнесу. Компанія розміром з великим банком просто занадто складна, щоб виконувати вимоги до повністю централізованої EDW за розумний проміжок часу.

Об'єднаний сховище даних додає основний рівень консолідації через децентралізовані сховища даних. Як правило, це містить лише вузький вертикальний фрагмент даних, оскільки його мета полягає в консолідації ключових показників у всьому бізнесі для звітування на рівні компанії або групи, а не в узагальненій платформі ІМ для всіх підрозділів. Департаменту залишається виробляти власні системи EDW або MI, але вони повинні представити набори даних, необхідні для заселення центрального рівня консолідації.

Ця архітектура дає найкраще з обох світів. Центральне управління може бачити їх показники по всій організації, а відділи можуть організовувати рішення ІМ для задоволення їх потреб. Центральному управлінню потрібно лише нав'язати вимоги до даних, необхідні їх аналітиці та ІМ, як канали, що надаються відомчими системами. Якщо їм потрібна більш поглиблена звітність чи аналіз у певному відділі, то це може бути забезпечено відомчими системами.

У статті, що посилається нижче, більш детально розглядаються об'єднані сховища даних.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

У цій статті більш глибоко розглядаються топології сховищ даних.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2


Тож вони обидва децентралізовані, але об'єднані інтегрують підмножину (ключові показники) в одному місці?
LifeH2O

Так. Це правильно. Майте на увазі, що ці визначення досить неформальні, тому люди можуть використовувати їх по-різному. У мене ніколи не було приводу будувати будь-який тип системи, хоча я колись робив пропозицію щодо об'єднаної архітектури, і я бачив пару сайтів, які мали системи, які можна було б охарактеризувати як децентралізовані за допомогою визначень, які я використовую.
ЗанепокоєнийOfTunbridgeWells
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.