Чим відрізняється база даних та сховище даних?


163

Чим відрізняється база даних та сховище даних?

Це не одне і те ж, або принаймні написане в одній речі (тобто. Oracle RDBMS)?

Відповіді:


147

Перевірте це для отримання додаткової інформації.

З попереднього посилання:

База даних

  1. Використовується для он-лайн трансакційної обробки ( OLTP ), але може використовуватися для інших цілей, таких як зберігання даних. Це записує дані від користувача за історію.
  2. Таблиці та з'єднання є складними, оскільки вони нормалізуються (для RDMS ). Це робиться для зменшення зайвих даних та економії місця на зберіганні.
  3. Сутність - методи реляційного моделювання використовуються для проектування баз даних RDMS.
  4. Оптимізований для операції запису.
  5. Ефективність для запитів аналізу низька.

Інформаційне сховище

  1. Використовується для он-лайн аналітичної обробки ( OLAP ). Тут читаються історичні дані для користувачів для прийняття бізнес-рішень.
  2. Таблиці та з'єднання прості, оскільки вони денормовані. Це робиться для скорочення часу відповіді на аналітичні запити.
  3. Дані - для моделювання сховищ даних використовуються методи моделювання.
  4. Оптимізовано для операцій з читанням.
  5. Висока ефективність для аналітичних запитів.
  6. Є , як правило , бази даних.

Важливо також зазначити, що сховища даних можуть бути отримані від нуля до багатьох баз даних.


3
Моделювання даних - це загальний термін і не стосується лише сховищ даних. (Можливо, у другій №3 вони мали на увазі "розмірне моделювання", як це, на мій досвід, найпопулярніший спосіб їх побудови.) Останній рядок не має сенсу: як сховище даних "містить" базу даних? Я міг би сказати сховище даних джерел від 0 до багатьох (OLTP) база даних.
Патрік Маршанд

2
@Mark - Де зазначено, що бази даних є ТОЛЬКО для OLTP? Це показує, як бази даних відносяться до сховищ даних.
TheCloudlessSky

5
@Nickolay - це дворічна відповідь. Відредагуйте його та виправте, якщо вас хвилює.
TheCloudlessSky

1
@DataMan - Позначте це правильною відповіддю. це досить гарна та справедлива відповідь на ваше запитання.
sanzy

1
яка різниця між методами даних - моделювання та сутністю - методами реляційного моделювання?
QAIS

32

З нетехнічного погляду: База даних обмежена певними програмами або набором програм.

Склад даних - це сховище даних на рівні підприємства. Він буде містити дані з усіх / багатьох сегментів бізнесу. Цією інформацією буде надано загальну інформацію про бізнес. Це також важливо для інтеграції між різними сегментами бізнесу.

З технічного погляду: Слову "Склад даних" не було визнано визначення. Особисто я визначаю сховище даних як набір даних. Якщо кожен март даних складається з однієї або декількох баз даних, де база даних є специфічною для конкретного набору проблем (програми, набір даних або процес).

Простіше кажучи, база даних є складовою сховища даних. Є багато місць, щоб вивчити цю концепцію, але оскільки не існує "визначення", ви знайдете виклики з будь-якою вашою відповіддю.


Datamart - це бажано база даних OLTP?
CᴴᴀZ

@ CᴴᴀZ для чого? Datamart створені для OLAP, Datamart - це невелика кількість DWH (для невеликої частини бізнесу). він створений для аналізу, тому якщо вам потрібна система OLTP, Datamart не є вашим вибором, якщо вам потрібна модель даних для аналізу (стартова схема або потік снігу), тоді ви віддасте перевагу Datamart.
Енріке Беніто Касадо

Привіт @ Енріке, зрозумів: Datamart сприяє роботі OLAP. Звідси я взяв підказку, що Datamarts є OLTP - SQL Server OLTP Datamart .
CᴴᴀZ

Привіт @ CᴴᴀZ, я прочитав статтю, і було б просто як зробити OLTP з Datamart. гаразд . (але я думаю, що вони сказали це як виняток) Візьміть до уваги, що, як вони говорять над, таблицями OLTP, вони повинні бути нормалізовані, щоб не мати непослідовностей. нормалізація не є такою складною для виконання схеми ER, але це набагато складніше для Star-Schema або Snow-Flow. Ці схеми створені для полегшення читання в Базі даних, а не для транзакційних операцій. Ось чому використання Datamart типу OLTP не повинно бути гарною ідеєю, навіть якщо це можливо.
Енріке Беніто Касадо

16

Склад даних - це ТИП бази даних.

На додаток до того, що люди вже говорили, сховища даних, як правило, є OLAP, з індексами тощо, налаштованими на читання, а не на запис, а дані денормовані / перетворюються на форми, які легше читати та аналізувати.

Деякі люди кажуть, що "бази даних" такі ж, як і OLTP - це неправда. OLTP, знову ж, - ТИП бази даних.

Інші типи "баз даних": текстові файли, XML, Excel, CSV ..., плоскі файли :-)


1
Це правильна відповідь на них усіх. І трохи про Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

Найпростіший спосіб пояснити це - сказати, що склад даних складається з більш ніж просто бази даних. База даних - це сукупність даних, організованою певним чином, але склад даних організований спеціально для "полегшення звітності та аналізу". Однак це не вся історія, оскільки зберігання даних також містить "засоби для отримання та аналізу даних, вилучення, перетворення та завантаження даних, а також управління словником даних також вважаються важливими компонентами системи зберігання даних".

Інформаційне сховище


4

База даних : - OLTP (онлайн-транзакційний процес)

  • Це поточні дані, сучасні детальні дані, плоскі реляційні ізольовані дані.
  • Суб'єкт відносин використовується для проектування бази даних
  • Розмір БД 100МБ-ГБ проста транзакція або запити

Інформаційне сховище

  • OLAP (Інтернет-аналітичний процес)
  • Йдеться про історичні дані Зіркова схема, схема зігнутих снігом та галактика
  • схема використовується для проектування сховища даних
  • Розмір БД 100 ГБ-ТБ Покращена основа для запитів для візуалізації даних для видобутку даних
  • Дозволяє користувачам отримати глибше розуміння та знання про різні аспекти своїх корпоративних даних за допомогою швидкого, послідовного, інтерактивного доступу до широкого спектру можливих переглядів даних

4

Склад даних проти бази даних: Склад даних спеціально розроблений для аналізу даних, який передбачає зчитування великої кількості даних, щоб зрозуміти взаємозв'язки та тенденції в даних. База даних використовується для збору та зберігання даних, таких як запис реквізитів транзакції.

Склад даних: відповідні навантаження - Аналітика, звітність, великі дані. Джерело даних - дані, зібрані та нормалізовані з багатьох джерел. Збір даних - операції масового запису, як правило, за заданим пакетним графіком. Нормалізація даних - Денормалізовані схеми, наприклад, схема Зірка або Сніжинка. Зберігання даних - Оптимізовано для простоти доступу та швидкого запиту. продуктивність з використанням стовпчастого зберігання. Доступ до даних - Оптимізований для мінімізації вводу-виводу та максимальної пропускної здатності даних.

Транзакційна база даних: відповідні навантаження - обробка транзакцій. Джерело даних - дані, захоплені як є, є з одного джерела, наприклад транзакційної системи. Збір даних - Оптимізовано для операцій безперервного запису, оскільки доступні нові дані для максимальної пропускної здатності транзакцій. Нормалізація даних - Високо нормалізовані статичні схеми. Зберігання даних - Оптимізовано для високих операцій запису до фізичного блоку, орієнтованого на рядки. Доступ до даних - Великі обсяги малих операцій зчитування.


1

Будь-яке сховище даних для додатків зазвичай використовує базу даних. Це може бути реляційна база даних або відсутні бази даних sql, які зараз є в тренді.

Склад даних також є базою даних. Ми можемо називати базу даних сховища даних як спеціалізоване сховище даних для цілей аналітичної звітності для компанії. Ці дані використовуються для ключових бізнес-рішень.

Організовані дані допомагають ефективно звітувати та приймати ділові рішення.


1

База даних:

Використовується для Інтернет-транзакційної обробки (OLTP).

  • Орієнтований на транзакцію.
  • Орієнтована на додатки.
  • Поточні дані.
  • Детальні дані.
  • Масштабовані дані.
  • Багато користувачів, адміністраторів / оперативних.
  • Час виконання: короткий.

Інформаційне сховище:

Використовується для он-лайн аналітичної обробки (OLAP).

  • Орієнтований аналіз.
  • Орієнтована на предмет.
  • Історичні дані.
  • Сукупні дані.
  • Статичні дані.
  • Не багато користувачів, менеджер.
  • Час виконання: довгий.

1

Зберігання даних (DW) - це процес збору та управління даними з різноманітних джерел, щоб забезпечити важливу інформацію про бізнес. Склад даних зазвичай використовується для підключення та аналізу ділових даних з неоднорідних джерел. Склад даних є ядром системи BI, яка побудована для аналізу даних та звітності.


0

Джерелом для сховища даних може бути кластер Баз даних, тому що бази даних використовуються для Інтернет-операцій транзакцій, таких як ведення поточних записів. Але в сховищі даних він зберігає історичні дані, які призначені для Інтернет-аналітичного процесу.


0

Склад даних - це тип структури даних, який зазвичай розміщується на базі даних. Склад даних посилається на модель даних та тип даних, які зберігаються там - дані, які моделюються (модель даних) для серверної аналітичної мети.

База даних може бути класифікована як будь-яка структура, в якій зберігаються дані. Традиційно це були б RDBMS на зразок Oracle, SQL Server або MySQL. Однак База даних може також бути базою даних NoSQL, наприклад Apache Cassandra, або стовпцем MPP, як AWS RedShift.

Ви бачите, що база даних просто місце для зберігання даних; сховище даних - це специфічний спосіб зберігання даних і служить певній меті, яка полягає в обслуговуванні аналітичних запитів.

OLTP проти OLAP не говорить вам про різницю між DW та базою даних, і OLTP, і OLAP розташовані на базі даних. Вони просто зберігають дані по-різному (різні методології моделювання даних) і служать різним цілям (OLTP - запис транзакцій, оптимізований для оновлень; OLAP - аналіз інформації, оптимізований для читання).


-1

Прості слова див.: Засоби даних -> Величезні дані, які використовуються для аналітичного / зберігання / копіювання та аналізу. База даних -> Операція CRUD з часто використовуваними даними.

Dataware House - це тип зберігання, який ви не використовуєте щодня, а база даних - це те, чим часто займаєтесь.

Напр. Якщо ми запитуємо виписку банку, то вона дає нам останні 3/4/6 / більше місяців, оскільки вона знаходиться в базі даних. Якщо ви хочете більше цього, він зберігається в будинку Dataware.


-1

Приклад: будинок вартий $100,000, і це цінується $1000за рік.

Для відстеження поточної вартості будинку ви б використовували базу даних, оскільки значення змінюватиметься щороку.

Через три роки ви зможете побачити вартість будинку, який є $103,000.

Щоб відслідковувати історичну вартість будинку, ви б використовували сховище даних, яким має бути значення будинку

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.