Я новачок намагаюся обернути голову навколо OLAP, і у мене є кілька питань.
- Питання 1: Чи може в кубі OLAP зберігати медіани, режими, відсотки?
- Запитання 2: Чи може написаний користувачем запит MDX повернути підсумок даних на рівні рядків? (наприклад:% транзакцій> 100 доларів США). Чи повинен дизайнер кубів додати це до куба?
- Питання 3: Чи зараз якісь продукти OLAP надають механізми доступу до даних рівня рядків? Котрий?
Наш ІТ-відділ шукає зворотного зв’язку щодо проблем, які виникають у конкретного куба ROLAP MS Analsis Services. Ми не маємо доступу до реляційної бази даних за нею, і нам потрібно проводити обчислення, які в даний момент недоступні в якості куба.
Дозвольте мені побачити, чи маю я це право.
- Куб може надати статистику для підрахунків, засобів, пропорцій, стандартних відхилень.
- Якщо конкретна статистика не виконується в рамках заходів, передбачених дизайнером кубів, чи можемо ми написати запит MDX, щоб отримати її? Або їм потрібно змінити куб, щоб попередньо обчислити його з даних рівня рядків?
- Куб не може надати статистику, як медіани, режими або процентилі, оскільки ці статистичні дані не агрегуються належним чином.
Я читаю «Граматику графіки» Леланда Уілкінсона і в його главі про обмін даними та OLAP, він говорить
Ці [кубові операції] добре працюють із статистикою, як підрахунки, засоби, пропорції та стандартні відхилення. Прості агрегації за підкласами можна обчислити, оперуючи сумами, сумами квадратів та іншими термінами, об'єднаними в лінійні функції для отримання базової зведеної статистики.
Вони не працюють належним чином із такою статистикою, як медіана, мода та відсотки, тому що сукупність цих статистичних даних не є статистикою їх сукупностей. Наприклад, медіана медіан не є медіаною сукупності.
Він продовжує додавати:
Однак останнім часом з'явилася більш досконала модель ROLAP. Можна за допомогою декількох технологій надати статистичним алгоритмам доступ до необроблених даних через реляційну модель в режимі реального часу. Цей підхід є більш перспективним, ніж жорсткі агрегації, пропоновані такими структурами, як куби даних.
У найелегантнішій формі цієї архітектури програми можуть вимагати віддалених з'єднань для надання інформації про їхні способи обробки даних та вживати відповідних дій залежно від повернутої інформації. У такому вигляді архітектура компонентів може досягти реальної обіцянки розподілених обчислень: проектування та виконання, які не залежать від сайту, операційної системи чи мови.
Це було написано приблизно в 2005 році. Чи хтось знає про продукти, що використовують цю методологію, щоб забезпечити доступ до даних на рівні рядків?