Какво е OLAP? Куб, операции и видове в хранилището на данни

Какво е OLAP?

Онлайн аналитична обработка (OLAP) е категория софтуер, която позволява на потребителите да анализират информация от множество системи за бази данни едновременно. Това е технология, която позволява на анализаторите да извличат и разглеждат бизнес данни от различни гледни точки.

Анализаторите често трябва да групират, обобщават и обединяват данни. Тези операции в релационни бази данни са ресурсоемки. С OLAP данните могат да бъдат предварително изчислени и предварително обобщени, което прави анализа по-бърз.

Базите данни OLAP са разделени на един или повече кубчета. Кубчетата са проектирани по такъв начин, че създаването и разглеждането на отчети става лесно. OLAP означава „Онлайн аналитична обработка“.

В този урок ще научите-

OLAP куб:

В основата на концепцията OLAP е OLAP Cube. OLAP кубът е структура от данни, оптимизирана за много бърз анализ на данни.

OLAP Cube се състои от числени факти, наречени мерки, които са категоризирани по измерения. OLAP Cube се нарича още хиперкуб .

Обикновено операциите с данни и анализът се извършват с помощта на простата електронна таблица, където стойностите на данните са подредени във формат на ред и колона. Това е идеално за двуизмерни данни. OLAP обаче съдържа многоизмерни данни, като данните обикновено се получават от различен и несвързан източник. Използването на електронна таблица не е оптимален вариант. Кубът може да съхранява и анализира многоизмерни данни по логичен и подреден начин.

Как работи?

Складът за данни би извличал информация от множество източници на данни и формати като текстови файлове, Excel лист, мултимедийни файлове и т.н.

Извлечените данни се почистват и трансформират. Данните се зареждат в OLAP сървър (или OLAP куб), където информацията се изчислява предварително за по-нататъшен анализ.

Основни аналитични операции на OLAP

Четири вида аналитични операции в OLAP са:

  1. Навивам
  2. Разбивка
  3. Нарежете и заровете
  4. Завъртане (завъртане)

1) Навикване:

Сборът е известен също като „консолидация“ или „агрегиране“. Операцията за свиване може да се извърши по 2 начина

  1. Намаляване на размерите
  2. Изкачване на йерархията на концепциите. Йерархията на концепциите е система за групиране на нещата въз основа на техния ред или ниво.

Помислете за следната диаграма

  • В този пример градовете Ню Джърси и Изгубени ъгли се превърнаха в държава САЩ
  • Продажбите на Ню Джърси и Лос Анджелис са съответно 440 и 1560. Те стават 2000 след свиване
  • В този процес на обобщаване данните се преместват от йерархията на местоположението от града в страната.
  • В процеса на свиване трябва да се премахнат поне един или повече измерения. В този пример измерението Quater се премахва.

2) Пробиване надолу

При подробни данни данните са фрагментирани на по-малки части. Това е обратното на процеса на събиране. Това може да стане чрез

  • Преместване надолу по йерархията на концепцията
  • Увеличаване на измерение

Помислете за горната диаграма

  • Quater Q1 се пробива до месеците януари, февруари и март. Съответните продажби също са регистри.
  • В този пример се добавят месеци с измерения.

3) Филийка:

Тук се избира едно измерение и се създава нов подкуб.

Следващата диаграма обяснява как е извършена операцията на парче:

  • Размерът на времето се нарязва с Q1 като филтър.
  • Създава се изцяло нов куб.

Казва:

Тази операция е подобна на филийка. Разликата в заровете е, че избирате 2 или повече измерения, които водят до създаването на подкуб.

4) Завъртане

В Pivot завъртате осите на данните, за да осигурите заместващо представяне на данни.

В следния пример обобщението се основава на типове елементи.

Видове OLAP системи

Йерархична структура на OLAP

Тип OLAP Обяснение
Релационен OLAP (ROLAP): ROLAP е разширена RDBMS заедно с многоизмерно картографиране на данни за изпълнение на стандартната релационна операция.
Многоизмерен OLAP (MOLAP) MOLAP Реализира работа в многоизмерни данни.
Хибридна онлайн аналитична обработка (HOLAP) При подхода HOLAP обобщените суми се съхраняват в многоизмерна база данни, докато подробните данни се съхраняват в релационната база данни. Това предлага както ефективност на данните на модела ROLAP, така и производителността на модела MOLAP.
OLAP за настолни компютри В настолен OLAP потребител изтегля част от данните от базата данни локално или на работния си плот и ги анализира.

DOLAP е сравнително по -евтин за внедряване, тъй като предлага много малко функционалности в сравнение с други OLAP системи.
Уеб OLAP (WOLAP) Web OLAP, който е OLAP система, достъпна чрез уеб браузъра. WOLAP е тристепенна архитектура. Състои се от три компонента: клиент, междинен софтуер и сървър на база данни.
Мобилен OLAP: Мобилният OLAP помага на потребителите да имат достъп и да анализират OLAP данни чрез своите мобилни устройства
Пространствен OLAP: SOLAP е създаден, за да улесни управлението както на пространствени, така и на непространствени данни в географска информационна система (ГИС)

ROLAP

ROLAP работи с данни, които съществуват в релационна база данни. Фактите и таблиците с размери се съхраняват като релационни таблици. Той също така позволява многоизмерен анализ на данните и е най -бързо развиващия се OLAP.

Предимства на модела ROLAP:

  • Висока ефективност на данните. Той предлага висока ефективност на данните, тъй като производителността на заявките и езикът за достъп са оптимизирани особено за многоизмерен анализ на данни.
  • Мащабируемост. Този тип OLAP система предлага мащабируемост за управление на големи обеми данни и дори когато данните постоянно се увеличават.

Недостатъци на модела ROLAP:

  • Търсене на по -големи ресурси: ROLAP се нуждае от високо използване на работна ръка, софтуер и хардуерни ресурси.
  • Общо ограничения на данните. Инструментите на ROLAP използват SQL за всички изчисления на съвкупни данни. Въпреки това, няма определени ограничения за обработката на изчисления.
  • Бавно изпълнение на заявките. Производителността на заявките в този модел е бавна в сравнение с MOLAP

MOLAP

MOLAP използва базирани на масиви многоизмерни механизми за съхранение за показване на многоизмерни изгледи на данни. По принцип те използват OLAP куб.

Научете повече за OLAP тук

Хибриден OLAP

Хибридният OLAP е смес от ROLAP и MOLAP. Той предлага бързо изчисляване на MOLAP и по -висока мащабируемост на ROLAP. HOLAP използва две бази данни.

  1. Обобщените или изчислените данни се съхраняват в многоизмерен OLAP куб
  2. Подробна информация се съхранява в релационна база данни.

Предимства на хибридния OLAP:

  • Този вид OLAP помага за икономия на дисковото пространство и остава компактен, което помага да се избегнат проблеми, свързани със скоростта и удобството на достъпа.
  • Хибридният HOLAP използва куб технология, която позволява по -бърза работа за всички видове данни.
  • ROLAP се актуализира незабавно и потребителите на HOLAP имат достъп до тези незабавно актуализирани данни в реално време. MOLAP осигурява почистване и преобразуване на данни, като по този начин подобрява значимостта на данните. Това носи най -доброто от двата свята.

Недостатъци на хибридния OLAP:

  • По -голямо ниво на сложност : Основният недостатък на системите HOLAP е, че поддържа както инструменти, така и приложения ROLAP и MOLAP. По този начин е много сложно.
  • Потенциални припокривания : Има по -големи шансове за припокриване, особено в техните функционалности.

Предимства на OLAP

  • OLAP е платформа за всички видове бизнес, включваща планиране, бюджетиране, отчитане и анализ.
  • Информацията и изчисленията са последователни в OLAP куб. Това е решаваща полза.
  • Бързо създавайте и анализирайте сценариите „Ами ако“
  • Лесно търсене в OLAP база данни за широки или конкретни термини.
  • OLAP предоставя градивни елементи за инструменти за бизнес моделиране, инструменти за извличане на данни, инструменти за отчитане на ефективността.
  • Позволява на потребителите да правят данни за кубчета на парчета и кубчета по различни размери, мерки и филтри.
  • Това е добре за анализ на времеви редове.
  • Намирането на някои клъстери и отклонения е лесно с OLAP.
  • Това е мощна система за аналитични процеси за визуализация онлайн, която осигурява по -бързо време за реакция

Недостатъци на OLAP

  • OLAP изисква организиране на данни в схема със звезда или снежинка. Тези схеми са сложни за прилагане и администриране
  • Не можете да имате голям брой размери в един OLAP куб
  • Достъпът до транзакционни данни не може да се осъществи чрез системата OLAP.
  • Всяка промяна в OLAP куб се нуждае от пълна актуализация на куба. Това е отнемащ време процес

Резюме:

  • OLAP е технология, която позволява на анализаторите да извличат и разглеждат бизнес данни от различни гледни точки.
  • В основата на концепцията OLAP е OLAP Cube.
  • Различни бизнес приложения и други операции с данни изискват използването на OLAP Cube.
  • В OLAP има пет основни типа аналитични операции 1) Навиване 2) Пробиване надолу 3) Срез 4) Зарове и 5) Пивот
  • Три вида широко използвани OLAP системи са MOLAP, ROLAP и Hybrid OLAP.
  • Настолните OLAP, Web OLAP и Mobile OLAP са някои други видове OLAP системи.