Урок за Пентахо | Урок за интеграция на данни на Pentaho (PDI)

Какво е Pentaho BI?

Пентахо е инструмент за бизнес разузнаване, който предоставя широк спектър от решения за бизнес разузнаване на клиентите. Той е в състояние да отчита, анализира данни, интегрира данни, извлича данни и т.н.

В този урок по Пентахо за начинаещи ще научите:

Характеристики на Пентахо

Следните са важните характеристики на Pentaho:

  • ETL възможности за нуждите на бизнес разузнаването
  • Разбиране на Pentaho Report Designer
  • Експертиза на продукта
  • Предлага паралелни поддоклади
  • Отключване на нови възможности
  • Професионална поддръжка
  • Запитване и отчитане
  • Предлага подобрена функционалност
  • Пълна поддръжка на метаданни по време на работа от източници на данни

BI пакет Pentaho

Сега ще научим за Pentaho BI пакета в този урок по Pentaho:

BI Suite Pentaho



Pentaho BI Suite включва следните компоненти:

Pentaho Reporting

Pentaho Reporting зависи от проекта JFreeReport. Помага ви да удовлетворите нуждите си за отчитане на бизнеса. Този компонент предлага също така планирано публикуване и публикуване на отчети при поискване в популярни формати като XLS, PDF, TXT и HTML.

Анализ

Той предлага широк спектър от анализи, широк спектър от функции, който включва изглед на обобщена таблица. Инструментът осигурява подобрени функции за графичен потребителски интерфейс (използвайки Flash или SVG), интегрирани приспособления на таблото за управление, портал и интеграция на работния поток.

Освен това услугите за електронни таблици на Pentaho позволяват на потребителя да преглежда, завърта и използва диаграма от MS Excel.

Табла за управление

Таблото за управление предлага отчитане и анализ, които допринасят за съдържанието на таблата за управление на Pentaho. Дизайнерът на таблото за самообслужване включва обширни вградени шаблони и оформление на таблото. Тя позволява на бизнес потребителите да създават персонализирани табла с малко обучение.

Извличане на данни

Инструмент за извличане на данни открива скрити модели и индикатори за бъдещи резултати. Той предлага най -изчерпателния набор от алгоритми за машинно обучение от проекта Weka, който включва групиране, дървета на решения, случайни гори, анализ на основните компоненти, невронни мрежи.

Тя ви позволява да преглеждате данни графично, да взаимодействате с тях програмно или да използвате множество източници на данни за отчети, по -нататъшен анализ и други процеси.

Интеграция на данни от Pentaho

Този компонент се използва за интегриране на данни, където и да съществуват.

Богата библиотека за трансформация с над 150 готови обекта за картографиране.

Той поддържа широк спектър от източници на данни, който включва повече от 30 платформи с отворен код и собствени бази данни, плоски файлове. Той също така помага Анализ на големи данни с интегриране и управление на данни на Hadoop.

Кои използват Pentaho BI?

Pentaho BI е широко използван инструмент от майски софтуерни специалисти като:

  • Софтуерни програми с отворен код
  • Бизнес анализатор и изследовател
  • Студенти от колежа
  • Съветник по бизнес разузнаване

Инсталирайте Pentaho в AWS

Сега в този урок за интеграция на данни на Pentaho, нека научим как да инсталираме Pentaho в AWS:

Етап 1) Отидете на връзката и щракнете върху Продължи, за да се абонирате

Стъпка 2) Приемете Условията

Стъпка 3) Щракнете върху Продължи към конфигурацията

Стъпка 4) Запазете настройките по подразбиране и щракнете върху Продължи към Конфигурация.

Стъпка 5) Проверете инструкциите за употреба и изчакайте 5 минути например за стартиране.

Стъпка 6) Вземете публичен IP на екземпляра.

Стъпка 7) Използвайте публичния IP на екземпляра за достъп до него.

Инсталиране на Pentaho

  • Хардуерни изисквания
  • Изисквания към софтуера
  • Изтегляне и инсталиране на Bl Suite
  • Стартиране на апартамента Bl
  • Администриране на апартамента Bl

Хардуерно изискване:

Софтуерът Pentaho Bl Suite няма ограничения за фиксиране на компютър или мрежов хардуер, стига да отговаряте на минималните софтуерни изисквания. Инструментът за бизнес разузнаване е лесен за инсталиране. Препоръчителен набор от системни спецификации:

RAMМинимум 2GB
Място на твърдия дискМинимум 1GB
ПроцесорДвуядрен EM64T или AMD64

Изисквания към софтуера

  • Инсталиране на Sun JRE 5.0
  • Средата може да бъде 32-битова или 64-битова
  • Поддържани операционни системи: Linux, Solaris, Windows, Mac
  • Работна станция, която има модерен интерфейс за уеб браузър като Chrome, Internet Explorer, Firefox

За да стартирате Bl-сървър

  • В Windows от самото начало щракнете върху бутона за стартиране на иконата на Bl сървър.
  • В Linux OS стартирайте start-pentaho скрипт в / biserver-ce / директория

За да стартирате администраторския сървър:

  • В Windows от бутона за стартиране щракнете върху стартиране на Bl корпоративен сървър.
  • За Linux: отидете в командния прозорец и стартирайте стартиращия скрипт в/biserver-ce/Administration-console/директория.

За да спрете администраторския сървър:

  • За да спрете сървъра в Windows, щракнете върху спиране на иконите на два сървъра.
  • На Linux. Трябва да отидете в терминала и да отидете на инсталираната директория и да стартирате stop.bat

Административна конзола на Пентахо

Дизайнер на отчети:

Това е усъвършенстван инструмент за създаване на отчети. Това е идеален инструмент за вас, ако искате да създадете пълен отчет за управление на данни. Този инструмент предлага много гъвкавост и функционалност, отколкото възможностите за ad hoc отчитане на потребителската конзола на Pentaho.

Дизайн студио:

Това е инструмент, базиран на Eclipse. Позволява ви ръчно да редактирате отчет или анализ. Той се използва широко за добавяне на промени в съществуващ отчет, които не могат да бъдат добавени с Report Designer.

Дизайнер на агрегация:

Този графичен инструмент ви позволява да подобрите ефективността на куб Мондриан.

Редактор на метаданни:

Използва се за добавяне на персонализиран слой метаданни към всеки съществуващ източник на данни.

Интеграция на данни на Pentaho:

Инструментът за извличане, трансформиране и зареждане на чайник (ETL), който позволява

Pentaho Tool срещу BI стек

Инструмент Пентахо BI Stack
Интеграция на данни (PDI)ETL
Той предлага редактор на метаданниТой осигурява управление на метаданни
Пентахо BAАнализ
Дизайнер на отчетиОперативно отчитане
СайкуСпециално отчитане
CDEТабла за управление
Потребителска конзола на Pentaho (PUC)Управление/Мониторинг

Предимства на използването на Pentaho

Сега в този урок за интеграция на данни на Pentaho ще научим за някои предимства на Pentaho Business Intelligence Tool:

  • Pentaho BI е много интуитивен инструмент. С някои основни понятия можете да работите с него.
  • Прост и лесен за използване инструмент за бизнес разузнаване
  • Предлага широк спектър от BI възможности, които включват отчитане, табло, интерактивен анализ, интеграция на данни, извличане на данни и др.
  • Предлага се с удобен за потребителя интерфейс и предоставя различни инструменти за извличане на данни от множество източници на данни
  • Предлага единичен пакет за работа с данни
  • Има издание на общността с много сътрудници, заедно с издание Enterprise.
  • Възможност за изпълнение на клъстера Hadoop
  • JavaScript кодът, написан в компонентите на стъпката, може да се използва повторно в други компоненти.

Недостатъци на използването на Pentaho

Ето кои са недостатъците/недостатъците на използването на инструмента Pentaho BI:

  • Дизайнът на интерфейса може да бъде слаб и няма унифициран интерфейс за всички компоненти.
  • Много по -бавна еволюция на инструментите в сравнение с други BI инструменти.
  • Pentaho Business analytics предлага ограничен брой компоненти.
  • Лоша подкрепа на общността. Така че, ако не получите работещ компонент, трябва да изчакате до пускането на следващата версия.

Резюме:

  • Pentaho е инструмент за бизнес разузнаване, който предоставя широк спектър от бизнес разузнаване решения за клиентите
  • Той предлага ETL възможности за нуждите на бизнес разузнаването.
  • Пакетите на Pentaho предлагат компоненти като Report, Analysis, Dashboard и Data Mining
  • Pentaho Business Intelligence се използва широко от 1) Бизнес анализатор 2) Софтуерни програмисти с отворен код 3) Изследовател и 4) Студенти.
  • Процесът на инсталиране на Pentaho включва: 1) Хардуерни изисквания 2) Софтуерни изисквания, 3) Изтегляне на Bl Suite, 4) Стартиране на Bl Suite и 5) Администриране на Bl Suite
  • Важни компоненти на административната конзола на Pentaho са: 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Редактор на метаданни 5) Pentaho Data Integration
  • Pentaho е инструмент за интегриране на данни (PDI), докато BI стекът е ETL инструмент .
  • Най -голямото предимство на Pentaho е, че е прост и лесен за използване инструмент за бизнес разузнаване.
  • Основният недостатък на Pentaho е, че той е много по -бавна еволюция на инструменти в сравнение с други BI инструменти