BC/NW 2017 № 1 (30):8.2
ВИДЫ СИСТЕМ
ИНТЕРАКТИВНОЙ АНАЛИТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ СРАВНИТЕЛЬНЫЙ АНАЛИЗ OLAP-КЛИЕНТОВ
И СЕРВЕРОВ
Тумкина А.И.
Технология аналитической
обработки в реальном времени основана на многомерном иерархическом
представлении данных. OLAP-инструменты обеспечивают пользователя
возможностями гибкого просмотра аналитических сведений в различных срезах.
Отчёты,
полученные посредством такого инструмента, хорошо структурированы, обладают
гибкостью, то есть поддерживают выполнение операции по переходу от детального
представления данных к агрегированному (консолидация) и наоборот
(детализация), перемене мест строк и столбцов таблицы (вращение). [1]
Исходная
информация представлена в виде многомерного куба с возможностью проведения над
ним манипуляций, позволяющих выполнить необходимые срезы. При этом куб
представлен пользователю в виде многомерной динамической таблицы, в которой данные
в различных срезах суммируются автоматически. За выполнение таких операций
отвечает OLAP-машина.
Построение
многомерных кубов осуществляется на основе исходных и агрегатных данных. Данные
могут храниться и в реляционных, и в многомерных базах данных. Поэтому все
OLAP-продукты принято разделять на несколько категорий: [1]
1.
многомерную OLAP,
являющуюся классической формой OLAP и использующую выделенный сервер, на стороне
которого выполняется предварительная обработка данных. Данные формируются в
многомерные кубы.
MOLAP-система
имеет возможность структурировать данные под любые запросы пользователей,
поэтому данная система является самой эффективной при обработке данных.
Поскольку MOLAP системы имеют возможность
реорганизовать и структурировать данные под запросы пользователей, они являются
довольно эффективными для обработки данных. Кроме того, имеющиеся в подобных
системах инструменты позволяют производить сложные расчёты, быстро формировать
запросы и предоставлять результаты.
Среди недостатков таких систем выделяют ограничение на
объём обрабатываемых данных и их избыточность, так как в ходе формирования
многомерных кубов имеется необходимость в дублировании данных.
2.
реляционную OLAP - вид системы, работающий с
реляционной базой данных. Данные в базе хранятся в виде набора реляционных
таблиц, а обращение к данным выполняется напрямую. Благодаря использованию
инструментов SQL и запросов, с точки зрения пользователя многомерный
анализ выполняется как в традиционной системе-OLAP.
Главным преимуществом реляционной системы является
возможность эффективной обработки большого объёма как числовых, так и текстовых
данных.
К недостаткам ROLAP относят низкую по сравнению с
традиционными системами производительность, возникающую по причине обработки
данных сервером OLAP, а также ограничение функциональных возможностей,
связанных с использованием языка SQL.
3.
гибридную OLAP, которая объединяет в себе возможности реляционной и
многомерной систем. За счёт использования многомерной базы данных и управления
реляционной базой данные хранятся в реляционных таблицах, а обработанные данные
размещаются в заранее выстроенных многомерных кубах. Преимуществом гибридной
системы является масштабируемость данных, быстрая их обработка и гибкий доступ
к источникам.
Другие
виды OLAP систем в большей степени являются маркетинговым ходом производителей,
чем самостоятельным видом OLAP системы: [2]
1. WOLAP (Web OLAP). Вид
OLAP системы с поддержкой web интерфейса. В этих системах OLAP есть возможность
обращаться к базам данных через web интерфейс.
2. DOLAP (Desktop OLAP).
Этот вид OLAP системы дает возможность пользователям загрузить на локальное
рабочее место базу данных и работать с ней локально.
3. MobileOLAP. Это функция
OLAP систем, которая позволяет работать с базой данных удаленно, с
использованием мобильных устройств.
4. SOLAP (Spatial OLAP).
Этот вид OLAP систем предназначен для обработки пространственных данных. Он
появился как результат интеграции географических информационных систем и OLAP
системы. Эти системы позволяют обрабатывать данные не только в
буквенно-цифровом формате, но и в виде визуальных объектов и векторов.
Многообразие
представленных на рынке продуктов аналитической обработки информации позволяет
каждому пользователю сделать выбор в пользу того продукта, который будет
отвечать всем предъявляемым требованиям.
Каждый
OLAP-продукт состоит из сервера и клиентской части. OLAP-сервер является
хранилищем информации и позволяет производить выборку данных, основанную на
пользовательском запросе. Клиентская часть продукта представлена
пользовательским интерфейсом, позволяющим аналитику самостоятельно
проектировать многомерные кубы.
В проведенном
анализе были рассмотрены наиболее известные и свободно распространяемые
OLAP-сервера и OLAP-клиенты.
[1]
Критерия, по
которым был выполнен анализ нескольких хранилищ данных, основан на требованиях,
которые предъявляются к OLAP-серверу, характеристиках, отвечающих за быструю
работу сервера и безопасность его среды. Результаты анализа приведены в таблице
1.
Таблица 1 Сравнительный
анализ OLAP-серверов
Критерий/OLAP-сервер
|
MSAS
|
Essbase
|
TM1
|
Mondrian
|
Palo
|
Работа с PostgreSQL
|
-
|
-
|
+
|
+
|
+
|
Форма хранения информации (MOLAP,ROLAP,HOLAP)
|
(+,+,+)
|
(+,-,-)
|
(+,-,-)
|
(-,+,-)
|
(+,-,-)
|
Создание пользователем агрегирующей функции
|
+
|
+
|
+
|
-
|
-
|
Масштабируемость
|
+
|
+
|
+
|
+
|
+
|
User friendly интерфейс
|
+
|
+
|
+
|
+
|
+
|
Решение проблемы разреженности данных
|
+
|
+
|
+
|
+
|
+
|
Использование языка XMLA и MDX
|
+
|
+
|
+
|
+
|
+
|
Русскоязычная документация
|
+
|
+
|
+
|
-
|
-
|
Минимальная стоимость
|
4000
|
40000
|
50000
|
бесплатно
|
бесплатно
|
По
результатам проведенного анализа можно отметить, что все рассмотренные
программные продукты в полной мере не только отвечают особенностям процесса
аналитической обработки данных, но и соответствуют принципам, опубликованным
Э.Коддом. Однако большими преимуществами обладает Pentaho Mondrian – бесплатный
продукт с имеющейся возможностью его доработки, написанный на
кроссплатформенном языке Java и имеющий удобный графический интерфейс для
работы с многомерным кубом.
Анализ
OLAP-клиентов был проведен на основании предъявляемых к клиентскому приложению
требований, среди которых основным является требование по поддержке выполнения
операций над многомерным кубом, а также доступность фильтрации данных.
Результаты отображены в таблице 2.
Таблица 2 Сравнительный анализ
OLAP-клиента
Критерий/OLAP-клиент
|
MicroStrategy
|
PowerPlay
|
JPalo Pivot
|
Saiku
|
Выполнение основных операций над многомерным
кубом
|
+
|
+
|
+
|
+
|
Фильтрация данных
|
+
|
+
|
-
|
-
|
Русскоязычная документация
|
+
|
+
|
-
|
+
|
Использование языка XMLA и MDX
|
+
|
+
|
+
|
+
|
Минимальная стоимость
|
1000
|
1000
|
бесплатно
|
бесплатно
|
На основе
полученных результатов видно, что все исследуемые продукты отвечают
требованиям, предъявляемым к процессу аналитической обработки данных в реальном
времени, изложенные Э.Коддом. Кроме того, все OLAP-клиенты поддерживают
работу с XMLA и MDX. [2]
В качестве
клиентского приложения фаворитом является продукт Saiku, отличающийся
интуитивно понятным интерфейсом и возможностью создания и публикации отчётов с
минимальными финансовыми затратами.
Таким образом,
технология аналитической обработки упрощает, а вместе с тем и ускоряет процесс
принятия решений на основе аналитической информации.
Широкий
ассортимент OLAP-инструментов
предоставляет каждому пользователю право выбора того продукта, который в
наибольшей степени удовлетворяет предъявляемым требованиям, среди которых
главным является дружественный интерфейс, точность и скорость выполнения
запросов.
Литература
1. «Введение в OLAP-технологии Microsoft». Наталия Елманова,
Алексей Фёдоров. Издательство Диалог-МИФИ, 2002г.
2. «Архитектура OLAP». Найгель Пендс,
перевод Шамиля Абушаева. High Quality Content, 2013г.