BC/NW 2017 № 1 (30):8.2
ВИДЫ СИСТЕМ ИНТЕРАКТИВНОЙ АНАЛИТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ. СРАВНИТЕЛЬНЫЙ АНАЛИЗ OLAP-КЛИЕНТОВ И СЕРВЕРОВ
Тумкина А.И.
Технология аналитической обработки в реальном времени основана на многомерном иерархическом представлении данных. OLAP-инструменты обеспечивают пользователя возможностями гибкого просмотра аналитических сведений в различных срезах.
Отчёты, полученные посредством такого инструмента, хорошо структурированы, обладают гибкостью, то есть поддерживают выполнение операции по переходу от детального представления данных к агрегированному (консолидация) и наоборот (детализация), перемене мест строк и столбцов таблицы (вращение). [1]
Исходная информация представлена в виде многомерного куба с возможностью проведения над ним манипуляций, позволяющих выполнить необходимые срезы. При этом куб представлен пользователю в виде многомерной динамической таблицы, в которой данные в различных срезах суммируются автоматически. За выполнение таких операций отвечает OLAP-машина.
Построение многомерных кубов осуществляется на основе исходных и агрегатных данных. Данные могут храниться и в реляционных, и в многомерных базах данных. Поэтому все OLAP-продукты принято разделять на несколько категорий: [1]
1. многомерную OLAP, являющуюся классической формой OLAP и использующую выделенный сервер, на стороне которого выполняется предварительная обработка данных. Данные формируются в многомерные кубы.
MOLAP-система имеет возможность структурировать данные под любые запросы пользователей, поэтому данная система является самой эффективной при обработке данных.
Поскольку MOLAP системы имеют возможность реорганизовать и структурировать данные под запросы пользователей, они являются довольно эффективными для обработки данных. Кроме того, имеющиеся в подобных системах инструменты позволяют производить сложные расчёты, быстро формировать запросы и предоставлять результаты.
Среди недостатков таких систем выделяют ограничение на объём обрабатываемых данных и их избыточность, так как в ходе формирования многомерных кубов имеется необходимость в дублировании данных.
2. реляционную OLAP - вид системы, работающий с реляционной базой данных. Данные в базе хранятся в виде набора реляционных таблиц, а обращение к данным выполняется напрямую. Благодаря использованию инструментов SQL и запросов, с точки зрения пользователя многомерный анализ выполняется как в традиционной системе-OLAP.
Главным преимуществом реляционной системы является возможность эффективной обработки большого объёма как числовых, так и текстовых данных.
К недостаткам ROLAP относят низкую по сравнению с традиционными системами производительность, возникающую по причине обработки данных сервером OLAP, а также ограничение функциональных возможностей, связанных с использованием языка SQL.
3. гибридную OLAP, которая объединяет в себе возможности реляционной и многомерной систем. За счёт использования многомерной базы данных и управления реляционной базой данные хранятся в реляционных таблицах, а обработанные данные размещаются в заранее выстроенных многомерных кубах. Преимуществом гибридной системы является масштабируемость данных, быстрая их обработка и гибкий доступ к источникам.
Другие виды OLAP систем в большей степени являются маркетинговым ходом производителей, чем самостоятельным видом OLAP системы: [2]
1. WOLAP (Web OLAP). Вид OLAP системы с поддержкой web интерфейса. В этих системах OLAP есть возможность обращаться к базам данных через web интерфейс.
2. DOLAP (Desktop OLAP). Этот вид OLAP системы дает возможность пользователям загрузить на локальное рабочее место базу данных и работать с ней локально.
3. MobileOLAP. Это функция OLAP систем, которая позволяет работать с базой данных удаленно, с использованием мобильных устройств.
4. SOLAP (Spatial OLAP). Этот вид OLAP систем предназначен для обработки пространственных данных. Он появился как результат интеграции географических информационных систем и OLAP системы. Эти системы позволяют обрабатывать данные не только в буквенно-цифровом формате, но и в виде визуальных объектов и векторов.
Многообразие представленных на рынке продуктов аналитической обработки информации позволяет каждому пользователю сделать выбор в пользу того продукта, который будет отвечать всем предъявляемым требованиям.
Каждый OLAP-продукт состоит из сервера и клиентской части. OLAP-сервер является хранилищем информации и позволяет производить выборку данных, основанную на пользовательском запросе. Клиентская часть продукта представлена пользовательским интерфейсом, позволяющим аналитику самостоятельно проектировать многомерные кубы.
В проведенном анализе были рассмотрены наиболее известные и свободно распространяемые OLAP-сервера и OLAP-клиенты. [1]
Критерия, по которым был выполнен анализ нескольких хранилищ данных, основан на требованиях, которые предъявляются к OLAP-серверу, характеристиках, отвечающих за быструю работу сервера и безопасность его среды. Результаты анализа приведены в таблице 1.
Таблица 1 Сравнительный анализ OLAP-серверов
Критерий/OLAP-сервер |
MSAS |
Essbase |
TM1 |
Mondrian |
Palo |
Работа с PostgreSQL |
- |
- |
+ |
+ |
+ |
Форма хранения информации (MOLAP,ROLAP,HOLAP) |
(+,+,+) |
(+,-,-) |
(+,-,-) |
(-,+,-) |
(+,-,-) |
Создание пользователем агрегирующей функции |
+ |
+ |
+ |
- |
- |
Масштабируемость |
+ |
+ |
+ |
+ |
+ |
User friendly интерфейс |
+ |
+ |
+ |
+ |
+ |
Решение проблемы разреженности данных |
+ |
+ |
+ |
+ |
+ |
Использование языка XMLA и MDX |
+ |
+ |
+ |
+ |
+ |
Русскоязычная документация |
+ |
+ |
+ |
- |
- |
Минимальная стоимость |
4000 |
40000 |
50000 |
бесплатно |
бесплатно |
По результатам проведенного анализа можно отметить, что все рассмотренные программные продукты в полной мере не только отвечают особенностям процесса аналитической обработки данных, но и соответствуют принципам, опубликованным Э.Коддом. Однако большими преимуществами обладает Pentaho Mondrian – бесплатный продукт с имеющейся возможностью его доработки, написанный на кроссплатформенном языке Java и имеющий удобный графический интерфейс для работы с многомерным кубом.
Анализ OLAP-клиентов был проведен на основании предъявляемых к клиентскому приложению требований, среди которых основным является требование по поддержке выполнения операций над многомерным кубом, а также доступность фильтрации данных. Результаты отображены в таблице 2.
Таблица 2 Сравнительный анализ OLAP-клиента
Критерий/OLAP-клиент |
MicroStrategy |
PowerPlay |
JPalo Pivot |
Saiku |
Выполнение основных операций над многомерным кубом |
+ |
+ |
+ |
+ |
Фильтрация данных |
+ |
+ |
- |
- |
Русскоязычная документация |
+ |
+ |
- |
+ |
Использование языка XMLA и MDX |
+ |
+ |
+ |
+ |
Минимальная стоимость |
1000 |
1000 |
бесплатно |
бесплатно |
На основе полученных результатов видно, что все исследуемые продукты отвечают требованиям, предъявляемым к процессу аналитической обработки данных в реальном времени, изложенные Э.Коддом. Кроме того, все OLAP-клиенты поддерживают работу с XMLA и MDX. [2]
В качестве клиентского приложения фаворитом является продукт Saiku, отличающийся интуитивно понятным интерфейсом и возможностью создания и публикации отчётов с минимальными финансовыми затратами.
Таким образом, технология аналитической обработки упрощает, а вместе с тем и ускоряет процесс принятия решений на основе аналитической информации.
Широкий ассортимент OLAP-инструментов предоставляет каждому пользователю право выбора того продукта, который в наибольшей степени удовлетворяет предъявляемым требованиям, среди которых главным является дружественный интерфейс, точность и скорость выполнения запросов.
Литература
1. «Введение в OLAP-технологии Microsoft». Наталия Елманова, Алексей Фёдоров. Издательство Диалог-МИФИ, 2002г.
2. «Архитектура OLAP». Найгель Пендс, перевод Шамиля Абушаева. High Quality Content, 2013г.