BC/NW 2011; №1 (18):6.2

 

ИНТЕГРАЦИЯ ТЕМПОРАЛЬНЫХ БАЗ ДАННЫХ И ТЕХНОЛОГИИ OLAP

А.А. Еремеев, Маран М.М.

Московский энергетический институт (Технический университет)

 

Темпоральные базы данных (ТБД), позволяющие учитывать фактор времени и временные зависимости в  данных, активно используются в настоящее время для разработки перспективных интеллектуальных систем типа интеллектуальных систем поддержки принятия решений  (ИСППР) [1, 2]. Для эффективной реализации ТБД и анализа хранящихся в них данных предлагается использовать технологию OLAP (Online Analytical Processing) [3]. Рассмотрим основные положения этой технологии.

Оперативная информация (данные) собираются из различных источников, фильтруются, интегрируются и складываются в реляционное хранилище. Затем данные подготавливаются для OLAP-анализа. Они могут быть загружены в специальную БД OLAP или оставлены в реляционном хранилище. Важнейшим его элементом являются метаданные (информация о структуре, размещении и трансформации данных). Благодаря им обеспечивается эффективное взаимодействие различных компонентов хранилища.

В процессе анализа данных часто возникает необходимость построения зависимостей между различными параметрами, число которых может быть значительным. Возможность анализа зависимостей между различными параметрами, включая темпоральные зависимости, предполагает возможность представления данных в виде многомерной модели – гиперкуба или OLAP-куба.

Для реализации темпоральной модели данных (темпорального OLAP-куба) предлагается использовать  темпоральный OLAP язык – TOLAP [4]. TOLAP комбинирует возможности языков темпоральных запросов типа TSQL2 или SQL/TP с некоторыми возможностями языков высокого уровня типа HiLog или SchemaLog.

TOLAP – язык, основанный на правилах. Краткое описание TOLAP проиллюстрируем на примере из области медицины. Запрос, возвращающий в качестве результата назначенные пациентам некоторого госпиталя процедуры, будет выражен в TOLAP как:

SrvU(proc, pat, qty, t)←Services(doc, proc, pat, day, qty, t),

     pat[t]→insType:’Union’;

Переменная pat представляет элемент на самом низком уровне размерности Patient. Кортеж Services соответствует результату, если пациент pat был обслужен доктором doc в день day во время t и пациент pat был присоединен к учреждению типа 'Union' во время прохождения лечения. Выражение pat[t]→insType:’Union’ называется атомом свертки, а Services(doc,proc,pat,day,qty,t) – атомом факта. Это пример запроса с неагрегированными данными. Запросы с агрегатами также могут быть выражены в TOLAP.

Аналогично языку Datalog правила могут быть скомпилированы в программы.

В настоящее время в рамках НИР, выполняемых на кафедре прикладной математики МЭИ (ТУ) по тематике разработки математического и программного обеспечения ИСППР, реализуются базовые методы и программные средства для интеграции ТБД и технологии OLAP.

Литература

1.     Еремеев А.П., Еремеев А.А., Пантелеев А.А. Темпоральные базы данных и их применение в интеллектуальных системах // Интеллектуальные системы. Коллективная монография. Выпуск 4 / Под. ред. В.М. Курейчика. – М.: Физматлит, 2010. – с. 253-276.

2.     Еремеев А.П., Еремеев А.А., Пантелеев А.А. Темпоральная модель данных и возможности ее реализации на основе технологии OLAP // Двенадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2010 (20-24 сентября 2010г., г.  Тверь, Россия): Труды конференции. В 4-х томах. Т. 3. - М.: Физматлит, 2010. – с. 345-353.

3.     Codd E.F., Codd S.B., Salley C.T. Providing OLAP to User-Analysts: An IT Mandate, Arbor Software Corp. Papers, 1996.

4.     Alejandro A. Vaisman and Alberto O. Mendelzon A Temporal Query Language for OLAP:Implementation and a Case Study // In Proceedings of the 26th VLDB Conference, Cairo, Egypt, 2002.