BC/NW
2011; №1 (18):6.2
ИНТЕГРАЦИЯ ТЕМПОРАЛЬНЫХ БАЗ ДАННЫХ И ТЕХНОЛОГИИ OLAP
А.А. Еремеев, Маран М.М.
Московский энергетический институт (Технический
университет)
Темпоральные базы данных (ТБД), позволяющие учитывать фактор времени
и временные зависимости в данных,
активно используются в настоящее время для разработки перспективных интеллектуальных
систем типа интеллектуальных систем поддержки принятия решений (ИСППР) [1, 2]. Для эффективной реализации ТБД и анализа хранящихся в них данных предлагается использовать технологию OLAP (Online
Analytical Processing)
[3]. Рассмотрим основные положения этой технологии.
Оперативная информация
(данные) собираются из различных источников, фильтруются, интегрируются и
складываются в реляционное хранилище. Затем данные подготавливаются для
OLAP-анализа. Они могут быть загружены в специальную БД OLAP или оставлены в
реляционном хранилище. Важнейшим его элементом являются метаданные (информация
о структуре, размещении и трансформации данных). Благодаря им
обеспечивается эффективное взаимодействие различных компонентов хранилища.
В процессе анализа данных
часто возникает необходимость построения зависимостей между различными
параметрами, число которых может быть значительным. Возможность анализа
зависимостей между различными параметрами, включая темпоральные
зависимости, предполагает возможность представления данных в виде многомерной
модели – гиперкуба или OLAP-куба.
Для реализации темпоральной модели данных (темпорального OLAP-куба) предлагается использовать темпоральный OLAP язык – TOLAP [4]. TOLAP комбинирует возможности языков темпоральных запросов
типа TSQL2 или SQL/TP с некоторыми возможностями языков высокого уровня
типа HiLog или
SchemaLog.
TOLAP
– язык, основанный на правилах. Краткое описание TOLAP проиллюстрируем на примере из области медицины.
Запрос, возвращающий в качестве результата назначенные пациентам некоторого
госпиталя процедуры, будет выражен в TOLAP
как:
SrvU(proc,
pat, qty, t)←Services(doc, proc, pat, day, qty, t),
pat[t]→insType:’
Переменная pat представляет элемент на самом низком уровне
размерности Patient. Кортеж Services соответствует результату, если пациент pat был обслужен доктором doc в
день day во время t и пациент
pat был присоединен к учреждению типа 'Union' во время прохождения лечения. Выражение pat[t]→insType:’Union’
называется атомом свертки, а Services(doc,proc,pat,day,qty,t) – атомом факта. Это пример запроса
с неагрегированными данными. Запросы с агрегатами
также могут быть выражены в TOLAP.
Аналогично языку Datalog правила могут быть скомпилированы в программы.
В настоящее время в рамках
НИР, выполняемых на кафедре прикладной математики МЭИ (ТУ) по тематике
разработки математического и программного обеспечения ИСППР, реализуются
базовые методы и программные средства для интеграции ТБД и технологии OLAP.
Литература
1. Еремеев
А.П., Еремеев А.А., Пантелеев А.А. Темпоральные базы данных и их применение в интеллектуальных
системах // Интеллектуальные системы. Коллективная монография. Выпуск 4 / Под. ред. В.М. Курейчика.
– М.: Физматлит, 2010. – с. 253-276.
2. Еремеев
А.П., Еремеев А.А., Пантелеев А.А. Темпоральная модель данных и возможности ее реализации на
основе технологии OLAP // Двенадцатая национальная
конференция по искусственному интеллекту с международным участием КИИ-2010
(20-24 сентября 2010г., г. Тверь,
Россия): Труды конференции. В 4-х томах. Т. 3. - М.: Физматлит,
2010. – с. 345-353.
3. Codd E.F., Codd S.B., Salley C.T. Providing OLAP to User-Analysts: An IT Mandate, Arbor Software Corp. Papers,
1996.
4. Alejandro A. Vaisman and Alberto O. Mendelzon A Temporal Query Language for OLAP:Implementation
and a Case Study // In Proceedings of the 26th VLDB Conference,