Russian Language English Language

4. Модели и методы для организации управления ВС

4.1. СПЕЦИФИКАЦИЯ ПАРАМЕТРОВ МОДЕЛИ УЗЛА ДЛЯ ОЦЕНКИ ПРОИЗВОДИТЕЛЬНОСТИ ВЫЧИСЛИТЕЛЬНОЙ СЕТИ

4.2. СТРУКТУРНАЯ ОРГАНИЗАЦИЯ ВИРТУАЛЬНЫХ КОРПОРАЦИЙ

4.3. АНАЛИЗ МОДЕЛЕЙ ПРЕДСТАВЛЕНИЯ ДАННЫХ

4.4. НОВЫЙ ПОДХОД К ОРГАНИЗАЦИИ ДАННЫХ В ВЫЧИСЛИТЕЛЬНОЙ СРЕДЕ – МОДЕЛЬ ДАННЫХ НА ГИПЕРДОМЕНАХ


Экспресс информация

Редколлегия журнала

Подписка на новости

Гостевая книга

Предоставление материалов

Письмо в редакцию

На начало


2010, Номер 2 ( 17)



Place for sale
НОВЫЙ ПОДХОД К ОРГАНИЗАЦИИ ДАННЫХ В ВЫЧИСЛИТЕЛЬНОЙ СРЕДЕ – МОДЕЛЬ ДАННЫХ НА ГИПЕРДОМЕНАХ

BC/NW 2010; №2 (17):4.4

 

НОВЫЙ ПОДХОД К ОРГАНИЗАЦИИ ДАННЫХ В ВЫЧИСЛИТЕЛЬНОЙ СРЕДЕ – МОДЕЛЬ ДАННЫХ НА ГИПЕРДОМЕНАХ

Волкова Г.Д., Григорьев О.Г.

(Московский государственный технологический университет «Станкин», Россия)

 

В работе приведено формальное описание модели представления данных на основе гипердоменов, проанализированы возможности практической реализации этой модели.

 

Формальное описание модели представления данных на основе гипердоменов

Анализ  глобальных проблем в области информатики и противоречий, лежащих в их основе, позволили предположить, что выход не столько в применении нанотехнологий в современных компьютерных средах, сколько  в переносе «центра тяжести» на  исследование  «многомерной» организации информации и знаний в памяти специалистов и  в формировании на основе этой «многомерности» принципиально новых пространственно-временных аспектов хранения и обработки знаний в вычислительной среде и, соответственно, технологий создания автоматизированных систем.

Суть методологии автоматизации интеллектуального труда заключается в получении последовательности отображений прикладных задач в виде формализованных моделей (инфологической - ИЛМ и даталогической - ДЛМ) на основе первоначально формируемой концептуальной модели (КМ) предметной задачи на трех уровнях абстрагирования. Многомодельное представление методологии автоматизации интеллектуального  труда обусловило необходимость единообразного описания множества разнородных моделей, которые  еще и отражают разную степень обобщения (абстрагирования) для прикладных задач. Унификация представлений разнородных моделей на разных уровнях абстрагирования по составу моделей, по механизмам порождения связей, по типологии связей обеспечивает определенную степень точности соответствия при установлении взаимосвязей между моделями.

Содержанием инфологического моделирования при создании прикладных автоматизированных систем [1] является разработка такого модельного представления предметной задачи, которое, с одной стороны, инвариантно к программно-технической среде и средствам ее реализации, а с другой стороны, адекватно (в смысле  синонимичности) естественно-языковому представлению этой задачи, так как увязано с ним на основе концептуальной модели. Инфологическая модель (ИЛМ) как инвариантное к среде реализации представление предметной задачи может рассматриваться  в  различных, но взаимосвязанных аспектах, составляющих основу современных мультиинформационных сред:  вербальном, образном и речевом представлении. Инфологическое моделирование в рамках методологии автоматизации интеллектуального труда отражает в вербальном варианте и рассматривается на нескольких уровнях абстрагирования: абстрактном, объектном, конкретном.

Для инфологического моделирования как инвариантной основы представления информации и знаний в вычислительной среде выявлены (в рамках методологии автоматизации интеллектуального труда) методологические, теоретические и практические основания, которые позволили установить состав, структуру и закономерности формирования инфологических моделей.

Одной из существенных проблем методологии автоматизации интеллектуального труда является наличие определенного разрыва между модельными представлениями, инвариантными к программно-технической среде реализации прикладных автоматизированных систем, и модельными представлениями, ориентированными на конкретную среду реализации. Суть такого разрыва в том, что статические структуры инвариантных модельных представлений формируются как многослойные конструкции, организованные на основе законов цикличности, а существующие специализированные программные  комплексы изначально не поддерживают такие  регулярные многослойно-многомерные  конструкции. Исходя из закона цикличности вербальных знаковых представлений, сформулированного в [1], была предложена идея формирования принципиально новой модели для представления регулярных многослойно-многомерных  конструкций. Суть данного закона заключается в том, что область допустимых значений структурной единицы типа «информационный атрибут» одного уровня сложности вербального описания может быть представлена (раскрыта) как структурная единица типа «информационный модуль» другого, менее сложного уровня вербального описания. Новая модель представления таких конструкций была названа как модель представления данных на основе гипердоменов.

Сформулированы основные требования к модели представления данных на основе гипердоменов, вытекающие из особенностей организации семантических и синтаксических моделей в рамках методологии автоматизации интеллектуального труда:

- наличие множества структурных единиц модели, обеспечивающих описание сложноорганизованных данных в виде баз данных на различных уровнях сложности (абстракции) и  на нескольких уровнях абстрагирования (общности),

- наличие формального описания связей структурных единиц для простых и сложных конструкций модели,

- наличие механизма и закономерностей порождения  конструкций модели.

Выявлены теоретические основания для формирования модели представления данных на основе гипердоменов в виде взаимоувязанных статических составляющих инфологических моделей объектного и конкретного уровней представления предметных задач в рамках методологии автоматизации интеллектуального труда.

Статические составляющие инфологических моделей объектного уровня представления предметных задач определяют структурные характеристики модели представления данных на основе гипердоменов и обладают следующими отличительными особенностями:

      - наличие трех типов именованных структурных единиц (ИСЕ), позволяющих описывать конструкции разной сложности – информационный модуль (ИСЕ-«ИМ»), информационная сущность (ИСЕ-«ИС»), информационный атрибут (ИСЕ-«ИА»);

      - наличие различных типов и видов связей, позволяющих формировать многообразие синтаксических основных и производных конструкций разных уровней сложности (бинарных связей – «состав», «упорядочение», «компоновка» и тернарных связей на структурных единицах, схем структурных единиц и их бинарных связей);

      - введенные производные конструкции – схемы именованных структурных единиц – обеспечивают увязку имен структурных единиц  всех типов в единое целое.

Эти особенности позволяют интерпретировать понятие «именованного гипердомена» как сложную конструкцию на множестве схем именованных структурных единицах, удовлетворяющих определенным условиям на заданном уровне сложности (u) (формула 1 и  рис.1).

                                                     (1)              

Рис.1. Структура именованного гипердомена

 

Именованные гипердомены могут быть объединены в множества как на одном уровне сложности (формула (2)), так и  на всех уровнях синтаксической сложности (формула (3)):

;                                                                           (2)

.                                                                     (3)

Сформулированный в рамках методологии автоматизации интеллектуального труда закон цикличности знаковых вербальных конструкций обеспечивает правила сопряжения схем структурных единиц разных уровней сложности.     

Многообразие бинарных связей схем ИСЕ предопределяют многообразие связей именованных гипердоменов  и их подструктур.

Для всех конструкций на именованных гипердоменах выполнена геометрическая (рис.2)  и графическая интерпретации (рис.3).

Статические составляющие инфологических моделей конкретного  уровня представления предметных задач определяют структурные характеристики состояний модели представления данных на основе гипердоменов, обладают аналогичными  отличительными особенностями и дополнительно введены производные конструкции – схемы состояний структурных единиц, которые обеспечивают увязку состояний структурных единиц  всех типов в единое целое.

Также эти особенности позволяют ввести понятие «состояния гипердомена» как сложную конструкцию на множестве схем состояний структурных единицах, удовлетворяющих определенным условиям на заданном уровне сложности.

 

Рис. 2. Подмножество бинарных связей между подструктурами именованных гипердоменов разных уровней

 

Рис. 3. Графическая интерпретация подмножества бинарных связей

 

Многообразие бинарных связей схем состояний СЕ предопределяют многообразие связей состояний гипердоменов  и их подструктур.

Выполнено формальное описание модели представления данных на основе гипердоменов как взаимоувязанных статических конструкций объектного и конкретного уровня.

Для модели представления данных на основе гипердоменов проведен сравнительный анализ со следующими моделями: реляционной, постреляционной, объектно-ориентированной и многомерной. Отмечено, что модель представления данных на основе гипердоменов является логическим развитием реляционной и постреляционнной моделей в части структурного представления.

Поскольку в объектно-ориентированной модели данных любой объект – это пара «идентификатор – значение», причем объекты инкапсулированы, то есть их значения доступны только через методы класса. Наличие структурных значений, представленных простыми значениями и идентификаторами объектов, обуславливает дополнительные операции. При сравнении с объектно-ориентированной моделью выявлено, что новая модель также может быть увязана с идеей структурных значений  в многослойных конструкциях, а также с функциональной составляющей, но это требует дальнейшей теоретической проработки.

При сравнении с многомерной моделью данных отмечено, что в новой модели возможно использование достоинств обработки многомерной модели данных, среди которых особо  можно выделить операции «среза», «вращения», «свертки и детализации» и «агрегации» с последующей и настройкой на новую модель данных.

 

Анализ возможностей практической реализации модели представления данных на основе гипердоменов

Одним из немногочисленных примеров удачной реализации многомерных подходов к обработке данных может служить СУБД InterSystems Caché. В ней в полной мере сочетаются положительные качества как реляционных СУБД (скорость, надежность), так и OLAP (многомерность). Caché предоставляет три типа доступа к данным, обладающих своими недостатками и достоинствами: реляционный, объектный (отсутствие транзакционности), прямой (отсутствие контроля целостности и кэширования).

Многомерные СУБД используют матричный подход к обработке разреженных данных и древовидный подход к хранению и доступу к ним. Суть его заключается в представлении данных в виде векторов, а отношений в виде матриц. Реляционные операторы реализуются через операторы над многомерными матрицами, основанные на тензорном исчислении. При этом данные и промежуточные структуры на физическом уровне хранятся в виде деревьев состоящих из индексов в многомерной разреженной матрице.

В настоящее время существует множество подходов к распараллеливанию вычислений (библиотеки, вычислительные среды), но в связи с расширением круга решаемых с  их помощью задач возникают проблемы оптимального распределения вычислений.

Многие проблемы, связанные с синхронизацией и организацией параллельных вычислений, успешно решаются с помощью методов параллельных вычислений, управляемых данными. В этом методе процесс распараллеливания базируется на событийно-ориентированном подходе. Описанный подход обладает некоторыми недостатками, например, не всегда можно точно определить момент завершения задачи, а также построение схемы взаимосвязей ложится на программиста. Однако достоинства данного подхода преобладают: отсутствует необходимость синхронизации; имеется возможность одновременного выполнения цепочек операторов различного уровня; имеется возможность задавать поток исходных данных и получать часть результирующих данных во время выполнения программы.

Существует множество способов интеграции локальных баз данных, среди которых выделим наиболее часто применяемые на практике:

- интеграция на основе единого профиля стандартов подразумевает создание интегрированной системы как совокупности баз данных, реализованных по единым стандартам;

- интеграция на основе создания единого интегрированного информационного пространства, когда локальные БД экспортируют часть своей информации в другие локальные базы данных;

- интеграция на основе единого хранилища данных. В этом случае данные из множества локальных БД загружаются в хранилище данных, и далее все запросы пользователей будут обращены только к этому хранилищу данных, то есть интегрированные ресурсы сосуществуют наряду с их источниками;

- создание виртуального хранилища данных,  при этом подходе данные остаются в источниках, и отсутствует физическое перемещение данных.

Виртуальный подход более уместен при построении таких систем, где число источников велико и данные изменяются часто, например, для Web-ресурсов.

Анализ возможностей практической реализации модели представления данных на основе гипердоменов показал, что отдельные положительные стороны существующих методов и средств сложно объединить для достижения эффективной организации данных в рамках многослойно-многомерной концепции новой модели данных.

Заключение

1. Новая модель данных на гипердоменах  основана на теоретическом аппарате инфологического моделирования в рамках методологии автоматизации интеллектуального труда.

2. Реализация модели данных на гипердоменах  в настоящее время практически затруднена и требует дальнейших теоретических исследований.

Литература

1.     Волкова Г.Д., Новоселова О.В., Семячкова Е.Г. Проектирование прикладных автоматизированных систем в машиностроении: учебное пособие.- М.: МГТУ «Станкин», 2002. – 162 с.