BC/NW 2003г., №1(3)/ 17.1

 

 

ТЕХНОЛОГИЯ АКТУАЛИЗАЦИИ ЗНАНИЙ НА ОСНОВЕ ИНТЕГРАЦИИ СЕТЕВЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ

 

Дзегеленок И.И., Сорокин П.М.

 

(Москва, Московский Энергетический Институт, Российская Федерация)

 

Несмотря на значительное продвижение Интернет в сторону увеличения количественных показателей – скорости каналов, числа пользователей, наполнения информацией, качество сервисов сети остается практически неизменным. В сложившейся ситуации можно предположить, что этап количественных улучшений компьютерных сетей позади, и наиболее перспективным  будет работа направленная на развитие «интеллекта сетей».

Одним из наиболее значимых путей интеллектуализации сетей – извлечение из сетевых ресурсов эмпирического знания в заданной предметной области. Существуют средства извлечения знаний из готовых баз данных («Intelligent  Miner» – IBM, PolyAnalist - Megaputer Intelligence, «Решатель открытых задач» - МЭИ и др.). Но найти источник, который бы отвечал запросам эксперта, был пригоден для анализа, обработки экспертной системой с целью получения эмпирического знания, пока не представляется возможным.

Единственным способом получения относительно полной информации о предмете познания является интеграция разрозненных информационных ресурсов для получения единой, сводной информационной базы данных. Последняя должна содержать необходимую для анализа информацию, свободную от неиспользуемых данных и противоречий.

Получаемое на столь серьезной основе знание будет иметь ценность только и только тогда, когда оно станет отражать реальное состояние дел на настоящее время, то есть когда оно будет основано на актуальной информации. Особенной это важно в области проектирования, разработки и экспертной оценки компьютерных систем и  сетей, т.к. именно эта область информационных технологий на сегодняшний день претерпевает самые значительные изменения, детальное отслеживание которых становится для специалиста непосильной задачей.

Таким образом, разработка целостной технологии актуализации (интеграции и обновления) данных и извлечения из них знания (соответственно тоже актуального) может послужить началом качественного улучшения сетевой информационной среды.

 

Предлагаемая нами технология основана на объединении разработанного в МЭИ инструментария решения открытых задач поискового (познавательного) проектирования [1] и апостериорной схемы интеграции локальных баз данных [2].

Конкретно в качестве экспертной системы, в разрабатываемой технологии используется расширенная версия «Решателя открытых задач» [3] – система получения эмпирического знания на основе индуктивного обобщения фактов. Главной особенностью этой системы является механизм выдвижения гипотез, направленный на повышение достоверности искомого знания. В результате Решатель формирует эмпирическое знание в виде логико-аналитической функции на основе интеллектуальной обработки и активного пополнения целевой базы фактов, в которой заключена вся найденная информация об объектах и их качественная оценка («удачный/ неудачный») относительно определяемой цели.

Информационная составляющая предлагаемой технологии определяется следующими понятиями.

Удаленной базой данных будем называть локальную базу данных доступную для обработки в Интранет-сети, сети Интернет или на локальном диске.

Целевой базой данных будем называть базу данных формируемую в результате объединения и преобразования данных, извлеченных из удаленных баз, и предназначенную для экспертного анализа.

Актуализацией целевой базы данных будем называть процедуру формирования этой базы данных интеграцией данных удаленных баз, по их состоянию на момент запуска процесса

Обобщенная схема предлагаемой технологии представлена на рис.1.

В ее состав входят следующие основные блоки.

1. Блок интеграции на основе заложенных правил интеграции данных и разрешения противоречий [2] производит опрос локальных баз данных, содержащих информацию о заданной предметной области, и формирует целевую базу данных.

2.Блок качественной оценки производит анализ целевой базы данных и формирует базу фактов путем присваивания каждой записи целевой базы данных качественной оценки. Следует отметить, что целевая база данных может содержать как характеристики объекта, так и показатели качества, что позволяет упростить процедуру оценки фактов. Оценка может производиться либо с помощью эксперта, либо автоматически (например, использую имитационное моделирование), либо комбинацией методов.

3.Решатель открытых задач анализирует базу фактов и генерирует логико-аналитическую функцию выбора, которая представляет эмпирическое знание в исследуемой предметной области. Процесс решения итерационный. На каждой итерации происходит автоматическая генерация гипотез, их оценка и формирование уточненной функции выбора до получения желаемой достоверности искомого знания.

4.Блок экспертных заключений на основе полученного эмпирического знания позволяет производить анализ в предметной области (определения влияния показателя на качество объекта исследования, экспертная оценка объекта,  сравнение объектов и т.п.)




Рис.1 Обобщенная схема технологии актуализации знаний

 

К настоящему времени разработана сетевая версия Решателя открытых задач в среде WWW с ультратонким клиентом. Данная версия обладает следующими преимуществами:

Общедоступность - конечному пользователю не нужно иметь никакого программного обеспечения кроме браузера, настроенного соответствующим образом  (поддерживающего все современные расширения).

Высокая скорость расчета - поскольку алгоритм обработки сложен и требует больших объемов вычислений, выполнение расчетов происходит на сервере (компьютере с заведомо приемлемой конфигурацией), а клиентская часть выполняет только интерфейсные функции.

Платформонезависимость – поскольку все современные платформы поддерживают отображение HTML-страниц, система не предъявляет к клиентскому оборудования специальных требований (только наличие современного броузера).

Простота освоения – поскольку большинство пользователей ПК знакомы с WEB-интерфейсом и привычны к работе в WEB-броузере, изучение интерфейса системы не должно вызывать затруднений.

Выполнена также работа по реализации отмеченной выше апостериорной схемы направленной интеграции локальных баз данных [2]. Этот механизм позволяет избежать избыточности и содержит механизмы разрешения противоречивости данных, что отличает его от традиционных механизмов репликации. Также предусмотрены средства гибкой настройки параметров интеграции, что делает его универсальным и позволяет легко подключать новые базы данных и оперативно реагировать на изменение структуры локальных баз.

 

Высокая эффективность рассмотренной технлогии подтверждена при решении ряда задач экологического мониторинга (Всероссийский институт межотраслевой информации), а также в учебном процессе при выполнении курсового проекта по дисциплине «Поисковое проектирование вычислительных систем». Ее можно рекомендовать как интеллектуальное приложеие встраиваемое в корпоративное хранилище данных. В целом же реализация ее профессиональных версий представляет новое направление интеллектуализации глобальных компьютерных сетей.

 

ЛИТЕРАТУРА

1.            Дзегеленок И.И. Открытые задачи поискового проектирования/-М.: Изд-во МЭИ, 1991.-68 с.

2.            Сорокин П.М. Механизм актуализации целевой базы данных в предметно ориентированной сетевой среде//Системы управления и силовая электроника – М.: ВЭИ, 2001. с 56 – 65.

3.            АРГОНАВТ – система приобретения эмпирических знаний. -В кн. Справочно-практическое издание "СОФТЕЛЬ – Сто компьютерных программ для бизнеса". Вып. 1997-1998. -М.: ХАМТЕК ПАБЛИШЕР, 1997, с. 117-125

4.            Арсеньев Б.П., Яковлев С.А. Интеграция распределенных баз данных. – М., 2001