BC/NW 2009; №2 (15):9.2
О СОЗДАНИИ И УЧЕТЕ ЭЛЕКТРОННОЙ ДОКУМЕНТАЦИИ НАУЧНОГО ХАРАКТЕРА
Борисов А.В., Куриленко И.Е.
(ГОУВПО «Московский энергетический институт (технический университет)», Россия
Работа выполнена при финансовой поддержке РФФИ
В настоящий момент во многих научных организациях применяются электронные системы хранения знаний и данных. В первую очередь они ориентированы на обеспечение сохранности и доступности электронных документов в рамках системы. Как правило, это электронные библиотеки или электронные каталоги. Разработаны и внедрены электронные системы государственной регистрации НИОКР, диссертаций, описаний алгоритмов и программ, предназначенные для учета результатов научной деятельности. Как правило, подобные системы представляют собой базы данных с возможностью поиска по ряду критериев. Системы такого класса не предназначены для работы с научным материалом, находящимся в стадии разработки или исследования, а ориентированы на сохранение подготовленных ранее документов. Кроме того, зачастую возможности доступа к ним ограничены.
С другой стороны существует большое количество wiki-подобных систем, которые обеспечивают широкую доступность подготовленного материала и поддержку стадии разработки, но не обладают развитыми средствами экспорта материала в стандартную для отчета форму, механизмами упрощенного ввода и обновления информации, возможностью многокритериального поиска информации, ее оценки, а также не содежат развитых средств разграничения доступа. При работе с системами данного класса необходимо владеть специфическим для системы языком разметки, что часто удобно для IT специалиста, но может вызывать затруднения у исследователя, не являющегося профессионалом в этой области. Последнее особенно актуально при подготовке материала сложной структуры, содержащего таблицы, гистограммы, графики. Тем не менее, популярность систем данного класса в научном сообщества растет, т.к. они обеспечивают один из наиболее эффективных способов коммуникации между распределенными командами и предоставляют возможность публикации результатов исследований с целью вовлечения коллег в научную дискуссию или привлечения партнеров на начальных стадиях исследований.
В рамках данной статьи предлагается подход, позволяющий разработать систему работы с электронной документацией научного характера, сочетающую преимущества систем учета электронной документации и поддерживающую начальную стадию исследований, т.е. стадию разработки.
Коротко резюмируем ряд характеристик систем, которые представляются авторам существенными для дальнейшего рассмотрения.
Электронные базы и
каталоги
- хранение документов в исходных форматах документа или в одном из общепринятых форматов (PDF, TeX и тд.);
- поддержка поиска по атрибутам;
- хранение финальной версии документа;
- ограниченный доступ к каталогу или библиотеке;
- высокая степень формализации;
- ориентация на хранение и учет электронных документов.
Wiki-подобные системы
- хранение полнотекстовой информации с поддержкой гипертекста;
- поддержка поиска по содержимому документа;
- хранение документов разной степени готовности с поддержкой версионности;
- поддержка этапа создания документа;
- низкая степень формализации;
- широкая доступность.
В силу специфики области применения электронные каталоги ориентированы на законченные работы, удовлетворяющие обязательных требований. Это не всегда удобно на стадии исследования, т.к. на этом этапе данные могут не иметь законченный вид. В тоже время часто полезно представить эти данные для обсуждения в научном сообществе.
С другой стороны, форма представления материала принятая в wiki-системах позволяет представить такой незаконченный материал. При формальном же оформлении и регистрации работ эти системы не предоставляют широкого набора функций, что приводит к необходимости выполнять работы по форматированию и экспорту в требуемый формат многократно. Последнее увеличивает объем рутинных работ, снижая привлекательность wiki-систем для работ, находящихся в высокой стадии готовности, что ведет к снижению интенсивности обновления и потери актуальности материала.
Важно также отразить ряд качеств рассматриваемых систем, которые не всегда в достаточной степени реализованы в существующих системах. Наличие этих качеств является, по мнению авторов, важным при практическом внедрении предлагаемого решения:
- представление и хранение знаний на базе выбранной формальной модели;
- упрощенное редактирование материала;
- упрощенный режим редактирования формул.
В данной работе предлагается применение систем накопления знаний (СНЗ), как основы для создания и модификации электронных материалов научного назначения в организациях, ведущих научную деятельность. СНЗ, построенная по описанному в [1] принципу, сочетает в себе преимущества wiki-подобных систем и возможности, необходимые для генерации отчета.
В рамках организаций-исследователей предлагается создать на базе СНЗ локальное хранилище знаний с внутренним модерированием. Новый материал попадает в такое хранилище на раннем этапе непосредственно при создании (см. Рис.1, Рис. 2.). В силу того, что система накопления знаний позволяет обеспечить доступ к материалам в локальной сети и через Internet эти материалы могут быть доступны научной общественности. После того как материал подготовлен и прошел стадию внутреннего модерирования, он может быть отправлен в центральное хранилище, являющейся частью информационной среды головной организации или ведомства. Данная стадия фактически соответствует регистрации отчета по НИР.
Рис. 1. Накопление знаний научного назначения
Рис. 2. Хранение и модификация научного материала
Предлагаемый подход помимо репликации данных предполагает изменение подхода к работе с научным материалом. Предлагается уже на начальных стадиях исследования делать новую информацию доступной в электронном виде как минимум в рамках организации-исследователя. Ключевым отличием подхода является ориентация на интегрируемость, доступность и целостность цикла ведения НИР на всех стадиях.
На этапе, когда новые знания находятся в достаточной степени готовности для публикации в научной печати, они попадают в центральное хранилище. Именно в этот момент наряду с внешним модерированием возможно производить проверку на выполнение формальных требований и регистрацию новых созданных материалов в системе регистрации и учета. Центральное хранилище также представляет собой систему хранения знаний. Оно содержит только финальные и проверенные версии материала. При необходимости внешнего по отношению к организации-автору или центральному хранилищу размещения материала предлагается применение ссылок. Алгоритм внесения и модификации научного материала приведен на Рис. 3.
Рис. 3. Алгоритм внесения и модификации научного материала
Так как исследования могут затрагивать разные области научной деятельности система должна обеспечивать релевантный поиск по материалам различных научных направлений и давать возможность простой работы, доступной неспециалистам в области информационных технологий. Первое может быть обеспечено за счет реализации на основе выбранной и обоснованной формальной модели представления знаний. Второе обеспечивается реализацией удобной среды редактирования.
Отсутствие этих качеств затруднит внедрение системы, в силу естественных сложностей при решении типовых для конечного пользователя задач. Именно в связи с этим выше в статье приведенные качества выделены как одни из самых важных.
Резюмируя вышесказанное, определим следующие основные принципы предлагаемого подхода:
1. доступность систем накопления знаний в сети Интернет;
2. возможность ограничения доступа к знаниям в случае необходимости или специальной направленности знаний;
3. внутреннее представление знаний в рамках выбранной формальной и обоснованной модели;
4. реализация удобного встроенного редактора, поддерживающего работу в различных научных областях;
5. хранение черновых версий материала в системе в удобном для создателя и данной предметной области формате;
6. хранение финальных версий материала в центральном хранилище с предварительным внешним модерированием;
7. наличие ссылок на хранилище организации-автора исследования при необходимости внешнего размещения материала для предотвращения дублирования материала.
Создание системы, интегрирующей в себе преимущества электронных каталогов и wiki-подобных систем, позволит сократить время подготовки электронной документации научного характера, обеспечив также доступ к научной информации на стадии разработки и исследования.
Предлагаемый механизм предполагает возможность двойного модерирования, что повышает уровень качества содержимого в сравнении с традиционными материалами, размещенными в открытых электронных энциклопедиях.
ЛИТЕРАТУРА
1. Борисов А.В., Куриленко И.Е. Информационная среда накопления и модификации знаний // Сб. док. IX международной конференции «Информатика: проблемы, методология, технологии» в 2 т. – Т.1 – 2009. – С. 430–433.