BC/NW 2023 № 1 (40):9.2

СИСТЕМА РЕКОМЕНДАЦИЙ СПЕЦИАЛИСТОВ НА ОСНОВЕ АНАЛИЗА ИХ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИХ РАБОТ

Лебедев А.Д., Курушкина А.А., Зейн А.Н. 

Научно-исследовательская деятельность, которая постоянно ведётся во всех институтах МЭИ, зачастую требует участия специалистов разных сфер и профилей. Однако процедура поиска сотрудников в команды для проведения научно-исследовательских работ в данный момент занимает много времени и неэффективна.

Для решения этой проблемы была предложена система, которая основывается на базе данных, содержащей названия статей, докладов для конференций, НИР и НИОКР сотрудников. После получения на вход темы научной работы (задачи) система должна провести морфологический и синтаксический анализ имеющейся информации для сопоставления темы и компетенций сотрудников и составить рейтинг наиболее подходящих кандидатов. Было предложено несколько способов для проведения такого сопоставления.

В первом способе система разбивает названия работ сотрудника на слова, формируя словарь, которым можно охарактеризовать компетенции данного сотрудника. Из этих слов выделяется основа путём отсечения окончания. При поступлении новой задачи её текст проходит ту же процедуру. После чего происходит сопоставление набора слов в задаче и словаря каждого сотрудника. Данный способ осуществляется на основе MS SQL Server, что позволяет производить обработку данных непосредственно в месте их хранения и тем самым осуществлять подбор рекомендаций достаточно быстро. Однако, использование исключительно языка T-Sql лишает возможности использовать более сложные методы морфологической обработки и анализа, которые бы учитывали формы слов, синонимичные слова и словосочетания.

Второй способ подразумевает использование методов машинного обучения и нейронных сетей (например, технологию Word2Vec [1,2] для получения векторных представлений слов на естественном языке), что позволяет получить значительный прирост в качестве подбора, но тем не менее замедляет его в сравнении с первым методом.

Литература

1.       Е. А. Черепков, С. А. Глебов. Использование модели Word2Vec для кластеризации больших текстовых данных // Научное обозрение, 2017, №3, C.21-24. Режим доступа: https://scienceengineering.ru/pdf/2017/3/1170.pdf