BC/NW 2024№ 1 (41):8.1

ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РЕАЛИЗАЦИИ РАСПОЗНАВАНИЯ НОМЕРОВ ИГРОКОВ НА ПОЛЕ

Гуркин М.А., Харитонов В.Ю.

Распознавание номеров игроков на поле с помощью компьютерного зрения в видеотрансляциях спортивных матчей является активно развивающейся областью искусственного интеллекта и компьютерного зрения. Эта технология может применяться для различных видов спорта, таких как футбол, баскетбол, регби и другие, для автоматического отслеживания и анализа движения игроков. Одним из основных подходов к распознаванию номеров игроков является использование моделей на основе нейронных сетей и глубокого обучения [1]. Для обучения таких моделей требуется большой набор данных, содержащий изображения игроков с различными номерами. Нейронная сеть обучается извлекать признаки из изображений и классифицировать номера игроков.  

Процесс распознавания номеров включает в себя несколько ключевых шагов. Обработка изображений включает в себя фильтрацию, улучшение качества и другие методы, чтобы подготовить входные изображения для дальнейшего анализа. Сегментация изображений позволяет выделить области, где расположены номера игроков, и отделить их от остальной части изображения. Оптическое распознавание символов (OCR) используется для распознавания символов и цифр на изображениях номеров игроков, что позволяет преобразовать изображения номеров в текстовый формат для дальнейшей обработки. Методы машинного обучения, такие как нейронные сети и классификация, могут использоваться для обучения системы распознавания номеров на больших наборах данных [2]. Это помогает системе научиться распознавать различные стили и форматы номеров. Итоговая информация о номерах игроков может быть визуализирована на экране трансляции или передана в аналитические системы для отслеживания действий игроков, сбора статистической информации и других информационных целей.

Литература

1.  Goodfellow I., Bengio Y.,  Courville A. Structured Probabilistic Models for Deep Learning // Deep Learning. 2016.  

2.  Prince J.D. Computer Vision: Models, Learning, and Inference// Cambridge University Press. 2012.