BC/NW 2009; №1 (14):10.4

 

АНАЛИЗ СИСТЕМ ПОИСКА ИЗОБРАЖЕНИЙ ПО СОДЕРЖАНИЮ

 

Павлов Е.А., Студенова А.А., Хрящёв В.В.,

 

(Ярославль, Ярославский Государственный Университет им. П.Г.Демидова, Россия)

 

В работе представлены результаты исследования в области извлечения информации из изображений. Проведён сравнительный анализ существующих систем поиска изображений по содержанию: IBM QBIC, Visual SEEk, Netra, Mars [1-3].

В последнее время стремительно увеличивается количество цифровых изображений. Каждый день пользователи сети Интернет генерируют терабайты изображений, которые могут содержать информацию. Традиционными способами невозможно определить, что на них изображено.

Существуют методы, позволяющие извлекать данные из изображений без непосредственного участия человека. Название данных методов в англоязычной литераторе – Content-based Image Retrival, где content-based означает, что происходит анализ содержания изображения, а термин content в данном контексте означает цвет, форму, текстуру или любую другую информацию, которая может содержаться в самом изображении.

Поиск изображений по содержанию можно разделить на две фазы: непосредственно сам поисковый запрос (запрос по образцу или семантическое извлечение) и механизмы сравнения содержимого. Во второй фазе CBIR можно выделить несколько методов извлечения свойств из изображения:

Цвет – извлечение информации базируется на схожести вычисляемых гистограмм внутри определённых значений (например, цвет кожи) или пространственных областях на изображении.

Текстура – происходит поиск визуальной структуры (паттернов) в изображении и анализ их пространственного размещения. Текстуры представляются с помощью текселей, которые затем размещаются в наборы, основанные на том, как текстуры были определены в изображении. Эти наборы не только определяют структуры, но и места их локализации.

Форма – производится сегментация и определение границ в изображении.

Рассматриваемые системы используют все вышеизложенные методы извлечения свойств из изображения. Отличие состоит в выборе алгоритма для определённой методики. Исследования показали, что используемый в системе IBM QBIC метод извлечения и сравнения формы на основе граничных геометрических моментах и инвариантных моментах оказался наиболее эффективным. При сравнении цвета все рассмотренные системы используют гистограммы в цветовом пространстве HSV. Наибольшие вычислительные сложности возникают при использовании метода текстур (трёхмерные гистограммы в системе Mars).

   Сфера применения данных систем велика и в дальнейшем будет расширяться: поиск изображений в интернете, фильтрация «плохих» фотографий, работа с большими коллекциями произведений искусства.

Литература

1. Rui, Yong, Thomas S. Huang, Shih-Fu Chang. Image Retrieval: Current Techniques, Promising Directions, and Open Issues. – Journal of Visual Communication and Image Representation 10, 39–62, 1999.

2. Datta, Ritendra; Dhiraj Joshi, Jia Li, James Z. Wang. Image Retrieval: Ideas, Influences, and Trends of the New Age. – ACM Computing Surveys 40, 2008.

3. Myron Flickner, Harpreet Sawhney, Wayne Niblack, Jonathan Ashley, Qian Huang, Byron Dom, Monika Gorkani, Jim Hafner, Denis Lee, Dragutin Petkovic, David Steele, Peter Yanker. – Query by Image and Video Content: The QBIC System, Computer, vol. 28, no. 9, pp. 23-32, Sept., 1995