Вычислительные сети, теория и практика.

BC/NW 2010; №2 (17):11.2

АНАЛИЗ ЭМПИРИЧЕСКИХ И МАТЕМАТИЧЕСКИХ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЧЕЛОВЕЧЕСКОГО ЛИЦА

Гомозов А.А., Крюков А.Ф.

(Московский энергетический институт (технический университет), Россия)

В настоящее время остро стоит проблема скорости доступа в интернет, которая ограничивает возможности для общения пользователей посредством видеосигнала, необходимого для решения современных бизнес-задач.

Для существенного снижения количества передаваемых данных при передачи изображений человека можно применить специальные алгоритмы построения трехмерной модели лица, основываясь на неких ключевых точках лица, определенных в видеопотоке. Подобная подмена реального изображения трехмерной графикой широко используется для создания спецэффектов в киноиндустрии. Если, например, использовать веб-камеру и передавать только основные данные о лице пользователя, то необходимо решить следующее множество задач;

1) детектирование лица: определение наличия на видеопоследовательности человеческого лица;

2) распознавание черт лица: распознавание основных элементов и ключевых точек лица (глаз, бровей, носа, губ и т.д.) на видеопоследовательности;

3) определение пространственного положения головы человека как 3D-объекта, отслеживание изменения положения в реальном времени;

4) отслеживание движений лица и мимики в реальном времени;

5) распознавание дополнительных движущихся объектов (как дополнительная более сложная задача).

В предлагаемой статье рассмотрен «первый шаг» на пути решения основной задачи – обнаружение или детектирование лица (face detection).

При попытке построения автоматической системы обнаружения лиц приходится сталкиваться со следующими сложностями:

· сильно варьирующийся внешний вид лица у разных людей;

· даже небольшое изменение ориентации лица относительно камеры влечет за собой значительное изменение изображения лица;

· индивидуальные особенности лица (усы, борода, очки, морщины и т.д.) существенно осложняет автоматическое распознавание;

· влияние изменений выражения лица;

· часть лица может быть невидима или закрыта другими предметами;

· влияние условий съемки на изображение.

Существующие алгоритмы распознавания разделяются на два типа, различающихся подходами к их реализации [1]. Первые алгоритмы – эмпирические, делают попытку моделирования работы человеческого мозга в процессе идентификации лица в поле видимости. Другой тип алгоритмов основан на математическом аппарате, для которого задача распознавания лица является частным случаем задачи распознавания.

Среди методов, делающих попытку эмпирического распознавания, существуют два основных подхода: метод «сверху-вниз», основанный на знаниях, и метод «снизу-вверх», основанный на особенностях лица.

Распознавание "сверху-вниз" использует построение некоторого набора правил, которым должен отвечать фрагмент изображения для признания его человеческим лицом. Этот набор правил является попыткой формализации эмпирических знаний о том, как именно выглядит лицо на изображениях. Можно легко выделить набор свойств изображения лица. Например, лицо обычно симметрично, черты лица (глаза, нос, рот) отличаются кожей по яркости (обычно им соответствуют области резкого изменения яркости), черты лица расположены вполне определенным образом. Опираясь на перечисленные свойства, можно построить алгоритм, проверяющий их наличие на фрагменте изображения. К этому же семейству методов можно отнести распознавание с помощью шаблонов, заданных разработчиком (predefined template matching) [2]. Шаблоны задают некий стандартный образ изображения лица, например, путем описания свойств отдельных областей лица и их возможного взаимного расположения. Обнаружение лица с помощью шаблона заключается в проверке каждой из областей изображения на соответствие заданному шаблону. Данный подход основан на использовании широкого набора неких стандартных данных и специальных измерений. В случае распознавания человеческого лица получение такого набора данных и измерений вполне возможно. Но при необходимости расширения или модификации задачи возникают значительные трудности в обработке увеличивающегося объема данных. Этот подход применим для решения некоторых прикладных задач, однако в общем случае требует больших затрат.

Распознавание "снизу-вверх" использует инвариантные свойства (invariant features) изображений лиц, опираясь на следующем предположении. Должны существовать некоторые признаки присутствия лиц на изображении, инвариантные относительно условий съемки. Существуют примеры алгоритмов, которые выдают информацию о наличии или отсутствии лица на изображении на основе информации о наличии или отсутствии глаз. При этом поиск глаз может осуществляться как «снизу-вверх», так и «сверху-вниз». В основу алгоритмов, использующих подход к распознаванию "снизу-вверх", положены следующие действия:

1) обнаружение элементов и особенностей (features), которые характерны для изображения лица;

2) анализ обнаруженных особенностей, вынесение решения о количестве и расположении лиц.

Для корректной работы алгоритма необходимо создание базы данных особенностей лица с последующим тестированием.

Для более точной реализации эмпирических методов могут быть использованы модели, которые позволяют учесть возможности трансформации лица, а, следовательно, имеют либо расширенный набор базовых данных для распознавания, либо механизм, позволяющий моделировать трансформацию на базовых элементах.

Второе семейство методов использует аппараты математической статистики и машинного обучения. Методы этой категории опираются на теорию распознавания образов. Изображению (или его фрагменту) ставится в соответствие вычисленный вектор признаков, который используется для классификации изображений на два класса - лицо/не лицо. Самый распространенный способ получения вектора признаков - это использование самого изображения: каждый пиксель становится компонентом вектора, превращая черно-белое изображение размерностью n*m в вектор пространства Rⁿ^*m, где n и m – целые положительные числа. Недостатком такого представления является чрезвычайно высокая размерность пространства признаков. Достоинство этого метода состоит в исключении из всей процедуры построения классификатора участие человека. Использование всего изображения вместо вычисленных на основе его характеристик потенциально снижает вероятность ошибки.

Можно перечислить следующие проблемы, общие для методов второго типа [3].

1. Зависимость от ориентации и масштаба лица. Большинство классификаторов не являются инвариантными к повороту лица в плоскости изображения и изменению его размера. Поэтому для успешного обнаружения лица, отличного по размеру или ориентации от лиц в предварительном наборе, требуется дополнительная обработка входного изображения (масштабирование, поворот). Проблему изменения масштаба решают обычно путем полного перебора всех возможных прямоугольных фрагментов изображения всех возможных размеров. Попытка же рассматривать еще и все возможные углы поворота лиц в плоскости изображения потребует значительно большей вычислительной мощности.

2. Неявный способ определения признаков для распознавания лица таит в себе потенциальную опасность: классификатор, обладающий недостаточно репрезентативным набором изображений лиц, может выделить вторичные или ложные признаки в качестве важных. Результат зависит от освещения и иногда требует дополнительной предобработки.

3. Высокая вычислительная сложность. Во-первых, сами классификаторы часто включают в себя большое количество сложных вычислений; во-вторых, полный перебор всех возможных прямоугольных фрагментов изображения сам по себе ресурсоёмко. Таким образом, некоторые методы не подходят для решения задач в реальном времени.

Обе рассмотренные группы методов имеют достоинства и недостатки. Эмпирические методы более просты в реализации, а математические более точны. Однако под воздействием неких реальных условий работа методов обоих групп значительно усложняется [4]. В случае эмпирических методов требуется дополнительная предварительная подготовка, а в случае математических - значительно усложняются вычисления. Таким образом, выделить какую-либо группу методов как наиболее эффективную невозможно. В задаче распознавания лица метод решения выбирается исходя из конкретных условий задачи, которые должны быть рассмотрены на этапе анализа.

ЛИТЕРАТУРА

1. Самаль Д.И., Старовойтов В.В. Подходы и методы распознавания людей по фотопортретам. – Минск: ИТК НАНБ, 1998. – 54 с.

1. Самаль Д.И. Построение систем идентификации личности на основе антропометрических точек лица // Цифровая обработка изображений. - Минск: ИТК, 1998.- С.72-79.

2. Yang M.H., Kriegman D.J., Ahuja N. Detecting faces in images: A survey // IEEE Trans. Pattern Analysis and Machine Intelligence. Jan. 2002. Vol. 24. № 1. P. 34-58.

3. Yang G. and T.S. Huang Human Face Detection in Complex Background // Pattern Recognition. 1994. Vol. 27. №1. P. 53-63.