BC/NW 2006, №2, (9) :3.5
К ВОПРОСУ О ПЕРСПЕКТИВНОСТИ РАСШИРЕННОГО
ПРИМЕНЕНИЯ МЕТОДОВ КОНТЕКСТНОГО МОДЕЛИРОВАНИЯ В АЛГОРИТМЕ JPEG 2000
П.А. Чернов
(Москва, Московский энергетический институт
(технический университет), Россия)
К
алгоритму сжатия изображений, претендующему на место международного стандарта,
можно сформулировать следующие требования:
-
высокая скорость сжатия и восстановления изображения;
-
возможность сжимать как полноцветные, так и изображения в градациях
серого;
-
возможность постепенного проявления изображения;
-
поддержка сжатия без потерь;
-
поддержка атрибута прозрачности точки;
-
широкие возможности по управлению качеством изображения, поддержка
выбора степеней сжатия областей изображения различной значимости;
-
устойчивость к ошибкам при передаче;
-
поддержка возможности включения дополнительной информации (описание,
информация для поиска, о правах на распространение и т.д.).
Удовлетворение
приведенных выше требований обеспечивает алгоритму широкую применимость – от
областей любительской цифровой фотографии и полиграфии до Web и
медицинских снимков. В связи с чем, среди существующих на данный момент
алгоритмов выделяется JPEG 2000.
В
этой статье автор ставит задачу рассмотреть возможность модификации
последовательности операций, используемой в алгоритме JPEG 2000, за счет расширенного
применения методов контекстного моделирования.
В
основу JPEG 2000 положена следующая последовательность операций:
1)
сдвиг каждой компоненты RGB по яркости с целью
приближения к нулю гистограммы частот встречаемости пикселей на разных уровнях
яркости;
2)
преобразование из цветового пространства RGB в YUV (яркость, хроматический
синий, хроматический красный);
3)
дискретное wavelet-преобразование;
4) квантование,
происходит деление коэффициентов полученных с предыдущего этапа на некоторое
число, в результате чего происходит сужение динамического диапазона
коэффициентов;
5) энтропийное
кодирование получившихся массивов данных, реализуется с помощью арифметического
кодирования [1,2].
Учитывая
возможность JPEG 2000 производить сжатие изображений без потерь,
предлагается руководствоваться парадигмой, предложенной Говардом, сжатия
изображения без потерь, согласно которой процесс сжатия разбивается на 4 этапа:
-
выделение группы пикселей;
-
предсказание значений последующих пикселей;
-
составление модели ошибок;
-
энтропийное кодирование [3].
На
этапе выделения групп пикселей происходит преобразование изображения из формата
RGB в YUV. Выбор оптимальной цветовой модели для
представления изображения перед сжатием является отдельным полем для
исследовательской деятельности. Далее, раздельно по трем плоскостям,
производится применение методов контекстного моделирования. Элементом
моделирования изначально полагается взять квадраты из четырех точек, в
дальнейшем планируется провести исследования по выбору некоторой оптимальной
структуры элемента изображения, возможно, варьирующейся в зависимости от
природы изображения. По построенным плоскостям предсказаний производится
построение плоскостей ошибок предсказания. Далее рекурсивно применяются методы
контекстного моделирования для построения новых плоскостей ошибок. После чего
выполняется wavelet-преобразование. С целью обеспечения возможности
постепенного проявления изображения планируется применить адаптивный способ
построения контекстных моделей.
Модификация
последовательности операций, использованной в JPEG 2000, представлена на
рисунке 1. Блоки 1, 2, 4, 5, 6 соответствуют модифицируемому алгоритму JPEG
2000 [1]. Новый блок 3 – «предиктор» (выделен на рисунке 1 пунктиром),
предназначен для построения плоскостей предсказаний и ошибок предсказаний.
Рис. 1 – Модифицированная последовательность
операций алгоритма JPEG 2000
На
этапе арифметического кодирования также планируется применить методы
контекстного моделирования. При этом представляет интерес величина возможного
выигрыша в длине результирующего кода по сравнению с результатом применения
модели ошибок, построенной по таким функциям распределения вероятностей
значений отклонений от нулевого значения величины ошибки предсказания как
Лапласа или нормальной. Заблаговременный выбор функции распределения
вероятностей позволяет табулировать вероятности величин элементов, получаемых с
выхода фильтров на этапе wavelet-преобразования, резко сокращая
объем вычислений, проводимых при энтропийном кодировании.
В
результате расширенного применения методов контекстного моделирования ожидается
улучшение коэффициента сжатия за счет лучшего учета взаимосвязанности элементов
изображения, которые могут быть вызваны как особенностями изображаемых
объектов, так и аппаратурой, использованной для их получения. В ближайшей
перспективе планируется реализовать модифицированную последовательность
операций и провести комплексный сравнительный анализ, как по обеспечиваемому
коэффициенту сжатия, так и по требовательности к вычислительным ресурсам, с
последовательностью операций используемой в JPEG 2000.
ЛИТЕРАТУРА
1. Ватолин Д., Ратушняк А.,
Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие
изображений и видео. – М.: ДИАЛОГ-МИФИ, 2003. с. 306 – 311, 321 - 333.
2. Bell
T., Witten I.H., Cleary J.G. Modeling for text
compression. ACM Computing Surveys, Vol. 21, No 4, 1989, pp. 558 - 591.
3. Howard P.G. The Design and Analysis of Efficient Lossless Data Compression
Systems. Brown University Department of Computer Science. 1993.