Например, Бобцов

КЛАССИФИКАЦИЯ НЕСТАЦИОНАРНЫХ ИЗОБРАЖЕНИЙ И РАЗРАБОТКА МЕТОДИКИ ОЦЕНКИ АЛГОРИТМОВ КОДИРОВАНИЯ ИСТОЧНИКА

КЛАССИФИКАЦИЯ НЕСТАЦИОНАРНЫХ ИЗОБРАЖЕНИЙ И РАЗРАБОТКА МЕТОДИКИ...
УДК 621.397.13.037.372 КЛАССИФИКАЦИЯ НЕСТАЦИОНАРНЫХ ИЗОБРАЖЕНИЙ И РАЗРАБОТКА
МЕТОДИКИ ОЦЕНКИ АЛГОРИТМОВ КОДИРОВАНИЯ ИСТОЧНИКА И.А. Зубакин, Ш.С. Фахми
Предложен алгоритм оценки эффективности различных методов сжатия изображений (методов кодирования источника) на основе введенной меры нестационарности. Сформирована методика оценки эффективности, использующая компактную представительную выборку сюжетов, ранжированных по нестационарности и широкополосности. Ключевые слава: мера нестационарности, широкополосность, классификация изображений, компактная представительная выборка сюжетов, алгоритм вычисления статистик.
Введение
Разработчики стандартных алгоритмов кодирования источника стремятся создать универсальный алгоритм, обеспечивающий наилучшее субъективное качество передачи сигнала при его неизвестных и переменных статистических свойствах в пространстве и времени и при неформализованных (скрыто учитываемых) ограничениях скорости передачи и сложности кодирующих устройств. Несмотря на то, что создатели метода кодирования источника на основе вейвлет-преобразования отмечают [1], что оно дает хорошие результаты при сжатии нестационарных сигналов, почти все подобные исследования не учитывают в явном виде изменения статистик сигналов в пространстве и времени при постановке задачи, и оговорки о скорости изменения сигнала в пространстве и времени в лучшем случае всплывают где-то в середине или даже в конце изложения. При этом каждый исследователь считает свой вклад в кодирование телевизионных сигналов шагом к такому универсальному кодированию, качество которого определяется экспертной оценкой [2]. Вместе с тем представляется перспективным применение известных результатов теории передачи информации при разработке и объективной оценке эффективности кодеков цифрового телевидения не только в части кодирования канала, но и в части кодирования источника, сигнал которого априори известен приблизительно и нестационарен [3].
Методика оценки алгоритмов кодирования источников
Основные проблемы, стоящие перед разработчиками систем кодирования источника в цифровом вещательном телевидении, для которого проблема зашумленности источника не очень актуальна в силу доступности контента с большим отношением сигнал/шум – это: − проблема априорной неопределенности статистик сигнала и помех (в силу необозри-
мого разнообразия статистик эта проблема решена лишь для ряда простых наборов априорной информации, и главным достижением теории является выделение двух направлений разработки – устойчивых алгоритмов и адаптивных алгоритмов) [4]; − проблема нестационарности кодируемых сигналов (в силу необозримого разнообразия статистик эта проблема, как и проблема априорной неопределенности, решена лишь для ряда простых наборов нестационарности, и главным достижением теории является выделение класса кусочно-стационарных сигналов и алгоритмов обнаружения интервалов стационарности или сегментации сигналов и изображений) [5]; − проблема сложности кодирования состоит в формализации связи трех величин – точности передачи, скорости передачи и сложности кодера (декодера); решение этой проблемы особо актуально при создании видеосистем на кристалле ограничен-
54 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2010, № 2(66)

И.А. Зубакин, Ш.С. Фахми

ной площади, но для которой известны решения лишь для некоторых типов кодирования [3].
Ниже акцент делается на проблеме нестационарности сигналов, без учета сложности алгоритма кодирования источника и его аппаратурной реализации. Разработчики алгоритмов кодирования проверяют эффективность их работы на некоторой выборке различных сюжетов, негласно полагая, что эта выборка является представительной. Так как речь идет о кодировании нестационарных сигналов, то для сравнения эффективности кодирования различных алгоритмов предлагается использовать следующую методику: 1. ввести меру нестационарности сигналов изображений; 2. разработать алгоритм вычисления введенной меры; 3. определить границы изменения этой меры для очень большой выборки сигналов
(заведомо представительной); 4. произвести разбиение интервала изменения этой меры на несколько (по возможно-
сти равных) интервалов, количество которых должно быть достаточным для уверенности в представительности выборки; 5. отобрать изображения, принадлежащие к выделенным интервалам меры нестационарности; 6. провести кодирование сформированной выборки каждым из исследуемых алгоритмов; 7. для каждого алгоритма и для каждого элемента выборки оценить значения скорости передачи информации при заданной ошибке передачи (иногда возможна инверсия – оценить ошибку передачи при заданной скорости передачи); 8. при отсутствии статистических данных о вероятностях появления сюжетов с различной мерой нестационарности считать их равновероятными; 9. для каждого алгоритма усреднить по сформированной выборке значения скорости передачи при заданной ошибке (или усреднить ошибку передачи при заданной скорости передачи); 10. сравнить результаты усреднения и выбрать алгоритм, обеспечивающий наименьшую скорость передачи при заданной ошибке (наименьшую ошибку при заданной скорости передачи).
Для реализации предлагаемой методики ключевыми вопросами становятся первые два пункта методики: выбор меры нестационарности сигналов и разработка алгоритма вычисления этой меры.
Меры нестационарности и широкополосности
Для оценки нестационарности сигналов изображений представляется целесообразным воспользоваться методологией статистической радиотехники, в которой используются понятия стационарности в широком и узком смысле, т. е. различают процессы с постоянной/переменной дисперсией и с постоянной/переменной автокорреляционной функцией. Это подсказывает, что обобщенная мера нестационарности должна
учитывать совокупное изменение различных статистик Sn сигнала изображения. Это могут быть математические ожидания, дисперсии, интервалы (или коэффициенты) корреляции яркости и цвета и др. Каждая из статистик вычисляется для некоторых интервалов: это могут быть оцененные по отдельным адаптивным алгоритмам интервалы стационарности или априори компромиссно выбранные интервалы. Они должны быть не слишком малыми для получения приемлемых методологических ошибок вычисления статистик и не слишком большими для уменьшения вероятности изменения статистик внутри интервала. Можно считать, что именно такие же соображения лежали в основе выбора окна (8×8) элементов при разработке стандартов MPEG.

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2010, № 2(66)

55

КЛАССИФИКАЦИЯ НЕСТАЦИОНАРНЫХ ИЗОБРАЖЕНИЙ И РАЗРАБОТКА МЕТОДИКИ...

Общая мера нестационарности M должна вычисляться как сумма (в общем слу-

чае взвешенная) мер нестационарности отдельных статистик [6]:

K
M = ∑ Mn . n=1
В статье [7] рассмотрена процедура выделения участков нестационарности, осно-

ванная на дискриминантной функции. Здесь же для оценки меры нестационарности ка-

ждой статистики сигнала предлагается использовать нормированную статистику, вы-

числяемую аналогично среднеквадратической полосе частот [8] с тем лишь различием,

что в формулу должны входить не сами сигналы, а их статистики Sn , вычисляемые

раздельно по каждому аргументу. Ниже для упрощения записан один обобщенный дис-

кретный аргумент i ∈[1, N ]. Формула для непрерывных функций непрерывного аргу-

мента включает отношение интегралов от квадрата производной сигнала к интегралу от

квадрата самого сигнала. Для дискретных значений статистик можно использовать не

производную, а первую конечную разность [6]:

( )∑N −1 Sn(i+1) − Sni 2

M n = i=1

∑N Sn2i

.

i=1

Алгоритмы вычисления меры нестационарности можно разбить на два класса ал-

горитмов, соответствующих детерминированному и адаптивному выбору интервалов

усреднения статистик. Адаптивные алгоритмы (например, входящие в состав пакета

Photoshop) дают оценки меры нестационарности M с точностью, близкой к потенци-

альной (характеризуются неоднозначностью результатов в зависимости от назначаемо-

го допустимого отклонения оцениваемой статистики от среднего значения в данном

интервале стационарности) и требуют больших вычислительных затрат. Детерминиро-

ванные алгоритмы оценки многомерных сигналов на порядки проще адаптивных, хотя

и обеспечивают несколько большую погрешность оценки меры нестационарности M .

Одним из методов учета нестационарности сигнала при кодировании изображе-

ний может быть предварительное выделение зон стационарности, аналогичное приме-

няемому в Photoshop. Однако реальные изображения имеют произвольные формы зон

стационарности, и передача формы этих зон потребует существенного увеличения

сложности кодера и пропускной способности канала связи. Поэтому на практике имеет

смысл остановиться на приближенной оценке зон стационарности с точностью до пря-

моугольных областей (для двумерных сигналов) или параллелепипедных областей для

трехмерных сигналов с пропорциональными сторонами. С точки зрения экономии вы-

числительной сложности перспективными являются размеры таких областей, выра-

жаемые целыми положительными степенями числа 2.

В данной статье для вычисления меры нестационарности рассматривается сово-

купность статистических характеристик (среднее значение mi , дисперсия Di и коэф-

фициент корреляции ri ) исходного изображения, вычисляемые в пределах окна (8×8):

∑ ∑ ∑N

−1
(mi+1



mi

)2

N −1
(Di+1



Di

)2

N

−1
(ri+1



ri

)2

M = M1 + M 2 + M3 = i=1

N


mi2

∑+ i=1

N Di2

∑+ i=1 N ri2

.

i=1 i=1 i=1

Важной характеристикой эффективности кодирования изображений различными

алгоритмами является скорость передачи информации. В первом приближении она оп-

56 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2010, № 2(66)

И.А. Зубакин, Ш.С. Фахми

ределяется полосой частот, занимаемой сигналом, поэтому очевидно, что характеризовать изображение только лишь коэффициентом нестационарности – значит не учитывать скорость передачи информации. В связи с этим, наряду с коэффициентом нестационарности, будем учитывать также полосу частот, занимаемую сигналом изображения. Для оценки полосы частот нестационарного сигнала изображений будем использовать формулу, широко используемую в статистической радиотехнике в качестве меры широкополосности [8]:

W=

∑N /2 k 2 X (k) 2

k =1

N /2


X (k) 2

,

k =1

где X (k) – значение спектральной составляющей, полученное путем усреднения спек-

тральных составляющих по всем строкам изображения. В ходе эксперимента исследовалось большое количество изображений и оценива-
лись параметры M и W . Путем ранжирования всех изображений по нестационарности
и широкополосности были выбраны девять изображений, которые составляют компактную представительную выборку сюжетов. Такой подход позволяет разделять все изображения на изображения с малым, средним и большим значениями нестационарности и широкополосности (см. рис.).
В общем случае компактная представительная выборка видеосюжетов должна включать различные сочетания широкополосности и нестационарности по пространству и по времени. В данной статье для компактности изложения приведена лишь методика сравнения кодеров отдельных кадров изображения при использовании сюжетов, отличающихся шириной полосы пространственных частот и пространственной нестационарностью.
Введение меры нестационарности изображений, наряду с занимаемой изображением полосой частот, может быть использовано в задачах классификации изображений на основе их ранжирования по нестационарностьи и широкополосности.
Задача классификации изображений стоит во многих отраслях прикладной телевизионной техники – от космических систем землепользования и авиационной разведки до гидроакустики и медицины. В терминах инженерного подхода, сформированного в рамках направления «компьютерное зрение», эта задача формулируется как задача сегментации изображений на области с различной текстурой [2]. При этом классификацию текстур относят к алгоритмам, основанным на вычислении статистик и формирования оценок, противопоставляя алгоритмам более сложного класса задач распознавания, основанным на логическом и структурном анализе. В терминах статистической теории связи эти задачи относятся к многоальтернативной проверке гипотез при априорной информации о сигналах, включающей оценки некоторых статистик случайных полей – функции плотности вероятности, корреляционной функции и т. п. [5].
Введенная мера нестационарности может быть использована при формировании блоков из различных кадров видеопотока для последующего адаптивного кодирования с помощью трехмерного дискретного косинусного преобразования, широко используемого сегодня при построении различных алгоритмов сжатия изображений. Выше было отмечено, что для вычисления меры нестационарности может быть использован адаптианый подход формирования областей стационарности. Для формирования таких областей может быть использована методология, основанная на пирамидальнорекурсивном методе кодирования [3, 9].

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2010, № 2(66)

57

КЛАССИФИКАЦИЯ НЕСТАЦИОНАРНЫХ ИЗОБРАЖЕНИЙ И РАЗРАБОТКА МЕТОДИКИ...

W = 8, M = 1,00

W = 10, M = 0,80

W = 34, M = 1,10

W = 8, M = 0,66

W = 13, M = 0,69

W = 15, M = 0,50

W = 9, M = 0,38

W = 13, M = 0,42

W = 35, M = 0,19

Рис. Компактная представительная выборка сюжетов

Заключение

Разработана методика объективной оценки эффективности алгоритмов кодирования изображений, основанная на введенном понятии меры нестационарности. Введенная мера нестационарности может быть применена для оценки сигналов различного вида, например, для кусочно-стационарных процессов или с монотонно изменяющимися статистиками (например, винеровского процесса, определяемого как интеграл от белого шума, и имеющего линейно возрастающую дисперсию). Данная методика позволяет сравнивать различные алгоритмы кодирования изображений и выбирать наилучший.
Введенная мера нестационарности позволяет, наряду с мерой широкополосности, классифицировать различные изображения. Сформирована компактная представительная выборка сюжетов, содержащая девять изображений с различными значениями меры нестационарности и широкополосности, на основе которой может быть определена эффективность кодирования изображений различными алгоритмами.

Литература

1. Сэломон Д. Сжатие данных, изображений и звука. – М.: Техносфера, 2006. 2. Прэтт У. Цифровая обработка изображений. – М.: Мир, 1982, кн. 1.

58 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2010, № 2(66)

К.Г. Коротков, Д.В. Орлов, Е.Н. Величко, Ю.Ю. Гатчина

3. Твердотельная революция в телевидении / Под ред. Умбиталиева А.А. и Цыцулина А.К. – М.: Радио и связь, 2006.
4. Репин В.Г., Тартаковский Г.П. Статический синтез при априорной неопределенности и адаптация информационных систем. – М.: Сов. радио, 1977.
5. Миленький А.В. Классификация сигналов в условиях неопределенности. – М.: Сов. радио, 1975.
6. Цыцулин А.К., Фахми Ш.С., Зубакин И.А. Оценка эффективности кодирования нестационарных изображений // Телевидение: передача и обработка изображений. 7-я междунар. конф., 29–30 июня 2009, СПб. – С. 19–22.
7. Парфенов В.И., Сергеева Е.В. Применение дискриминантной процедуры при синтезе и анализе телекоммуникационной системы, основанной на манипуляции статистическими характеристиками случайного процесса // Вестник ВГУ. – Сер. Физика, математика. – 2008. – Вып. 1. – С. 70–74.
8. Вайнштейн Л.А., Зубаков В.Д. Выделение сигналов на фоне случайных помех. – М.: Сов. радио, 1960.
9. Фахми Ш.С. Пирамидально-рекурсивный метод кодирования и декодирования видеоинформации // Вопросы радиоэлектроники, сер. Техника телевидения. – 2007. – Вып. 2. – С. 43–51.

Зубакин Игорь Александрович Фахми Шакиб Субхиевич

– Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», аспирант, zubakin_@mail.ru
– Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», кандидат технических наук, доцент, shakeebf@mail.ru

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2010, № 2(66)

59