ИССЛЕДОВАНИЕ ПРЕДСТАВЛЕНИЙ ИЗОБРАЖЕНИЙ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ ТОМОГРАФИИ С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИОННОГО КРИТЕРИЯ

ИССЛЕДОВАНИЕ ПРЕДСТАВЛЕНИЙ ИЗОБРАЖЕНИЙ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ …
УДК 004.932.2
ИССЛЕДОВАНИЕ ПРЕДСТАВЛЕНИЙ ИЗОБРАЖЕНИЙ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ ТОМОГРАФИИ
С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИОННОГО КРИТЕРИЯ
М.А. Волынский, И.П. Гуров, А.С. Потапов
Проведено исследование представлений изображений в оптической когерентной томографии (ОКТ). На основе принципа репрезентационной минимальной длины описания (РМДО) введен объективный критерий качества математических моделей для описания ОКТ-изображений (томограмм). Предложен алгоритм сегментации томограмм для случая слоистой структуры исследуемого объекта, что может быть использовано в морфологическом анализе структуры биологических тканей, в том числе при диагностике заболеваний. Показано, что величина критерия РМДО согласуется с экспертной оценкой адекватности результатов сегментации. Предложенный критерий может быть использован как основа разработки алгоритмов автоматического анализа томограмм в ОКТ. Ключевые слова: оптическая когерентная томография, сегментация изображений, теория информации.
Введение
Одна из центральных проблем в биомедицине – это проблема анализа внутренней микроструктуры биологических тканей в целях диагностики заболеваний. Современным методом исследования подобной микроструктуры является оптическая когерентная томография (ОКТ), перспективность которой обусловлена высокой разрешающей способностью и информативностью ОКТ-изображений (томограмм), формируемых неинвазивно, что позволяет минимизировать потребность взятия проб биопсии [1].
В то же время томограммы являются трудно интерпретируемыми, поскольку способ их формирования существенно отличается от процесса регистрации оптических изображений, к восприятию которых человеческая зрительная система эволюционно адаптирована. Как следствие, затруднительной оказывается и разработка методов автоматического анализа томограмм, поскольку эти методы в большинстве своем построены на спектральных признаках, эвристически вводимых для каждого конкретного типа биологических тканей и заболеваний [2, 3]. Актуальной становится разработка общего подхода к синтезу алгоритмов интерпретации томограмм с введением объективного количественного критерия качества алгоритмов.
Основная задача анализа томограмм состоит в обнаружении слоев и неоднородных включений в биологических тканях и оценке их характеристик. Иными словами, требуется осуществлять построение описаний томограмм, характеризующих внутреннюю микроструктуру биологических тканей. Построение описаний изображений всегда производится в рамках некоторых представлений изображений с использованием математической модели. Выбор представления влияет на возможность построения адекватных описаний изображений и оказывается ключевой проблемой при интерпретации изображений заданного класса на основе строго обоснованного критерия.
Понятие представления изображений является фундаментальным в области компьютерного зрения. Однако общие теории представления изображений, включающие строгое определение данного понятия и критерии выбора оптимальных представлений для изображений новых типов, таких как томограммы, в настоящее время практически отсутствуют.
Один из возможных подходов был предложен в работе [4], определяющей представление как такую программу для универсальной машины Тьюринга, которая может восстановить любое изображение из данного множества по его описанию. Программа соответствует некоторому представлению только в том случае, когда для любого изображения существует подходящее описание. Простейшему представлению соответствует программа, которая принимает на вход изображение в качестве его собственного описания, передавая его на выход без какой-либо обработки.
28 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 4(62)

М.А. Волынский, И.П. Гуров, А.С. Потапов

Для оценки того, насколько эффективно содержание изображений некоторого класса может быть описано с помощью данного представления, вводится принцип репрезентационной минимальной длины описания (РМДО), основанный на следующих основных положениях.
1. Критерием качества представления для данного множества изображений является сумма:
− длины самого представления (числа символов в соответствующей программе); − длин наименьших описаний (в рамках представления) изображений множества.
Обычно одному изображению можно поставить в соответствие большое число разных описаний, по которым это изображение может быть восстановлено. Вторая часть принципа РМДО устанавливает критерий для выбора наилучшего описания единичного изображения в рамках данного представления (как правило, это описание разделяется на регулярную часть, или модель, и случайную часть):
2. Критерием качества модели изображения в рамках данного представления является сумма
− длины модели; − длины описания отклонений изображения от модели (в рамках представления).
Если одно представление позволяет построить более компактное описание любого изображения некоторого множества по сравнению с описаниями, строящимися в рамках другого представления, оно существенно превосходит другое представление.
В работе [5] показано, что принцип РМДО может быть использован для выбора оптимальных представлений для разных выборок обычных оптических и радиолокационных изображений.
В настоящей работе рассмотрены результаты применения принципа РМДО для исследования представлений томограмм в ОКТ. В качестве основного результата показана принципиальная применимость принципа РМДО для оценки качества представлений изображений указанного типа. В работе предложены два упрощенных представления томограмм, основывающихся на моделях сегментации. Эти представления позволяют выявлять слоистую структуру биологических тканей при автоматическом анализе томограмм, что имеет важное прикладное значение для решения задач биомедицинской диагностики.

Принцип репрезентационной минимальной длины описания

Принцип РМДО является расширением хорошо известного принципа минимальной длины описания, который строго вводится на основе алгоритмической сложности по Колмогорову [6]. Пусть U – универсальная машина Тьюринга (УМТ). Алгоритмиче-

ская сложность бинарной строки β задается выражением

KU

(β)

=

min[l(α)
α

|

U

(α)

=

β] ,

где l(α) – длина программы α. Индекс U обычно опускают, когда речь не идет о не-

скольких разных УМТ. Программа для УМТ может рассматриваться как модель источ-

ника, порождающего данные β. Для вывода принципа МДО строка α представляется в виде конкатенации двух
строк α=µδ, где µ интерпретируется как сама программа (модель или регулярная компонента), а δ – как входные данные к этой программе (случайная компонента, описывающая отклонение модели µ от данных наблюдения β). Выражение для алгоритмической сложности при этом принимает вид

[ ]K

(β)

=

min [l (µ)
µδ

+

l (δ)

|

U

(µδ)

=

β] =

min
µ

l(µ)

+

min
δ

l(δ)U

(µδ)

=

β

.

Минимальная длина описания данных β может быть выражена формулой

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

29

ИССЛЕДОВАНИЕ ПРЕДСТАВЛЕНИЙ ИЗОБРАЖЕНИЙ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ …

K (β) = min[l(µ) + K (β | µ)], µ

где величина K(β|µ) обозначает условную алгоритмическую сложность строки β при данной строке µ. Правило выбора модели на основе критерия длины описания принимает форму

µ* = arg min[K (β | µ) + l(µ)].
µ
Этот критерий, однако, не может быть применен непосредственно к проблемам анализа изображений, поскольку он не учитывает априорную информацию, содержащуюся в представлении изображений. В рамках принципа МДО полагается, что вся
имеющаяся информация сосредоточена в строке β. Однако методы анализа изображений применяются ко многим изображениям независимо, поэтому задачу анализа изображений необходимо расатривать применительно к набору изображений.
Обозначим ансамбль изображений как f1, …, fn. Независимое описание отдельных изображений является менее эффективным по сравнению с одновременным описанием всех изображений ансамбля, поскольку выполняется следующее неравенство

n
∑ K ( fi ) ≥ K ( f1 f 2... f n ) .
i=1
Повысить эффективность независимого описания можно, если извлечь из изображений взаимную информацию и использовать ее как априорную информацию при не-
зависимом описании каждого изображения:

n 

K

(

f1

f2...

fn)

≈

min
S

∑ K
i =1

(

fi

|

S

)

+

K

(S ) 

.

Здесь S является программой для УМТ, для которой каждому изображению fi

можно поставить в соответствие такое описание µiδi, что U(Sµiδi)=fi. Поскольку приме-

нение программы S к описанию изображения из ансамбля позволяет восстановить ис-

ходное изображение, программа S может быть названа представлением изображений.

Первая часть принципа РМДО устанавливает критерий выбора оптимального представ-

ления изображений по их ансамблю в форме

S*

=

arg

min

 

n
∑

K

(

fi

|

S)

+

K(S

 )

.

S i=1



Длина описания одного изображения в рамках заданного представления примет

вид

LS (β) = K (β | S) = min[l(µ) + K (β | Sµ)],

что соответствует второй части принципа РМДО.

Как следствие, принцип РМДО предоставляет возможность корректно сравнивать

длины описаний изображений, полученные в рамках различных представлений, в то

время как обычно полагается, что подобные длины не могут сравниваться, поскольку

получаются с использованием различных критериев.

Представления изображений на основе моделей сегментации

Обратимся к представлениям изображений, на основе которых может произво-
диться сегментация изображений. 1. Представление S0, в рамках которого значения интенсивности излучения для
отдельных пикселей интерпретируются как независимые отсчеты случайных величин с одинаковым распределением вероятностей. Длина описания изображения

30 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 4(62)

М.А. Волынский, И.П. Гуров, А.С. Потапов

f (x, y) : G → R , заданного в области G, в рамках этого представления может быть оценена по формуле

LS0 ( f ) = G H ( f ) + Nb log 2 Nb ,
где G – площадь изображения, H ( f ) – энтропия интенсивностей, Nb – число различ-
ных уровней интенсивности. Первое слагаемое в правой части соответствует суммарной длине закодированных значений интенсивности, а второе слагаемое – длине таблицы перекодировки.
2. Представление S1, в котором область изображения G разделяется не некоторые подобласти G1, …, Gd. Значениям интенсивностей в каждой области приписывается собственное вероятностное распределение. В дополнение к значениям интенсивности необходимо также описать границы областей δGi. Длина описания изображения в рамках этого представления может быть оценена по формуле

d
( )LS1 ( f ) = ∑ Gi H ( fi ) + Nb log 2 Nb + δGi log 2 N d , i=1
где fi – сужение изображения на область Gi, Nd – число соседей у каждого пикселя (например, Nd=8).
Представление S1 допускает произвольное разбиение изображения на области. Однако лучшее разбиение должно выбираться по критерию длины описания. Если разбиение соответствует действительным областям на изображении, значения энтропии
внутри этих областей будут минимальными. Энтропия также может уменьшаться, если выбирается разделение на большое число областей, но решения с чрезмерной сегмен-
тацией штрафуются, поскольку при вычислении длины описания учитывается сложность модели (длины таблиц перекодировки и описания границ).
3. Представление S2, в котором изображение также разделяется на области, но содержимое каждой области описывается с помощью регрессионной модели, т.е. некото-
рая регулярная функция gi(x, y, wi) с вектором параметров wi вычитается из значений интенсивности fi(x, y) перед вычислением энтропии. Оптимальное значение параметров регрессионной модели соответствует минимуму энтропии в соответствующей области Gi. Длина описания изображения в рамках представления S2 может быть оценена по формуле

d
( )LS2 ( f ) = ∑ Gi H (ri ) + Nb log2 Nb +L(wi ) + δGi log2 Nd , i =1
где значения

ri (x, y) = fi (x, y) − gi (x, y, wi )

описывают отклонения модели от значений интенсивности в области Gi, а значения

L(wi )

=

mi 2

log 2

Gi

являются длинами описания векторов параметров wi, состоящих из mi элементов. Здесь рассмотрение ограничено линейными регрессионными моделями, поскольку выбор

наиболее адекватного класса моделей является отдельной проблемой, требующей даль-

нейшего исследования, которое может быть проведено с помощью принципа РМДО.

Оптимизация длины описания единичного изображения в рамках каждого из

представлений должна производиться с помощью некоторого алгоритма сегментации.

Мы использовали один из вариантов алгоритма «роста областей». Этот алгоритм начи-

нает работу с большого числа маленьких областей (например, размером 3×3), и последовательно находит такие пары областей, объединение которых дает наибольший вы-

игрыш в длине описания в рамках представления S1 или S2. Поскольку длины описания

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

31

ИССЛЕДОВАНИЕ ПРЕДСТАВЛЕНИЙ ИЗОБРАЖЕНИЙ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ …

зависят от представления, один и тот же алгоритм будет находить разные решения при использовании разных представлений, качество которых может быть оценено на основе достигаемых длин описания.
Следует отметить, что существуют ранее разработанные алгоритмы сегментации с использованием принципа МДО [7, 8]. Новизна результатов настоящей работы состоит в следующем. Во-первых, принцип РМДО впервые позволил сравнивать эффективность различных представлений, поскольку в указанных выше работах обсуждается только проблема выбора оптимальной сегментации единичного изображения в рамках фиксированного представления. Во-вторых, представление S2 (в котором учитываются плавные переходы яркости внутри областей) ранее не применялось в алгоритмах сегментации на основе принципа МДО, а также не применялось при сегментации ОКТ изображений.
Кратко описанный выше алгоритм «роста областей» не обеспечивает нахождения абсолютного минимума длины описания, хотя и дает удовлетворительные результаты. По своим характеристикам он соответствует алгоритму градиентного спуска или «жадному» алгоритму, которые имеют свойства останавливаться в локальных минимумах. Исследование алгоритмов поиска выходит за рамки данной работы.
Экспериментальные результаты сегментации томограмм в ОКТ

Представления S1 и S2 были применены при сегментации 30 различных томограмм в форме B-сканов [9], полученных с использованием оптического когерентного микроскопа EX1301 (Michelson Diagnostics, Ltd.), в котором сканирование исследуемого образца
по глубине осуществляется четырьмя зондирующими пучками, сфокусированными на различной глубине, что позволяет после аналоговой постобработки увеличить общую
глубину резкости прибора и вдвое повысить разрешающую способность [10]. На рис. 1 приведены примеры двух томограмм, состоящих из разного числа слоев.
Результаты их сегментации представлены на рис. 2. Длины описания Li, соответствующие представлениям Si, представлены в табл. 1.

N L0(f), бит 1 268365 2 449433

L1(f), бит 220790 415708

L2(f), бит 214386 415375

Таблица 1. Длины описаний

Как видно из таблицы, длины описания в рамках представления S1 меньше, чем в рамках представления S0, в котором деление на области не производится. По результатам экспериментов такое сокращение длины описания (в среднем на 10%) наблюдается на всех изображениях выборки. В соответствии с принципом РМДО можно заключить,
что представление S1 заметно превосходит представление S0, что свидетельствует о присутствии отдельных областей на изображениях.
Представление S2 оказывается еще более эффективным в тех случаях, когда не произведена предобработка томограмм. Поскольку значения интенсивности в томограммах понижаются с глубиной в связи с поглощением излучения, в логарифмической
шкале такое затухание излучения хорошо описывается линейными регрессионными моделями, включенными в представление S2. В рамках представления S1 регулярные изменения яркости внутри областей не описываются, в результате чего результаты сегментации могут оказаться чрезмерно фрагментированными (см. рис. 2, а), а длина опи-
сания – повышенной. Таким образом, понижение значения критерия РМДО является объективным показателем повышения адекватности представления.

32 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 4(62)

М.А. Волынский, И.П. Гуров, А.С. Потапов

(а) (б) Рис. 1. Томограммы листа бумаги (а) и листа цветка (б)

(а) (б)
(в) (г) Рис. 2. Результаты сегментации томограмм (рис. 1) с помощью представлений
S1 (а, б) и S2 (в, г) Отметим, что устранение влияния затухания можно выполнить автоматически при использовании соответствующей опции в томографе, однако исследования показали, что при этом в изображение нижних слоев вносятся заметные ошибки. На рис. 3 представлен пример предобработанного изображения и результаты его сегментации. Хотя результаты в рамках представления S1 оказываются менее фрагментированными, качество сегментации в рамках представления S2 ухудшается.

Рис. 3. Пример ОКТ изображения с устранением эффекта поглощения и результаты сегментации в рамках представлений S1 и S2

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

33

ИССЛЕДОВАНИЕ ПРЕДСТАВЛЕНИЙ ИЗОБРАЖЕНИЙ В ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ …
Как показывают эксперименты, в результате сегментации томограмм в рамках представления S2 выделяются области, в целом соответствующие реальным слоям микроструктуры объекта (как, например, в случае рис. 1, б). При этом, однако, в равной степени могут выделяться и артефакты, вносимые системой формирования томограмм. В частности, слои на рис. 1, а, являются следствием не вполне корректного объединения информации четырех каналов томографа. Установление природы обнаруженных областей невозможно без привлечения экспертных знаний. В то же время наличие подобных артефактов на изображениях увеличивает значение критерия РМДО, что может использоваться для сравнения качества изображений, формируемых разными томографами. Отметим, что рассмотренные в настоящей статье представления томограмм требуют дальнейшего развития применительно к анализу тонкой структуры слоев и микровключений в отдельных слоях.
Заключение
В работе исследованы три представления изображений, в рамках которых производилось описание томограмм, формируемых в ОКТ. Одно из представлений не подразумевало сегментацию изображений. Два других представления включали разделение изображения на области, которые должны были соответствовать разным слоям микроструктуры исследуемых образцов. Эти представления отличались способом описания содержимого областей.
В целях сравнения эффективности представлений предложено использовать критерий РМДО. Установлена адекватность результатов сравнения представлений по критерию РМДО. Показано, что изображения слоев микроструктуры обладают различными свойствами, что находит отражение в значениях критерия РМДО и позволяет разделять слои с использованием алгоритмов автоматической сегментации.
Дальнейшее развитие представлений ОКТ-изображений с использованием более детальных сведений о структуре биологических тканей различных видов может проводиться с использованием принципа РМДО, обеспечивающего объективное сравнение эффективности представлений изображений. При этом наиболее эффективные представления изображений разных типов микроструктуры объектов могут оказаться различными, что позволит осуществить классификацию характеристик биологических тканей по критерию РМДО, в частности, при диагностике заболеваний.
Литература
1. Gossage K.W. et al. Texture analysis of optical coherence tomography images: feasibility for tissue classification // J. of Biomedical Optics. – 2003. – V. 8. – № 3. – P. 570–575.
2. Gossage K.W. et al. Texture analysis of speckle in optical coherence tomography images of tissue phantoms // Phys. Med. Biol. – 2006. – V. 51. – P. 1563–1575.
3. Qi X. et al. Computer-aided diagnosis of dysplasia in Barrett's esophagus using multiple endoscopic OCT images // Proc. SPIE. – 2006. – V. 6079. – P. 81–90.
4. Potapov A.S. Synthetic pattern recognition methods based on the representational minimum description length principle // Proc. OSAV’2008, 2nd Int. Topical Meeting on Optical Sensing and Artificial Vision. – 2008. – P. 354–362.
5. Potapov A.S. Comparative analysis of structural representations of images based on the principle of representational minimum description length // Journal of Optical Technology. – 2008. – V. 75. – № 11. – P. 715–720.
6. Vitanyi P.M.B., Li M. Minimum description length induction, Bayesianism, and Kolmogorov complexity // IEEE Trans. on Inform. Theory. – 2000. – V. 46. – № 2. – P. 446–464.
34 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 4(62)

А.В. Савельева, М.В. Мухина, А.О. Орлова, В.Г. Маслов, А.В. Баранов, А.В. Федоров

7. Zhu S.-C., Yuille A. Region competition: unifying snakes, region growing, and bayes/MDL for multiband image segmentation // IEEE Trans. on Pattern Analysis and Machine Intelligence. – 1996. – V. 18. – P. 884–900.
8. Lee T.C.M. A Minimum Description Length based image segmentation procedure, and its comparison with a cross-validation based segmentation procedure // J. of the American Statistical Association. – 2000. – V. 95. – P. 259–270.
9. Fercher A.F., Drexler W., Hitzenburger C.K., Lasser T. Optical coherence tomography – principles and applications // Rep. Prog. Phys. – 2003. – V. 66. – P. 239–303.
10. Holms J. Theory and applications of multi-beam OCT // Proc. SPIE. – 2008. – V. 7139. – P. 7139–08.

Волынский Максим Александро- – Санкт-Петербургский государственный университет инвич формационных технологий, механики и оптики, студент,

Гуров Игорь Петрович

maxim.volynsky@gmail.com
– Санкт-Петербургский государственный университет ин-
формационных технологий, механики и оптики, доктор технических наук, профессор, зав. кафедрой,

Потапов Алексей Сергеевич

gurov@mail.ifmo.ru – Санкт-Петербургский государственный университет ин-
формационных технологий, механики и оптики, кандидат технических наук, доцент, pas.aicv@gmail.com

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

35