Например, Бобцов

АЛГОРИТМЫ ВЗАИМНОЙ ТРАНСФОРМАЦИИ ИЗОБРАЖЕНИЙ ДЛЯ СИСТЕМ ОБРАБОТКИ И ПОИСКА ВИЗУАЛЬНОЙ ИНФОРМАЦИИ

Аннотация:

Предмет исследования. Исследованы методы и алгоритмы взаимной трансформации связанных пар изображений для расширения возможностей технологий кросс-модального мультимедийного поиска (CMMR). Подробно рассмотрена задача взаимного преобразования изображений лиц различной природы (например, фотографий и рисунков). Подобная задача широко представлена на практике. Исследования в данной области основаны на существующих базах данных. Предложенные в настоящей работе алгоритмы могут быть применены для произвольных пар связанных изображений за счет унифицированного математического описания.Метод. Предложены три алгоритма преобразования изображений. Первый алгоритм основан на анализе главных компонент и преобразовании Карунена–Лоэва (1DPCA/1DKLT). В отличие от известного аналога, предложенный алгоритм не использует обучающую выборку на этапе трансформации. Второй алгоритм предполагает генерацию популяции изображений. Третий алгоритм реализует трансформацию на основе двумерного анализа главных компонент и преобразования Карунена–Лоэва (2DPCA/2DKLT). Основные результаты. Проведенные эксперименты по трансформации изображений лиц и генерации их популяций позволили выявить особенности каждого из алгоритмов. Первый алгоритм позволяет строить точную и устойчивую модель перехода в рамках заданного набора изображений, второй алгоритм дополняет существующие базы новыми изображениями, а третий алгоритм выполняет трансформацию за пределами базы обучения. Практическая значимость. С учетом анализа особенностей каждого из предложенных алгоритмов даны рекомендации по их применению. Возможные сценарии включают построение моделей перехода для связанных пар изображений, их взаимную трансформацию в рамках базы и за ее пределами, а также генерацию популяций с целью повышения репрезентативности существующих наборов данных. Предложенные алгоритмы могут быть применены для повышения надежности распознавания лиц по изображениям различной физической природы, а также для решения широкого спектра других задач кросс-модального мультимедийного поиска.

Ключевые слова:

Статьи в номере