ПРОЦЕДУРА ОБУЧЕНИЯ ПРИ РАЗРАБОТКЕ МОДЕЛЕЙ КОНТРОЛЯ ТЕХНИЧЕСКОГО СОСТОЯНИЯ СЛОЖНЫХ СИСТЕМ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ

УДК 681.326

В. И. СЕНЬЧЕНКОВ
ПРОЦЕДУРА ОБУЧЕНИЯ ПРИ РАЗРАБОТКЕ МОДЕЛЕЙ КОНТРОЛЯ ТЕХНИЧЕСКОГО СОСТОЯНИЯ СЛОЖНЫХ СИСТЕМ

Рассматриваются известные процедуры обучения при построении математических моделей систем как объектов контроля технического состояния. Предложена новая процедура группировки обучающих образов и ранжирования групп, позволяющая ускорить сходимость процесса обучения. Проанализированы особенности и преимущества обучения с применением ортонормированного тригонометрического базиса в моделях контроля правильности функционирования сложных систем.

Ключевые слова: процедура обучения, техническое состояние, обучающая выборка, рекуррентное соотношение, группировка и ранжирование, ортонормированный базис.

Введение. При разработке математических моделей контроля технического состояния сложных систем следует учитывать, что априори заданная информация об исследуемой системе в общем случае является неполной и неоднородной. Поэтому необходимо применять методы, которые позволяют преодолевать факторы неполноты и неоднородности информации и в целом адекватно отображать свойства системы как объекта контроля (ОК) технического состояния.
В работах [1, 2] предложен новый подход к преобразованию траекторий выходных процессов ОК на основе теории пространств измеримых функций и интеграла Лебега. В ре-

зультате преобразования траектории формируется вектор Y , координаты которого пред-
ставляют собой числа, используемые в качестве контролируемых признаков. Этот вектор называется наблюдаемым состоянием системы [1].
Целью настоящей статьи является усовершенствование известных процедур обучения [3, 4] при формировании изображений видов технического состояния ОК. Под изображением понимается формальное представление вида технического состояния как составной части математической модели ОК.
Постановка задачи обучения. Пусть задан перечень всех видов технического состояния ОК

Q = {qi | i = 1, m}; определен состав контролируемых признаков

(1)

Y = {y j | j = 1, n} ;

(2)

сформирована ограниченная по объему обучающая выборка реализаций наблюдаемых состояний, принадлежность которых каждому виду технического состояния ОК известна:

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 1

4 В. И. Сеньченков

{ }Yk | k = 1, N1 ⊂ Y1; { }Yk | k = 1, N 2 ⊂ Y 2 ; { }LLLLLLLLL
Yk | k = 1, N m ⊂ Y m ,

(3)

где Y i ( i = 1, m ) — подмножество наблюдаемых состояний, принадлежащих i-му виду технического состояния ОК; Ni — мощность множества элементов, принадлежащих подмножеству
Y . Каждое из подмножеств Y i с топологической точки зрения представляет собой область в п-мерном евклидовом пространстве Y .
На основе исходных данных (1)—(3) требуется построить изображения
Ei = (ei1, ei2 , ..., ein )T ( i = 1, m ), которые наилучшим образом (например, в смысле достоверности распознавания текущего технического состояния ОК) отражают свойства соответст-
вующих видов технического состояния qi ( i = 1, m ). Теоретические основы обучающей процедуры. Как уже отмечалось, обучающая вы-
борка (3) в общем случае является неоднородной и ограниченной по объему. Следовательно, для обучения необходимо использовать методы непараметрической статистики [5], которые позволяют обрабатывать неоднородную статистическую информацию в малом объеме. Данная задача может быть решена методом стохастической аппроксимации с использованием итеративного градиентного поиска.
Для каждого подмножества Y i аппроксимируется разделяющая гиперплоскость hi в
п-мерном евклидовом пространстве Y . Поскольку неизвестное изображение Ei является
опорной точкой подмножества Y i и может считаться неизменным, параметр hi допустимо трактовать как непрерывную функцию:

hi = hi (Y ), hi ∈ C(Y ) ,

(4)

где C(Y ) — множество непрерывных функций, заданных в пространстве Y .

В дальнейшем hi называется разделяющей функцией. Предполагается, что она неизвестна, но обеспечивает максимальную точность при распознавании текущих технических

состояний. Поэтому следует выбрать класс аппроксимирующих функций h(Ei , Y ) , с по-

мощью которых ищется наилучшее приближение к разделяющей функции. Мера отклонения

аппроксимирующих функций от аппроксимируемой определяется как математическое ожи-

дание случайной выпуклой функции Hˆ от разности hi − h(Ei , Y) :

L(Ei ) = M [Hˆ (hi − h(Ei , Y))] .

(5)

Наилучшая аппроксимация соответствует получению такого вектора Ei = E*i , при кото-

ром достигается точная нижняя граница функционала (5):

L(E*i )

=

inf {M
Ei∈Rn

[

Hˆ

(hi

−

h(Ei , Y))]},

где Rn — п-мерное вещественное пространство.

Следует иметь в виду, что плотность распределения случайной функции Hˆ (⋅) неизвест-

на, поэтому неизвестно и ее математическое ожидание. По этой причине функционал (5) не может быть задан в явном виде. Единственная возможность определения искомого вектора

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 1

Процедура обучения при разработке моделей контроля технического состояния сложных систем 5

E*i состоит в том, чтобы воспользоваться отдельными реализациями, полученными в процессе использования векторов Y из обучающей выборки.

Процедура обучения значительно упрощается, если применять разложение аппроксими-

рующей функции по ортогональному или ортонормированному базису G(Y) = {g j (Y) | j = 1, n} ,

согласно выражению

n
∑h(Ei , Y) = ETi G(Y) = eij g j (Y) . j=1

(6)

С учетом соотношения (6) выражение для функционала (5) принимает вид

L(Ei ) = M [Hˆ (hi − ETi G(Y))] .

(7)

Далее базис G(Y) называется G -преобразованием вектора Y .

Так как выражение функционала (7) неизвестно, для поиска его точной нижней границы используются измеренные градиенты реализаций. Условие экстремума (7) может быть запи-

сано в виде уравнения

grad L(Ei ) = M [grad Hˆ (hi − ETi G(Y))] = 0 ,

(8)

где

grad

L(Ei

)

=

⎛ ⎜ ⎝

∂L(Ei ∂ei1

)

,

∂L(Ei ∂ei2

)

,

...,

∂L(Ei ∂ein

)

⎞ ⎟ ⎠

;

grad

Hˆ

(⋅)

=

⎛ ⎜ ⎝

∂H (Ei ∂ei1

)

,

∂H (Ei ∂ei2

)

,

...,

∂H (Ei ∂ein

)

⎞ ⎟ ⎠

;

∂(⋅) ∂eij

— частная производная по координате

eij .

Если функционал L(Ei ) выпуклый и имеет единственный экстремум, то соотношение (8) представляет собой необходимое и достаточное условие существования данного экстре-

мума. В этом случае корень уравнения (8) дает оптимальное значение вектора Ei = E*i . В ра-
боте [4] показано, что если использовать квадратичную меру отклонения аппроксимирующей функции от аппроксимируемой

Hˆ (Ei , Y) = (hi − ETi G(Y))2 ,

а в качестве вектор-функции G(Y) выбрать полную систему ортонормированных функций
g j (Y) ( j = 1, n ), то минимизация функционала (8) обеспечивается посредством использования в процессе обучения алгоритма Роббинса—Монро. Данный алгоритм применительно к рассматриваемой задаче может быть представлен в виде рекуррентного соотношения

Ei (k) = Ei (k −1) − ak [Ei (k −1) − G(Y(k))],

(9)

где ak ( k = 1, 2,... ) — элемент последовательности положительных чисел, удовлетворяющий следующим условиям:

∑ ∑lim
k →∞

ak

= 0,

∞
ak
k =1

= ∞,

∞ ak2 < ∞ .
k =1

Примером такой последовательности является гармонический ряд

{1 k} = {1, 1 2, 1 3, ...} .

(10)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 1

6 В. И. Сеньченков

С учетом (10) рекуррентное соотношение принимает вид

Ei

(k

)

=

Ei

(k

−

1)

−

1 k

[Ei

(k

−

1)

−

G

(Y(k

))]

,

(11)

а для каждой координаты eij вектора Ei соотношение представляется как

eij

(k)

=

eij

(k

−

1)

−

1 k

[eij

(k

−

1)

−

gi

(Y(k ))]

.

(12)

Процедура группировки образов и ранжирования групп. В известных нам работах

не поднимается вопрос о том, каков должен быть порядок использования обучающих образов

из выборки (3). Однако опыт разработки математического обеспечения контроля техническо-

го состояния показывает, что указанный фактор в значительной степени определяет скорость

сходимости процесса обучения к оптимальному вектору E*i . В связи с этим предлагается процедура группировки обучающих образов и ранжирования полученных групп с целью оп-

ределения очередности их использования в процессе обучения.

Таким образом, Y i — подмножество обучающих образов, принадлежность которых i-му

виду технического состояния ОК известна [см. (3)]. В данном подмножестве выделяется

группа Y1i , которая включает наибольшее количество неразличимых между собой элементов.

Один из этих элементов Y1 , принадлежащих Y i после G -преобразования принимается в

качестве вектора начального приближения: G(Y1i (0)) = Ei (0) . Элементы считаются неразли-
чимыми, если их одноименные координаты отличаются друг от друга на значения, сопоставимые с погрешностью регистрации соответствующих траекторий в контрольных точках ОК.

Во вторую группу Y2i входит не больше неразличимых элементов, чем в первую, и не меньше,

чем в остальные. В третьей группе Y3i количество неразличимых между собой элементов не
больше, чем во второй, и не меньше, чем в остальных. Аналогичным образом формируются все остальные группы.

Если через J обозначить индексное множество обучающих образов (| J | = N i , где

| J | — мощность множества J ), относящихся к i-му виду технического состояния, то резуль-

таты их группировки и ранжирования полученных групп можно представить следующим образом:

Y1i Y2i Y3i

= = =

(Yki (Yki (Yki

)k∈J1 , )k∈J2 , )k∈J3 ,

J1 J2 J3

⊆ ⊆ ⊆

J, J J

J1 J1

, ∪

J2

,

| J1 | = N1i , N1i ≤ N i ; | J2 | = N2i , N2i ≤ N1i ; | J3 | = N3i , N3i ≤ N2i ;

LLLLLLLLLLLLLLLLL

p−1

UYpi = (Yki )k∈J p , J p ⊆ J

Jl ,

|

Jp

|

=

N

i p

,

N

i p

≤

N ip−1.

l =1

(13)

Порядок использования групп в процессе обучения совпадает с их номером (рангом), а

последовательность применения обучающих образов в рамках одной и той же группы произ-

вольна. Указанные действия выполняются для каждого подмножества Y i ( i = 1, m ) из обу-

чающей выборки (3).

Обучение с группировкой и ранжированием обеспечивает максимальное влияние на формирование изображений тех образов, которые наиболее характерны для соответствующих

видов технического состояния ОК. Данное утверждение объясняется тем, что коэффициент 1/ k в соотношениях (11) и (12) на предыдущем шаге обучения больше, чем на последующем.

Поэтому каждый предыдущий образ более значим, чем последующий.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 1

Процедура обучения при разработке моделей контроля технического состояния сложных систем 7

По мере увеличения числа шагов изображение Ei стремится к своему оптимальному значению E*i с вероятностью, равной единице [4]:

P ⎣⎡⎢kl→im∞(Ei (k) − E*i ) = 0⎤⎥⎦ = 1.

Каждый из векторов E*i может трактоваться и как точка в п-мерном евклидовом пространстве Y , и как набор весовых коэффициентов уравнения гиперплоскости, отделяющей

данное подмножество Y i от других подмножеств в пространстве Y . Очевидно, что каждая

координата eij ( i = 1, m , j = 1, n ) отражает степень сходства наблюдаемых состояний по j-му

контролируемому признаку.
Обучение в моделях контроля функционирования. Контроль технического состояния системы включает контроль функционирования и поиск отказов. Рассмотрим особенности построения процедуры обучения в моделях контроля правильности функционирования.
Степень априорной неопределенности информации о режимах нормальной работы ОК в общем случае позволяет найти допустимые интервалы изменения контролируемых признаков

⎣⎡ yнj ;

yвj ⎤⎦

(

j = 1, n ), где

y

н j

,

yвj

— предельно допустимое нижнее и верхнее значение j-го кон-

тролируемого признака соответственно. Сведения о допустимых интервалах позволяют зна-

чительно снизить размерность моделей.

Основная задача состоит в том, чтобы сформировать полную ортонормированную сис-

тему функций g j (Y) ( j = 1, n ). В известных работах предлагаются различные варианты та-

ких систем, но не принимаются во внимание тригонометрические базисы. Однако, как показывает анализ, именно такие базисы обладают рядом преимуществ. Ниже рассматривается ортонормированный тригонометрический базис

0, 5;

(

y

в j

1 − yнj )0,5

⎛ sin ⎜
⎝⎜

2πk yвj − yнj

⎞

y

j

⎟ ⎟⎠

;

( yвj

1 − yнj )0,5

⎛ cos ⎜
⎝⎜

2πk

y

в j

−

y

н j

yj

⎞ ⎟, ⎟⎠

k

= 1, 2, ... ,

начальные элементы которого являются основой построения системы функций

(15) g j (Y)

( j = 1, n ). Такой базис существует в пространстве C2 (Y) непрерывных функций, квадратично интегрируемых по Риману [6].
Каждая из функций gr (Y ) ( r = 1, n ) определяется следующим образом:

gr

(Y

)

=

⎧ ⎪⎪δrj ⎪⎪r, j ⎨ ⎪⎪δrj ⎩⎪⎪r, j

1 ( yвj − yнj )0,5 = 1(2)n −1,
1 ( yвj − yнj )0,5 = 2(2)n, n

⎛ sin ⎜
⎜⎝

2πk

y

в j

−

y

н j

⎞

y

j

⎟, ⎟⎠

если

k

=

0, 5(

j

+ 1),

n ⎯ четнo; r, j = 1(2)n, n ⎯ нeчетнo;

⎛ cos ⎜
⎝⎜

2πk

y

в j

−

yнj

⎞

y

j

⎟ ⎟⎠

,

если

k = 0,5 j,

⎯ четнo; r, j = 2(2)n −1, n ⎯ нeчетнo,

{где

δrj

=

1, если r = j; 0, если r ≠ j

— символ Кронекера.

(16)

Использование приведенных соотношений и обеспечивает ортонормированность

системы { g j (Y) , j = 1, n }. Ее ортогональность следует из того, что каждая функция g j (Y)

формируется на основе только одного элемента базиса (15). Влияние других элементов исключается введением в соотношения (16) символа Кронекера. Нормированность данной

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 1

8 В. И. Сеньченков
системы непосредственно вытекает из того, что нормированным является базис (15). Совме-
стно с (n + 1) -м элементом 0,5 система { g j (Y) , j = 1, n } образует в (n + 1) -мерном подпро-
странстве, содержащемся в пространстве C2 (Y) , полную ортонормированную систему. Так как первый элемент 0,5 базиса (15) не зависит от состояния ОК, его можно не учитывать и считать, что функция G -преобразования имеет размерность n :
G (Y ) = (g1(Y), g2 (Y), ..., gn (Y)) .
В этом случае система функций g j (Y) ( j = 1, n ) рассматривается как ортонормирован-
ный базис в n -мерном подпространстве, содержащемся в пространстве C2 (Y) . В результате обучения на основе соотношений (11), (12) получаются значения коорди-
нат eij ( i = 1, m , j = 1, n ) вектора E*i , по модулю близкие к единице. Тригонометрические
функции в базисе (15) ограничивают результат преобразования любых вещественных чисел интервалом [–1, 1]. Наличие при этих функциях сомножителей ( yвj − yнj )−0,5 , модуль которых
может быть больше единицы, допускает некоторую размытость значений eij относительно
указанного выше интервала. Но эта размытость незначительна, что является преимуществом тригонометрического базиса по сравнению с другими, например, ортонормированным базисом Лежандра, который также содержится в пространстве C2 (Y) . Ограниченность координат eij значительно упрощает алгоритмическую реализацию процесса обучения, а также вычис-
лительные операции при контроле технического состояния. Заключение. Развитие методов математического описания систем как объектов кон-
троля технического состояния представляет собой важнейшую задачу, решение которой необходимо для повышения достоверности определения функциональной пригодности данных объектов.

СПИСОК ЛИТЕРАТУРЫ

1. Сеньченков В. И. Формирование множества контролируемых признаков системы на основе метрической теории и функционального анализа // Изв. вузов. Приборостроение. 2005. Т. 48, № 7. С. 3—9.

2. Сеньченков В. И. Математическое обеспечение контроля технического состояния мехатронных комплексов // Авиакосмическое приборостроение. 2005. № 10. С. 27—32.

3. Васильев В. И. Распознающие системы: Справочник. Киев: Наукова думка, 1983.

4. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М.: Наука, 1968.

5. Тарасенко Ф. П. Непараметрическая статистика. Томск: Изд-во ТГУ, 1976.

6. Треногин В. А. Функциональный анализ. М.: Наука, 1980.

Валентин Иванович Сеньченков

Сведения об авторе — д-р техн. наук, профессор; Военно-космическая академия им. А. Ф. Мо-
жайского, кафедра специальных технических систем космических комплексов, Санкт-Петербург; E-mail: svi9@rambler.ru

Рекомендована кафедрой специальных технических систем космических комплексов

Поступила в редакцию 24.04.09 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 1