3.9. Анализ показателей  живучести распределённой вычислительной сети.

Показатели надёжности сети, которые были рассмотрены выше, характеризуют только структурные свойства коммуникационной сети и не позволяют оценить способность сети функционировать в случае действия отказов и определить ухудшение функциональных характеристик сети в этом случае. Для этого необходимо рассмотреть другие показатели, характеризующие живучесть сети.

Наиболее глубоко и всесторонне вопрос живучести вычислительных систем (ВС) исследован и изложен в монографии А.Г. Додонова и других [9]. Авторы под живучестью ВС  понимают свойство системы адаптироваться к новой ситуации и противостоять негативным влияниям, выполняя цель функционирования за счёт соответствующего изменения своей структуры и поведения. Свойство живучести допускает способность системы функционировать при наличии отказов. Авторы считают, что более живучей является ВС, которая может отвечать цели функционирования за счёт компенсации большего количества отказов. При этом, если в отказоустойчивой системе за счёт использования избыточных ресурсов после отказов восстановление выполняется в виде возвращения к предыдущей структуре и поведению, то в живучей системе задана эффективность исполнения цели функционирования обеспечивается за счёт соответствующего изменения структуры и поведения. Авторы отличают структурную и функциональную живучесть. При рассмотрении структурной живучести учитывается топология сети связи и надёжностные характеристики компонентов. Задачи, связанные с анализом структурной живучести, сводятся к задачам оценки связности топологичной структуры в зависимости от понятия "разрушение". При рассмотрении функциональной живучести рассматривается набор функций (функциональных задач), исполняемых системой и функциональная живучесть оценивается количеством задач, которые система способна выполнить при различных классах отказов.

   Используем этот подход для оценки живучести коммуникационной сети.

Под живучестью будем понимать способность сети сохранять своё функционирование при отказах элементов.

Будем оценивать живучесть показателем уменьшения общей пропускной способности (или уменьшением максимальной величины потока) при отказах элементов по сравнению с состоянием , в котором все узлы и каналы связи безотказны.

Итак, пусть  - полностью безотказное состояние, в котором все узлы  и каналы связи  исправны. Обозначим максимальную величину потока, передаваемого через сеть в данном состоянии, через , а вероятность такого состояния через .

Пусть - некоторое состояние сети, в котором отказал канал , а его вероятность  , пусть максимальная величина потока через сеть в состоянии  равняется .Эту величину можно оценить при помощи алгоритмов А4 и А5 (см. выше).При этом уменьшение общей пропускной способности в сравнении с полностью безотказным состоянием  будет равняться . Тогда живучесть распределённой вычислительной сети можно охарактеризовать одним из таких показателей:

1. Среднее уменьшение общей пропускной способности при отказах  (при сохранении средней задержки в передаче пакетов )

                     

 где Z- полное множество различный состояний распределённой вычислительной сети. Так как при количестве элементов n , то вычисление DH( представляет собой комбинаторную задачу экспоненциальной трудности. Поэтому для сокращения объёма вычислений ограничимся верхней границей. Разобьём всё множество состояний Z на два подмножества  - состояний с достаточно большой вероятностью - множество маловероятных состояний (например, одновременный отказ двух или более каналов связи).Тогда верхняя граница  определяется соотношением

                              (3.51)

2. Распределение величины общей пропускной способности при отказах  т.е.

             

Это распределение удобно задавать в виде графика в координатах . Покажем как построить функцию распределения . Проранжируем состояния  по уменьшению величин . Тогда

                                                       (3.52)

Используя вышеуказанный подход, можно сформулировать следующую задачу анализа показателей живучести сети [20,28].

При заданной структуре сети , пропускных способностях всех каналов связи  (r,s)ÎЕ и их надёжностных характеристиках kr,rs, а также заданной матрице требований i,j=1,n, найти оптимальное распределение потоков в сети при отказах КС   и определить следующие показатели живучести сети:

         P{ HфS(90 (H(0) S};  P{ HфS(80(H(0) S},..... P{ HфS(50(H(0) S},

где H(0) S - величина максимального потока в сети в полностью безотказном состоянии; ;  a HфS- фактическая величина максимального  потока, передаваемого в сети при отказах..

Обозначим для удобства H1зад=90%H(0)(; H2зад =80%H(0)S......Hkзад=50%H(0)( Покажем, как вычислить распределение вероятностей P{ Hф((Hkзад } = P{ Hkзад }.

Очевидно

                   P(Hkзад ) =  (   P(zj ) = 1 -  (  P(zj )           (3.53)

                             zj: H(zj) Î Hkзад              zj: H(zj) ÎHkзад

Тогда можно предложить следующую методику оценки предложенных показателей живучести сети.

1.Рассмотрим различные отказовые состояния сети: z1,z2,...zj,...zk(отказы одного и более КС ).Считая вероятности безотказного состояния отдельных каналов статистически независимыми, вычисляем величины вероятностей P(zj); zj ÎZ1.

2. Для каждого из состояний zj, используя предложенный алгоритм А5, находим величину максимального потока в сети H(zj ).

3. Вычисляем величину P(Hkзад ) согласно  формуле (3.53).

3.9.1.  Экспериментальные исследования.

Исходные данные.

Для иллюстрации вышеизложенной методики  рассмотрим сеть, структура которой представлена на рисунке 2.4. Сеть состоит из 14 узлов и 20 каналов связи. Каждый канал связи характеризуется своей длиной и коэффициентом готовности. Длины каналов представлены на рис. 2.4. Коэффициент готовности канала определяется из соотношения

                         

где  интенсивность восстановления канала связи, полагаем равной 0.8 ч-1 для всех каналов, а =0.003 ч-1 интенсивность отказов, также принимаем одинаковой для всех каналов.

Имеем набор типов каналов и соответствующих им удельных стоимостей, данные приведены в таблице 2.1.

 Задана матрица требований в передаче информации, элементы которой находятся по формуле

                          

где   - объёмы информационно-вычислительных работ (ИВР) соответственно для пункта i и j, их значения приведены в таблице 2.2.

 Задано среднее время задержки по сети  ч.