О журнале
Рекомендации
Подход к повышению качества информации в вычислительных системах реального времени с учетом живучести
Мельников Ю.Н., Райлян М.П.
_______________________________
Мельников Ю.Н., Райлян М.П.
Рассмотрено повышение качества информации в вычислительных системах с использованием механизма обеспечения живучести. Предложено для исследования функционирования вычислительной системы использовать сетевую модель. Предложен векторный показатель живучести, позволяющий получить оценки при кратном функциональном резервировании в вычислительных системах с функционально связанными задачами.
В процессе проектирования многофункциональных вычислительных систем реального времени большое внимание уделяется вопросам повышения качества информации. Для обеспечения качества информации необходима безотказная работа технических средств (вычислительной системы) при различных дестабилизирующих воздействиях. При этом встает вопрос о живучести как свойстве вычислительной системы выполнять возложенные на нее функции в условиях вредных внешних воздействий (не определенных условиями эксплуатации) [2]. Совокупность структурных и процедурных решений, направленных на поддержание свойства живучести, назовем механизмом обеспечения живучести вычислительных систем.
Традиционно к механизму обеспечения живучести предъявляются следующие требования:
- обеспечивать обнаружение отказов в системе,
- производить локализацию отказа,
- выполнять реконфигурацию в условиях отказов,
- включать возможные восстановительные процессы.
Для обнаружения отказа производится контроль состояний вычислительной системы. Как правило, все системы имеют довольно развитые возможности отображения состояний как технических, так и программно-информационных компонент.
При локализации отказов производится выделение отказавших элементов, а также ограничивается распространение результатов некорректного функционирования, что обеспечивает последующие функции механизма обеспечения живучести необходимой информацией для их нормального функционирования.
При реконфигурации производится вычленение результатов функционирования, неадекватных исходным данным, и/или перестройка аппаратной структуры вычислительной системы для исключения из числа активных аппаратных компонент, являющихся источником функциональных отказов. При этом производится перераспределение функций системы, обеспечивающее поддержание общей работоспособности возможно с меньшим числом функций.
При восстановлении производится замена и/или ремонт локализованных отказавших аппаратных компонент системы. В реально существующих вычислительных системах такие функции возлагаются на обслуживающий персонал.
Иногда функциональную схему механизма обеспечения живучести дополняют профилактической функцией, на которую возлагают действия, предотвращающие появление отказов из-за внешних вредных воздействий. В реально существующих вычислительных системах такого рода функции трудно реализуемы, так как подразумевают наличие априорной информации о проявлении внешних вредных воздействий.
Непредсказуемость проявления внешних вредных воздействий приводит к необходимости использования в процессе проектирования методов, позволяющих проводить проектирование в условиях неопределенности.
В многофункциональных взаимосвязанных вычислительных системах реального времени одним из эффективных методов построения механизма обеспечения живучести является многопроцессорное резервирование. Суть функционального резервирования состоит в размещении задач системы и их копий на нескольких функционально исполнительных элементах системы. Для заданного множества функционально связанных задач системы построение механизма обеспечения живучести заключается в размещении этих задач с некоторой кратностью резервирования на множестве функционально исполняющих элементов системы, при этом должно достигаться сравнительно устойчивое выполнение задач в условиях внешних вредных воздействий, проявляющихся в отказах аппаратных компонент системы.
Общее число состояний вычислительной системы, определяемое через различное число комбинаций отказов, представляет собой булиан 2*, где N — число функционально исполняющих элементов системы, которые могут быть подвергнуты отказам. Для реальных вычислительных систем, содержащих десятки и сотни функционально исполняющих элементов,получение полной информации о всех состояниях системы практически очень сложно, поэтому для ее решения предлагается использовать подход имитационного моделирования, позволяющий получить некоторый частный набор решений и на их основе делать предположения о полном поведении системы.
В качестве математического аппарата для построения формальной модели функционирования вычислительной системы реального времени в условиях внешних вредных воздействий предлагается использовать аппарат временных сетей Петри. Обобщенной временной сетью Петри N называется пятерка <Р, Т, F, W, φ> при заданной начальной разметке М, где Р — множество мест сети; Т— множество переходов сети; F — функция инциденций; W — функция кратности дуг; φ — функция времени срабатывания переходов; М — начальная маркировка сети.
При построении сетевой модели установим взаимно однозначное соответствие между характеристиками вычислительной системы и элементами обобщенной временной сети Петри: множеству решаемых задач системы сопоставим множество переходов сети, множество функциональных условий выполнения задач будем отображать множеством мест сети, функциональную связанность задач системы — функцией инциденций, особенности функциональных условий решения задач, связанные с некоторыми количественными характеристиками функциональных условий, — функцией кратности дуг сети, время решения задачи в вычислительной системе — функцией срабатывания перехода, динамизм изменения функциональных условий выполнения задач системы — текущей маркировкой сети.
Предлагаемый формализм позволяет построить модель, которую будем называть базовой сетевой моделью. Она позволяет получать временные характеристики решения совокупности взаимосвязанных задач. Для отображения в модели аппаратной компоненты системы используем модифицированные сетевые модели, которые строятся на основе базовой, но расширены введением подмножества мест сети, отображающего функционально исполняющие элементы системы. Модифицированные сетевые модели позволяют получать оценки функционирования вычислительной системы с учетом выполнения задач системы на функционально исполняющих элементах системы.
В общем виде можно считать, что оценка живучести может быть проведена с использованием функционала [1]
В разработанной модели и с учетом общего подхода к построению показателя живучести для оценки этого свойства можно использовать векторный показатель живучести в следующем виде:
где М - маркировка мест сети, отображающих пользовательско-заначимые результаты функционирования системы;
ώ - важность каждого из пользовательско-значимых результатов;
N - общее число задач системы;
Аm - мощность множества решенных задач,
Bm - мощность множества задач, задержанных на выполнение отсутствием аппаратных функциональных условий;
Предлагаемый векторный показатель позволяет оценивать проектные решения по разработке механизма обеспечения живучести вычислительных систем реального времени, основанного на функциональном резервировании. Имитационное моделирование на основе базовой и модифицированной сетевых моделей позволяет построить векторный показатель живучести.
ЛИТЕРАТУРА
1. Мельников Ю. Н, М я с н и к о в В. А. Критерии и модели оценки живучести систем телеобработки. — М.: Моск. энерг. ин-т, 1988.
2. Флейшман Б. С. Основы системологии. — М.: Радио и связь, 1982.
___________________________________________________
Ю. Н. Мельников - д-р техн. наук;
М. П. Райлян