О журнале
Рекомендации
Об инфомационной модели информационно-правовой системы
Хургин В.М., Щербина И.Е.
В.М. Хургин, И.Е. Щербина
Реализация Российской автоматизированной системы информационно-правового обеспечения правотворческой и правореализационной деятельности, правового образования и воспитания (РАСИПО) в виде объединения сетевых систем требует разработки информационной модели, предназначенной для отображения взаимодействия между субъектами (сущностями) системы, процессами обработки данных (запросов, инструкций и выборок данных), информационными ресурсами, а также для указания направления основных информационных потоков, возникающих в результате такого взаимодействия. В такой модели должны быть отражены особенности представления информации, информационные связи подсистем, способы доступа, хранения, распределения информации. Основой информационной модели может служить "информационная архитектура" системы [1], которая отражает весь комплекс задач по организации доступа к данным и их обработки. Должна быть выстроена информационная инфраструктура РАСИПО, включающая информационные системы в органах государственной власти (исполнительной, законодательной, судебной) на федеральном и региональном уровнях, центральный и региональные узлы правовой информации.
В настоящий момент мы находимся в ситуации, когда построение информационной инфраструктуры уже является неотложным, однако еще не сформулирована ее единая концепция. В то же время законы становления и развития информационных систем такого масштаба подсказывают, что неточности проектирования их архитектуры или, что еще опаснее, некорректно построенный проект впоследствии проявляются не только как неэффективные вложения средств, но даже как факторы угрозы для эффективности функционирования всей системы.
Создание информационной инфраструктуры РАСИПО должно осуществляться с учетом следующих факторов:
- существующее положение дел;
- особенности территорий оперирования;
- стратегия развития;
- необходимые темпы формирования информационной инфраструктуры.
Информационные ресурсы Российской Федерации в правовой сфере являются принципиально открытыми. Исключение составляют информационные ресурсы, отнесенные в соответствии с законодательством к категории ограниченного доступа. Порядок доступа к открытым информационным ресурсам определяется держателем банка данных.
Государственные органы, ответственные за формирование и использование правовой информации, обеспечивают условия для оперативного и полного ее предоставления пользователям.
В процессе реализации системы необходимо осуществить интеграцию информационных фондов, банков и баз правовых актов в общем информационно-правовом поле.
Информационно-правовые ресурсы Российской Федерации должны формироваться из банков действующих правовых актов, принимаемых: Федеральным Собранием Российской Федерации, Президентом Российской Федерации, Правительством Российской Федерации, Конституционным Судом Российской Федерации, Верховным Судом Российской Федерации, Высшим арбитражным судом Российской Федерации, государственными комитетами, министерствами и ведомствами Российской Федерации, органами государственной власти субъектов Российской Федерации, органами местного самоуправления.
По степени репрезентативности банков нормативных актов в РАСИПО можно выделить 5 уровней [2]:
1-й уровень - эталонные банки правовых актов высших органов государственной власти.
2-й уровень образуют эталонные банки правовых актов центральных органов федеральной исполнительной власти Российской Федерации.
3-й уровень представляют эталонные банки правовых актов государственных органов субъектов Федерации.
4-й уровень поддерживает локальные банки правовой информации органов местного самоуправления.
5-й уровень соответствует локальным, тематическим и иным банкам и базам данных отдельных организаций, предприятий и учреждений, представляющих широкий круг пользователей.
Вся совокупность эталонных, локальных и тематических банков правовых актов всех уровней, а также совокупность международных правовых актов, затрагивающих интересы России, образует российский интегрированный территориально распределенный банк правовой информации, адекватно отображающий состояния объектов и их отношений в рассматриваемой предметной области [3].
Органы государственной власти Российской Федерации формируют и актуализируют эталонные банки только тех правовых актов, которые принимают сами, и передают копии этих банков и изменений к ним в центральный и региональные узлы системы правовой информации [4]. Допускается делегирование прав и обязанностей по ведению эталонных банков правовой информации имеющим на это лицензию юридическим лицам. При этом для нормального функционирования системы предлагается, с одной стороны, перераспределение компетенций и средств, с другой - максимально широкое использование соглашений во взаимоотношениях между узлами правовой информации различных уровней. При реализации компьютерных технологий должны быть решены следующие задачи:
- обеспечение совместимости информационных баз;
- обеспечение эффективного интерактивного доступа к правовым актам, хранящимся в информационных базах;
- обеспечение режимов создания, наполнения, ведения, поддержания в контрольном состоянии, администрирования баз данных.
Технологическая схема функционирования узла правовой информации представлена на рис. 1.
По отношению к собственному эталонному банку в каждой системе должны выполняться процедуры:
- подготовки правовых актов на машинных носителях;
- наполнения базы действующими нормативными актами;
- ведения базы данных.
В каждом эталонном банке правовых актов предполагается наличие информационного обеспечения следующего состава:
- архив нормативных актов на бумажных носителях;
- информационная база для подготовки проектов правовых актов;
- массивы действующих правовых актов;
- массив изменений, содержащий информацию для корректировки действующих нормативных актов и списки актов к отмене в собственной базе данных;
- система рубрикаторов и классификаторов;
- словарь синонимов;
- словарь шумовых слов, или стоп-словарь.
Информационное взаимодействие каждого узла с внешними абонентами осуществляется как на основе получения информации от внешних источников, так и на основе направления собственной информации в другие узлы РАСИПО.
Информационная модель узла правовой информации приведена на рис. 2. В самом общем виде каждый узел правовой информации может быть поделен на две основные подсистемы - информационно-коммуникационный центр (ИКЦ) и хранилище информации. В свою очередь, в состав ИКЦ включаются два массива правовой информации - входной и выходной.
Во входной массив поступает информация, порождаемая в конкретном узле, а также поступающая от других узлов системы на основании регламентов или по отдельным запросам. Распространение информации осуществляется средствами тиражирования и дублирования баз данных (или порций пополнения) и, возможно, другими механизмами. Выходной массив содержит информацию, подготовленную в данном узле и предназначенную для внешних потребителей.
Только два массива информации каждого узла - входной и выходной - “видны” внешним пользователям. Внутренние массивы любого узла правовой информации должны быть недоступны пользователям.
В соответствии с мощностью вычислительных средств, предназначенных для доступа к информационно-правовым ресурсам центрального узла, система многопользовательского доступа должна представлять собой совокупность информационно-правовых систем, обеспечивающих примерно одинаковые основные сервисные возможности для различных категорий пользователей. Ее структурная схема представлена на рис. 3.
Графическая модель информационного взаимодействия представлена на рис. 4. Полученная информационная модель дает возможность проследить информационные связи между элементами системы и направление основных информационных потоков, обеспечить интеграцию банков данных всех уровней и эффективную организацию доступа к ним [5].
Важно отметить, что уже сегодня существует целый ряд источников правовой информации, вполне готовых к работе в рамках РАСИПО. Однако из-за отсутствия структурного ядра системы имеющаяся информация обрабатывается и предоставляется пользователям с временными задержками и зачастую не в полном объеме. Решить поставленную задачу без формирования целостной информационной системы, а создавая только локальные информационно-правовые системы в органах государственной власти, не представляется возможным. В то же время реализуемый механизм формирования информационной инфраструктуры позволяет организовать асинхронный процесс ее создания, чтобы “менее готовые” узлы не заставляли ждать “более готовых”.
Информационная система - это совокупность соединенных коммуникационными линиями баз и банков данных, в которых накапливается информация, приходящая как из самой информационной системы, так и из внешних источников. Каждый банк данных (в соответствии с Концепцией правовой информатизации России [2] будем называть его узлом системы) может получать и передавать информацию любому другому узлу, причем невозможно предсказать, какому конкретно - эта связь носит случайный характер. Изучением стохастических процессов, описывающих подобные связи, занимается термодинамика, в рамках которой поведение большого ансамбля случайно взаимодействующих частиц описывается специальной функцией - энтропией. В соответствии с [6] "в настоящее время принято отождествление термодинамического и информационного понятия энтропии и даже более того, если рассматривать лишь первую вариационную задачу теории информации и задачу, решение которой приводит к распределению Больцмана в статистической механике, то обе теории считаются "изоморфными" друг другу".
В [7] предложена математическая модель транспортной сети региона с обоснованием применимости энтропии к данной задаче. На основе этой модели в [8] рассмотрен закон накопления информации в узлах.
Пусть в узле i имеется ni правовых актов. Приращение информации ni в узле i за время t имеет вид:
ni = knit,
где k - коэффициент, показывающий, какая часть имеющейся информации ni изменяется или дополняется за единицу времени.
В каждом узле накопление информации носит дискретный характер с произвольными разрывами во времени, однако для большой системы с независимым случайным накоплением информации в каждом узле можно принять, что n(t) - непрерывная функция, или провести аппроксимацию ni(t) непрерывной функцией. При этом условии
,
т. е. задача миграции населения в транспортных сетях региона аналогична задаче передачи информации в сетях передачи данных.
Если при рассмотрении системы, состоящей их n узлов, считать, что процесс накопления информации через внешние каналы является экспоненциальным с показателем , одинаковым для всех узлов, и что локально-стационарное состояние сети x*(y(t)) устанавливается за время, малое по сравнению с характерным временем изменения состояния системы y(t), то поведение y(t) может быть описано системой дифференциальных уравнений
, (1)
где xij(t) - количество информации, переходящее за единицу времени из i-го узла в j-й узел, i=1,n.
Первое слагаемое в правой части есть прирост информации за счет внешних источников, второе - суммарный поток информации из сети в i-й узел, третье - поток из i-го узла в сеть.
Локально-стационарное состояние сети x*(y(t)) определяется с использованием энтропийной модели стохастических коммуникационных систем [9].
В каждый момент времени в распределительном процессе участвует k-я доля информации базы данных каждого узла. Параметр vij характеризует “привлекательность” j-го узла для i-го. При этом vii>0, т.к. в каждом узле допускаются обращения к собственному банку данных. Тогда, в соответствии с [8], x*(y(t)) дается решением n оптимизационных задач вида
Уравнения (1)-(2) составляют замкнутую математическую модель информационной макросистемы с пополнением базы данных и сбалансированным распределением, причем процесс обращения из одного узла к другому носит для всей системы стохастический характер.
Решение оптимизационной задачи (2) можно получить методом множителей Лагранжа:
Подставляя (3) в правую часть (1), получим
В силу сбалансированности распределения в системе суммарное количество информации возрастает экспоненциально с показателем
:Как показано в [8], для этой системы существует решение , при котором все экспоненциально нарастают с показателем . Такое состояние является равновесием системы (1).
На основании доказанных в [8] теорем можно утверждать, что равновесие в системе сохраняется даже при отказе всей информационной системы, кроме двух узлов и одной линии связи между ними. Это вызвано не особенностями выбранной математической модели, а определяется самой концепцией построения информационной системы:
- равноправие (одинаковый статус) всех узлов;
- свобода доступа из любого узла к любому другому узлу;
- единый (экспоненциальный) закон накопления информации во всех узлах.
Потеря локального равновесия означает изменение режима работы по крайней мере одного узла. Однако, если время релаксации возмущения в узле существенно меньше характерного времени изменения работы всей информационной системы, то устойчивость системы как целого при этом сохраняется, т. е. элементы макросистемы могут иметь вероятностный тип поведения, а система в целом ведет себя детерминированно [10]. В [11] доказана теорема, определяющая условия, при которых особая точка (положение равновесия) либо асимптотически устойчива, либо неустойчива, либо устойчивость не определяется по линейной части.
Рассмотрим ситуацию, при которой в системе появляются один или несколько узлов, приобретших особый статус (получающих дефицитную информацию, предоставляющих более быстрый доступ к банку данных и т.п.). В этом случае привлекательность таких узлов может возрастать быстрее, чем скорость накопления информации. Если время релаксации подобного процесса окажется однопорядково с характерным временем изменения работы информационной системы, то система потеряет устойчивость.
Структурно общегосударственная система правовой информации включает в свой состав ряд базовых элементов, представляющих собой информационные центры различного уровня и функционального назначения, к которым относятся:
- федеральный узел правовой информации;
- региональные узлы правовой информации;
- абонентские пункты.
Региональные узлы правовой информации, входящие в состав общегосударственной системы, создаются в интересах федеральных органов государственной власти, органов государственной власти субъектов Российской Федерации, органов местного самоуправления, юридических и физических лиц. Именно на региональные узлы возлагается основной объем работ по обеспечению правовой информацией широкого круга потребителей. Функции регионального узла приведены в [12-13].
Необходимо решить задачу рационализации логической структуры узлов РАСИПО на основе распределенной базы данных, функционирующей в информационно-коммуникативной сети. Существует множество различных реализаций компонентов системы и имеется ряд факторов, влияющих на выбор решения и зависимых от множества параметров реализации РАСИПО. В [14] показано, что поставленная задача может рассматриваться как задача многокритериальной оптимизации различных реализаций системы.
В этом случае критерий оптимизации является вектором
Q(X)=(q1(X), …, qm(X)),
и задача состоит в минимизации всех m частных критериев:
где — множество допустимых значений X.
Известно, что этому условию, при введении соответствующих понятий предпочтительности, удовлетворяет ряд значений образующих множество Парето, которое содержит решение многокритериальной задачи.
С учетом специфики решаемых задач можно выделить следующие основные факторы, влияющие на принятие решений при оптимизации структуры РАСИПО: среднее время обработки запроса (Tq); удельные затраты на пересылку запроса и получение ответа (Ct); пороговое количество попыток (n) установления соединения с заданной вероятностью
где Tc — среднее время установления соединения с узлом РАСИПО;
To — среднее время обработки запроса в узле, включая время на пересылку информации по каналам связи;
T`c — среднее время, затрачиваемое на установление соединения с одной попытки;
Pq и Pb — вероятность обслуживания и блокировки запроса, соответственно.
Исследование особенностей функционирования системы показало, что в качестве математической модели для оценки характеристик можно использовать многофазную систему массового обслуживания с одним прибором на первой фазе (сервер) и несколькими приборами — на второй (каналы) и с блокировкой. При этом входящие потоки полагались пуассоновскими, а время обслуживания — распределенным по экспоненциальному закону.
Однако создание стройной системы региональных узлов требует серьезных финансовых вливаний, на что в сегодняшних условиях надеяться не приходится. В это же время маловероятной представляется эффективная работа системы с федеральным центром в единственном числе. Тогда суть поставленной задачи с учетом реалий сегодняшнего дня будет заключаться в том, чтобы распараллелить потоки информации, сходящиеся на федеральном центре, путем создания в региональных узлах подмножеств эталонной БД и обслуживания внутрирегиональных информационных потребностей.
Вообще говоря, требуется, зная количество информации, которое должно быть передано между каждыми двумя пунктами, синтезировать сеть, принимая при этом в расчет: стоимость технических средств; дислокацию абонентов сети; объемы информации, циркулирующие в системе; характеристики сети обмена данными; ограничения по организации федерального центра и региональных узлов. При этом рассматривается сеть передачи данных, работающая в режиме прямого доступа к ресурсам с пересылкой "порций" информации.
Построение такой сети предполагает выбор оборудования, конфигурации и числа линий связи, причем этот выбор должен минимизировать среднегодовые приведенные затраты на систему. Вместе с тем упомянутые ограничения не позволяют использовать классические подходы к решению задачи синтеза. Можно лишь говорить о формализации выбора минимального числа региональных узлов с подмножеством эталонной БД с обеспечением прямого доступа пользователей других регионов к федеральным ресурсам и об оценке числа каналов связи в условиях неопределенных ресурсных ограничений. Такая задача рассмотрена в [12] для системы с трехуровневой структурой, т.е. системы, образованной федеральным (ФЦ), региональными (РЦ) и абонентскими (АЦ) центрами.
С федеральным центром связан следующий объем О пересылаемой информации:
,
где ti - суммарная длительность запросов (пополнения региональных баз данных) из i-го региона в ФЦ;
ci - бинарная переменная, принимающая значение 1, если i-й РЦ существует, и 0 - в противном случае;
- суммарная длительность запросов из k-го АЦ в ФЦ.
Суть задачи заключается в определении минимального количества РЦ, исходя из требования обеспечения вероятности реализации запроса не менее 0.8.
Исходя из изложенного, целевая функция задачи представляется в виде:
F(O/Kmax)>Pmin,
,
где Pmin - ограничение по вероятности реализации запроса;
Kmax - максимально допустимое число каналов связи;
F - функциональная зависимость вероятности реализации запроса от числа каналов связи.
Имитационная модель процесса функционирования вычислительного комплекса подробно описана в [15].
Проведенный анализ, базирующийся на максимально возможных значениях потоков информации и имитационной модели (использованной для определения связи вероятности реализации запроса с числом каналов - квазилинейная зависимость при фиксированном входном потоке), показал, что для организации обслуживания запросов оперативного характера с вероятностью реализации запроса не менее 0.8 потребуется не менее 10 РЦ и 19 каналов связи.
Из сказанного следует, что устойчиво может работать только большая разветвленная система с приблизительно равными информационными, программными и техническими возможностями в узлах и линиях коммуникации.
“Приблизительность” заключается в том, что требуемая информация будет получена и обработана если не в одном узле, то в другом, и за время, меньшее, чем характерное время изменения работы всей системы.
Экспоненциальный рост количества информации показывает, что эффективность работы небольших локальных систем будет снижаться: концентрация всей информации в одном или нескольких банках данных требует гораздо больше времени и материальных затрат, чем распределенное накопление и хранение информации во всех узлах системы. Кроме того, уменьшение числа узлов приводит к уменьшению характерного времени работы системы и, соответственно, к понижению порога устойчивости.
Литература
1. Новая технократическая волна на Западе. Сборник //М., "Прогресс" 1986 - 450с.
2. Концепция правовой информатизации России. Утверждена Указом Президента Российской Федерации от 28 июня 1993 г. № 966 //СА ПП 1993, № 27, ст. 2521
3. Киселев Б.В., Хургин В.М. Информационные проблемы в правовой сфере //Вестник РОИВТ, ВИМИ 1994, Вып. 1-2 - с. 38-41
4. Копылов В.А. О создании Российской автоматизированной системы информации о нормативных актах //НТИ, Сер.1, 1992 - № 10-11 - с. 8-13
5. Хургин В.М. О формировании телекоммуникационной инфраструктуры системы правовой информатизации России //НТИ, Сер.1, 1997 - № 6 - с. 8-12
6. Вильсон А. Дж. Энтропийные методы моделирования сложных систем //М., “Наука” 1978
7. Швецов В. И. Состояния равновесия и бифуркации в динамических региональных моделях //Сб. трудов ВНИИСИ, 14, 1989
8. Щербина И. Е. Равновесие и устойчивость в информационных динамических макросистемах // “Правовая информатика”, вып. 2, НЦПИ, 1997 - с. 123-129
9. Samuelson P.A. Foundation of Economic Analysis //Harvard University Press, Cambridge, Mass., 1947
10. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение //М., “Наука” 1970
11. Швецов В. И. Кандидатская диссертация //ВНИИСИ, 1990
12. Капитанов В. Т., Киселев Б. В., Стеценко Ю. П., Хургин В. М. О формализации выбора структуры РАСИПО // “Информационное общество”, 1997 - № 2-3 - с. 39-42.
Хургин Владимир Михайлович - кандидат техн. наук, руководитель Научно-технического центра правовой информации "Система" Федерального агентства правительственной связи и информации при президенте Российской Федерации
Щербина Игорь Евгеньевич - Директор Главного информационно-аналитического центра Министерства юстиции Российской Федерации
© Информационное общество, 1998, вып. 6, с. 57 - 66.