Информационная среда науки и образования: от информационного обслуживания к распределенной системе управления знаниями
Максимов Н.В.

Информационная среда науки и образования: от информационного обслуживания к распределенной системе управления знаниями

__________________________

Н.В. Максимов



В статье с позиций системного анализа рассматривается архитектура информационной среды, ориентированной на поддержку систем генерации и сохранения знаний. Такая среда помимо возможностей формирования и систематизации информационных массивов, хранения и поиска информации, должна иметь средства динамического построения и использования компонентов лингвистического обеспечения для разных уровней и аспектов представления знаний, а также средства оценки и анализа, как результатов поиска, так и тенденций научных направлений.

Ключевые слова: Автоматизированные информационные системы, информационная среда, данные, информация, знания, модели генерации знаний и информации, общая теория систем.

Современный уровень развития и широкое применение информационных технологий, а также доступность в реальном масштабе времени разнообразных информационных ресурсов создают все условия не только для частного «позадачного» их применения, но и для естественного их «встраивания» в основную деятельность (ОД) человека.

В общем случае основным назначением интегральной информационной системы является комплексная информационная поддержка ОД – функционально, организационно и информационно взаимосвязанных процессов производственной, научной, образовательной и управленческой деятельности. С точки зрения задач информационных технологий такая совокупная система, целью которой является целенаправленное создание нового (в первую очередь, знаний), может быть представлена обобщенной схемой, изображенной на рисунке 1.



Рис. 1. Совокупная система создания/ использования информации

Соответственно, основными функциями информационной среды (ИСр) является реализация оперативного обмена информацией и её хранение в такой форме, которая обеспечит последующее использование в процессе воспроизводства знаний, т.е. не только сохранность экземпляра, но и идентификацию содержания. Архитектура и функциональные возможности автоматизированных информационных систем (АИС), как «искусственной» части ИСр, определяются из требований адекватности структуре и процессам ОД. Поэтому для построения методологической схемы ИСр (определения базовых абстрактных объектов и сетки связей) рассмотрим основные понятия, связанные с процессами генерации и сохранения знаний, а также особенности их представления в вычислительных системах в форме машинных данных.

Данные, информация, знания

Анализ и синтез нового знания, осуществляемые в процессе научного поиска (системе генерации знаний), рассматриваемые как элементы ОД, связаны с тем, что исследователь стремится взглянуть на объект с разных точек зрения. То есть, объект должен быть описан в разных функциональных пространствах, которые следует согласовать между собой в некотором «надпространстве», обладающем большей общностью [1]. Синтез этого «надпространства» и является проявлением свойства эмерджентности, позволяя обнаружить новую сущность объекта, которая в чистом виде не присуща его составляющим.

Процессы синтеза нового знания относятся к самоорганизующимся. Их объяснение связано с понятием «детерминированный хаос»: случайность в такого рода системах хотя и обязательно имеет место, но ограничена. То есть предполагается, что имеется некоторое (потенциально выделенное) преимущественное направление развития процесса. Но именно элемент случайности обеспечивает возможность появления нового, которое, так или иначе, приводит к нарушению устоявшейся системы, её достраиванию или выходу за собственные пределы [2].

В процессе познания (а в итоге – синтеза знания), с одной стороны, имеет место дезинтеграция, «расчленение и разбрасывание» уже накопленного знания, а с другой – на этой «хаотизированной» основе осуществляется выбор нового пути синтеза, позволяющего концентрированно построить новое знание. Такой выбор связан с выходом (по существу – случайным) на одну из предопределённых в данной среде и имеющих относительно устойчивое состояние структур – аттрактор, после чего происходит процесс самоорганизации и проверка непротиворечивости нового знания. Результат этого процесса по существу отвечает утверждению У.Р. Эшби: «Знание может быть частичным и все-таки оставаться полным в себе» [3].

Таким образом, комбинаторное сочетание является «технологической» основой и своеобразным методом генерации новой информации, а ИС, по терминологии теории динамических систем, выполняет роль «перемешивающего слоя», формируя неравноценные комбинации (выборки документов) и стимулируя тем самым ускорение возникновения неравновесного состояния по сравнению с полным перебором или случайной выборкой [4]. В основе этой модели лежат два следующих фундаментальных условия [5], связанных с понятием «информация»:

нарушение пространственной симметрии резко отсеивающей другие возможные комбинации, например, за счет свойства неассоциативности информации;

непредсказуемость, связанная с раскрытием содержания информационного компонента, которое заранее не было известно субъекту.

Если в процессе генерации новой информации используется АИС, то её работа, рассматриваемая как замещающая часть соответствующего участка основной деятельности (генерации нового знания), будет включать следующие основные функции:

1) поиск - процесс отбора из информационных ресурсов документов, каждый из которых представляет, по крайней мере, один информационный компонент или его образ;

2) комбинаторное построение на основе некоторого множества характеристических признаков кластеров информационных компонентов и определение степени «целостности» этих кластеров уже как новых информационных компонентов;

3) упорядочение кластеров в порядке убывания их «ценности» с целью сокращения объема просматриваемой субъектом выборки, в предположении, что мера ценности соответствует вероятности содержания в кластере искомого нового.

4) Механизм построения комбинаций информационных компонентов может быть основан на использовании системного подхода, представляющего любой объект как систему в системе объектов того же рода1, что позволит:

  • представить объект как совокупность типизированных элементов, связанных некоторыми отношениями, в совокупности образующими единство, для которого характерно появление свойств, не присущих составляющим;
  • представить систему этих однородных объектов в виде классификации, что дает возможность выделять в явной форме, в том числе и новые характеристические признаки, определять способы выделения подсистем, а на основе свойств соответствия и симметрии обнаруживать связи с другими системами классификации.

Научное исследование, а в общем случае и любая научно-практическая деятельность (НПД), как объект и процесс познания, в итоге порождающего новое знание и новые предметы, по определению является системой [6]. Действительно, любая НПД включает совокупность взаимосвязанных задач, методов и результатов; является частью какого-либо другого проекта или направления; обладает свойством эмерджентности, так как найденная комбинация известных методов и данных дает результат, обладающий свойствами, не присущими ни одной из составляющих.

Важнейшей структурной особенностью системы является возможность ее разложения на относительно независимые подсистемы. Это свойство «разложимости» означает, что параметры, которые считались связанными, на самом деле оказываются относительно независимыми, что позволяет путем декомпозиции разделить их на сравнительно независимые группы. Соответственно, сложная система описывается, как правило, при помощи набора сравнительно независимых аспектных представлений (контекстов, представляющих собой «сетку» базовых понятий и отношений), каждый из которых дает лишь частичное знание о системе в целом, но полное по отношению к данному аспекту, с последующим объединением и согласованием различных контекстов в целостное представление («картину мира»). Такое объединение производится путем установления определенных связей между аспектными представлениями – своеобразными «проекциями» системы. А так как внешняя среда является, по сути, системой бесконечной сложности, то по отношению к ней «принцип многоаспектности» описания представляется единственно возможным.

Совокупность таких аспектных описаний образует достаточно структурированную онтологию НПД, где каждое аспектное представление идентифицировано некоторым знаком, обозначающим соответствующий закон композиции – отдельную «точку зрения» на объект.

В зависимости от природы объекта (абстрактный или физический) процесс декомпозиции реализуется либо делением понятий (родовых на видовые), в результате чего формируется граф понятий предметной обрасти (ПрО), либо «членением» объекта (целого на части), в результате чего формируется структурная схема объекта, рассматриваемого как частное решение (научное, техническое, технологическое и т. д.).

Существенно, что в процессе декомпозиции не только выделяются и связываются составляющие, но и формируется схема декомпозиции – система характеристических признаков, в соответствии с которой и проводится декомпозиция. Такая методика, как отмечалось ранее, является реализацией системного подхода, позволяющего, с одной стороны, представить объект как совокупность однородных (типизированных) элементов, связанных некоторыми отношениями, в совокупности образующими единство, для которого характерно появление свойств не присущих составляющим, а с другой - представить систему этих однородных объектов в виде классификации, что, в свою очередь, дает возможность выделять в явной форме новые характеристические признаки, определять способы выделения подсистем, и на основе свойств соответствия и симметрии обнаруживать связи с другими системами классификации.

Иначе говоря, представляя НПД как дополняющие друг друга процессы размножения и согласования контекстов, мы получаем конкретную реализацию процесса обнаружения инвариантов внешнего мира, лежащую в основе научного познания [7]. Именно такой подход методологически связывает относительно самостоятельные и, в тоже время, взаимообусловливающие объекты и процессы ОД и ИД в цикле генерации новых знаний, причем суть динамики этого процесса соответствует схеме двойной спирали. Тем самым обеспечивается не только рост научного знания, но и сохранение его устойчивости и целостности.

В физических системах информация рассматривается как проявление неоднородности и неравномерности распределения материи и энергии. Важно подчеркнуть свойство «действенности» информации как источника развития, отличного от хаотического «естественного», стремящемуся к тепловому равновесию. Но здесь существенно и то, что при этом необходимо выделять ту часть неоднородности и ту часть среды (носителя информации), где направление развития некоторым образом предопределено2 (объективными законами или субъективной целью). Именно в этом ограниченном пространстве информация приводит к снижению энтропии. Явная функциональность (целесообразность) принципа выделения предполагает, что помимо действенности, информация должна обладать свойствами операционного объекта: она должна иметь самостоятельную «несвязанную» форму существования. Информация, как проявление свойства неоднородности распределения в результате процесса «упорядочения», преобразуется в отдельный информационный объект, свойства которого с одной стороны фиксируют состояние (неоднородности) в некоторый момент времени, а с другой – обеспечивают взаимодействие с первичной средой, в том числе для изменения «информационного» свойства среды – неоднородности распределения3 .

Понятие «информация» тесно связано с понятием «данные», которое также не является первичным. Взаимодействия в природе сопровождаются появлением сигналов. В свою очередь, при взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств, которые можно наблюдать, измерять или фиксировать теми или иными способами – при этом возникают и регистрируются новые сигналы. В этом случае физическая среда (носитель), состояние которой изменяется этим сигналом, становится образом сигнала – самостоятельным информационным объектом, отличным от оригинала (сигнала), но имеющим его информационные свойства. Именно эти физические объекты, передающие во времени и пространстве информационные свойства сигналов предметной области, и образуют данные – объекты обычно специально создаваемой информационной среды, позволяющей представить их в форме, удобной для хранения и обработки.

Говоря о представление информации и знаний в машинной среде, надо отметить, что если бы назначением информационных систем было только хранение и поиск данных в массивах записей, то структура системы и базы данных была бы простой. Причина сложности в том, что практически любой объект характеризуется не только параметрами-величинами, но и взаимосвязями частей или состояний. Кроме того, сам по себе отдельный элемент данных (его величина) приобретает смысл (значение) только тогда, когда связан с природой значения (другими элементами данных), что и позволит его интерпретировать.

Поэтому физическому размещению данных (и, соответственно, определению структуры физической записи) должно предшествовать описание логической структуры предметной области – построение модели соответствующего фрагмента реального мира, выделяющей только те объекты, которые будут интересны будущим пользователям, и только с теми параметрами, которые будут значимы при решении прикладных задач. Такая модель будет иметь очень мало физического сходства с реальностью, но будет полезна как представление пользователя о реальном мире. Причем это представление, задаваемое для манипулирования в неадекватной человеку жесткой вычислительной среде, будет описываться удобными для пользователя средствами.

Таким образом, прежде чем описывать машинную реализацию объектов и связей между ними, необходимо определить:

способ, с помощью которого внешние пользователи представляют (описывают) объекты и связи;

форму и методы внутримашинного представления элементов данных и взаимосвязей;

средства, обеспечивающие взаимно однозначные преобразования внешнего и внутримашинного представлений.

Такой подход является компромиссом: за счет предварительно определяемого множества абстракций, общих для большинства задач обработки данных, обеспечивается возможность построения надежных процедур обработки. Пользователь, используя ограниченное множество формальных, но достаточно знакомых понятий, выделяя сущности и связи, описывает объекты и связи предметной области; программист, используя типовые абстрактные понятия (как, например, числа, множества, агрегаты данных), определяет соответствующие информационные структуры. Система управления данными, используя двоичные формы представления типизированных данных, обеспечивает эффективные процедуры хранения и обработки данных.

В когнитивных и социальных системах информация выступает как форма знания, отчужденная от его носителя (сознания субъекта) и обобществляющая его для всеобщего использования. Получая информацию, пользователь превращает ее путем интеллектуального усвоения (информационно-когнитивного процесса) в свои новые личностные знания, т.е. происходит воссоздание знаний на основе информации. Информация проявляется (и появляется) при использовании данных в процессе решения конкретных задач, при этом происходит формирования нового личного знания субъекта. Результаты решения задач, обобщения в виде законов, теорий, совокупностей взглядов и представлений, полученных отдельными субъектами, выступающие в этот момент как истинная, проверенная практикой или другими субъектами информация, образуют обобществленные знания, отчужденные от субъектов их сформировавших. Такие знания представляются обычно в форме документов и сообщений, которые существуют объективно и независимо от истории (контекста) их получения, и которые, в свою очередь, могут рассматриваться как данные, в том числе в других предметных областях и, скорее всего, в других контекстах.

Принципиальной выводом из этого является то, что любой уровень представления предметной области определяется схемой <объект, контекст>. В частности данные определяются парой <сигнал, свойства среды носителя>, информация: <данные, метод обработки>, знания: <информация, обстоятельства получения/применения>. При этом в рамках общей теории систем «контекстную» составляющую можно формализовать следующим образом: контекст – это системообразующее основание системы – тройка <Аi, Ri, Zi>.

Отметим также, что при любом отображении предметной области в его основе лежит фиксация (кодирование) понятий и отношений, представляемое структурой. Структура, одной стороны, является общепринятым и удобным инструментом, одинаково эффективно используемым как на уровне сознания человека при работе с абстрактными понятиями, так и на уровне машинной логики. С другой стороны, она позволяет простыми способами свести многомерность содержательного описания к линейной последовательности записей.

Системы информационного обмена и обслуживания

Кругооборот информации, как и всякого продукта человеческой деятельности, подчиняется естественному циклу «создание–распространение–потребление», где основной поток документальной информации идет по цепочке автор–издательство–библиотека–читатель, хотя существуют и другие пути, например: автор–читатель; издательство–читатель (подписка).

Новое знание (результат ОД) воплощается обычно в форме сообщения – документа, реализующего преобразование смысла в текст. Такая «материализация» знаний субъекта обеспечивает унифицированную форму обобществления личного знания, а сравнительно низкая стоимость их тиражирования позволяет существенно расширить сферу потенциальных потребителей. Хотя, с другой стороны, низкая стоимость публикации (по сравнению со стоимостью получения самого результата) приводит к колоссальному и все возрастающему объему публикаций, а унифицированность форм представления обуславливает их внешнюю безликость. Чтобы опубликованное сообщение стало стимулом для построения нового знания, сообщение должно быть не только воспринято приемником (выделено среди других и помещено в среду последующей обработки), но также понято (выделен смысл) и вписано в систему его наличного знания (потенциально применено) или сохранено в долговременной памяти.

Отсюда в частности следует, что «сигнальные» признаки, необходимые для обеспечения эффективности «узнавания» – первой фазы использования сообщения, могут быть сформированы путем введения явной систематизации. Это достаточно естественный путь – знания всегда системны, т.к. создаются в рамках некоторой принятой парадигмы соответствующей отрасли знаний. И именно это обеспечивает приемлемые условия для ознакомления с более или менее представительным объемом публикаций в конкретной предметной области. Информационные аспекты обобщенной системы основной/информационной деятельности в цикле воспроизводства знаний отражены схемой, приведенной на рисунке 2.




Рис. 2. Схема основной/информационной деятельности в цикле воспроизводства знаний

Как для всех элементов основной и информационной деятельности, так и для всех этапов жизненного цикла (ЖЦ) генерации/распространения знаний, характерно свойство рассеяния. Объекты исследований (или относящиеся к ним) «рассеяны» и по всем этапам жизненного цикла, и среди различных субъектов – индивидуальных или коллективных авторов настоящих или будущих публикаций; описания объектов, процессов и результатов исследований «рассеяны» в лексическом пространстве – для описания даже одного и того же объекта разные авторы могут (в том числе одинаково эффективно!) использовать разную лексику; сведения о публикациях «рассеяны» среди разных справочных изданий, баз данных и сайтов, а сами экземпляры публикаций – среди разных хранилищ (например, традиционных и электронных библиотек, полнотекстовых БД, отдельных электронных коллекций и т.д.); форма и способ представления информации «рассеяны» среди различных международных, национальных и фирменных стандартов на наполнение и формат документов; функции поиска и обработки информации «рассеяны» среди многих реализаций ИПС, а их интерфейсные представления – среди различных метафор и визуальных компонентов, используемых разработчиками систем.

При этом именно вторичная информация имеет определяющую роль на начальном и заключительном этапах ОД, в бизнес-планировании и в задачах управления качеством, при определении направления деятельности, выборе решения при неполной информации, принятии решения о начале или завершении деятельности, оценке эффективности и применимости, оценке новизны и конкурентоспособность найденного решения. В отличие от задач нахождения публикации о методе решения частной проблемы, своей конкретностью предопределяющих требование точности информационного представления, аналитические и управленческие задачи предполагают широту и вариантность анализа предполагаемых решений, что предопределяет требование полноты и многоаспектности информационного представления.

Таким образом, можно сказать, что концептуальными требованиями при построении информационной среды являются следующие:

общность среды, интегрирующей процессы поиска и анализа информации;

преемственность и развитие информационной поддержки всех этапов ЖЦ;

системность информационных представлений;

адаптивность к информационным ресурсам различного типа;

интеграция процессов поиска и анализа информации на всех этапах ЖЦ;

системность информационных представлений;

гибкость и адаптивность поисковых процедур, использование информационных ресурсов различного типа.

Основные функции и компоненты интегральной ИС

Как уже отмечалось, основная цель информационной системы – комплексное информационно-аналитическое обеспечение научной, инновационной и управленческой деятельности. Информационные задачи, выделяемые в этом контексте, можно отнести к двум уровням:

1) управления (глобальному) – информационно-аналитическая поддержка процессов бизнес-планирования и управления качеством, в том числе:

оценка состояния и динамики научных направлений на основе статистического анализа информационных потоков документов и лексики предметных областей;

информационное обеспечение процессов управления с учетом кадрового потенциала, потребностей и особенностей развития предметной области.

2) решения (локальному) – поиск информации о частных решениях, в том числе

поиск необходимой для решения задачи информации по тематическим и фактографическим запросам;

экспертиза результатов деятельности – сравнительная оценка эффективности, новизны и конкурентоспособности частного решения.

Особенность технологических решений информационно-аналитической системы xIRBIS [8], обобщенная схема которой приведена на рисунке 3, в том, что она учитывает двойственность природы форм и способов представления запроса: при общем стремлении к «завершенной» (однородной и целостной) вербальной форме выражения запроса, в силу неопределенности, присущей реальной информационной потребности, часть или весь запрос может быть представлен в форме отдельных документов или их кластеров, что соответствует дискретной кластерной форме.

В целом и сам процесс поиска информации имеет двойственную природу. На начальном этапе необходимо выявить список терминов, характеризующих предметную область. Анализ получаемых по запросам, использующим эти термины, документов, позволяет не только оценить возможность целевого практического использования их содержания, но и обогатить запрос, а также расширить терминологию предметной области. В свою очередь, систематизация терминологии и анализ потоков информации порождает уже динамическую понятийную модель предметной области, являющуюся не только необходимым элементом познавательного процесса, но и одной из форм представления, сохранения и распространения знаний.

В составе ИАС xIRBIS выделяются пять подсистем, обеспечивающих как традиционные функции создания ИР и информационного поиска, так и поддержку понятийно-терминологических систем в сфере основной и информационной деятельности.



Рис. 3. Обобщенная схема информационно-аналитической АИС xIRBIS

Подсистема информационного поиска в распределенных ресурсах, помимо классических механизмов поиска по четким и нечетким критериям и с реформулированием запроса по обратной связи, обеспечивает:

использование альтернативных входов и средств обогащения запроса, позволяющих формировать поисковый запрос не только на основе словарей, рубрикаторов и тезаурусов, доступных при работе с документальным ресурсом, но и путем выделения лексических единиц непосредственно в текстах документов;

переадресацию и адаптацию запроса для проведения поиска в других ресурсах с учетом особенностей их ИПЯ;

вариативность представления результатов поиска – в виде тематических подборок документов в различных форматах выдачи, а также в виде тематических словарей лексики, снабженных числовыми характеристиками их употребления.

Подсистема логико-семантического анализа обеспечивает в автоматизированном режиме построение понятийного образа научного документа, в том числе: выделение из текста ключевых слов и словосочетаний;

выделение лингвистических отношений и приведение их к функциональным эквивалентам;

построение пар ключевых слов, связанных функциональными отношениями;

построение графа ключевых слов;

редактирование пользователем графа ключевых слов в части внесения, удаления, изменения терминов и отношений.

Подсистема статистического анализа документальных потоков и лексики обеспечивает для результатов тематического поиска и для документального ресурса в целом:

формирование тематических словников по отдельным тематическим направлениям и их представление в виде тематических частотных словарей лексики, а также в форме таблиц и диаграмм с поддержкой функций сортировки, редактирования и вывода;

формирование распределений различных информационных срезов с применением компонентов деловой графики;

построение и анализ временных рядов профилированных потоков документов и лексики с целью выявления характеристических свойств, общих тенденций и корреляций направлений.

Подсистема анализа и ведения объектов лингвистического обеспечения ориентирована в основном на создание и поддержку пользовательского лексического пространства предметной области и обеспечивает:

формирование иерархических рубрикаторов (без ограничения на число уровней вложенности);

формирование и упорядочение тематических словников на основе мер близости, учитывающих частотные характеристики;

построение и ведение иерархических словарных структур, которые могут быть использованы в качестве мини-тезаурусов, индивидуально представляющих предметную область, и являющихся её обобщенным поисковым образом;

формирование на основе пользовательских рубрикаторов и тематических словников матриц тематической близости, обеспечивающих автоматическую классификацию документов.

Заключение: Информационная среда – интеграция интегрированных АИС

Вышеприведенное позволяет сделать вывод, что, по существу, информационной системой может называться только совокупная система, объединяющая генераторы (в роли которых выступает, обычно, человек) и поставщиков-посредников (в роли которых выступает автоматизированная система) информации. Без средств систематизации (классификаций, рубрикаторов), позволяющих не только упорядочить массив, но и обобщенно отразить его содержание в системе наук, языка запросов, позволяющего «позиционировать» индивидуальность точки зрения пользователя, и, наконец, человека, который, комбинируя и систематизируя получаемые данные и наличные знания, синтезирует новое знание, любой информационный фонд – это только хранилище данных.

Особенностью распределения функций между человеком и АИС состоит том, что основные определяющие функции – выбор цели, определение критерия полезности, оценка и принятие решения, а, главное, генерация новой информации, осуществляются человеком. Система выступает как средство быстрого отбора, в том числе в очень больших массивах, упорядочения и представления найденного, причем алгоритмы и критерии предопределены заранее. Только человек знает, что ищет. Только он может образовывать или выделять как проблемные области, так и полезные ассоциативные связи между различными информационными объектами и выводить на их основе новые свойства, которые не были зафиксированы в информационной среде.

С другой стороны, и человек знает больше, чем «публикует» (невербализованная составляющая). И здесь именно итерационное взаимодействие человека и информационной системы позволит «вытянуть» информацию об объекте исследования не только из информационной системы, но и из сознания человека. Система, фиксируя траекторию поисков и информационные образы (возможно, ею сгенерированные, но выбранные человеком), позволяет не только в любой момент вернуться к любому информационному объекту и пойти по другой траектории, но и вербализует неявные знания человека.

Для этого на предлагаемом в [9] интерфейсном уровне можно использовать иерархически организованные структуры (персональные рубрикаторы), создаваемые пользователем, которые будут представлять его индивидуальные знания, динамически отражая как его личное (и, возможно, новое!), так и общепринятое видение ПрО. Интегральность такого представления достигается за счет того, что оно 1) реализуется объектами как уровня ресурсов – упорядоченными подборками документов, ссылками на ассоциированные ресурсы и т.д., так и уровня терминологии – запросами, словниками, фрагментами рубрикаторов и тезаурусов, используемых в данной ПрО, и 2) явно фиксирует общность и различия представлений ПрО, характерные для конкретной проблемной ситуации, как с точки зрения полноты и специфичности представления объекта информационной потребности различными терминологическими системами, так и с точки зрения адекватности её представления в различных ресурсах, в том числе отражая динамику развития ПрО путем построения временных рядов потоков публикаций и интенсивности использования специфической лексики для различных составляющих и аспектов предметной области.

Таким образом, трем основным информационным объектам совокупной системы воспроизводства знаний – данным, информации, знаниям, поставлены в соответствие отдельные хорошо структурированные технологические объекты АИС.

Данные, как основа информационного фонда АИС, представлены документами и индексами (файловыми структурами обычно прямой и инвертированной организации), для которых в рамках СУБД определены способы идентификации, выборки и преобразования.

Информация, как динамическая форма существования принятых или потенциальных знаний, по направленности своей «действенности» ориентированная на проблемную ситуацию, выделенную в ПрО (пользователя), – представлена в поисковом протоколе, фиксирующим конкретную траекторию поиска и динамику представления нового знания.

Знания, как представление предметной области, отражающее «картину мира» познающего субъекта, зафиксированное средствами соответствующего языка, которое будет воспроизводимым и его смысл будет устойчиво доступен другому субъекту познания, изучающему эту предметную область, - представлены персональным рубрикатором ПрО.

В контексте понятия «динамические системы» можно сказать, что АИС, формируя поисковые образы и выдачи, выполняет роль «перемешивающего слоя», а структуры систематизации, протоколирующие поиск и идентифицирующие результаты, задают (точнее, фиксируют) направления «предпочтительного» развития.

Соответственно, задача информационной среды – это распределенное формирование и синхронизированная поддержка как общего информационного пространства, так и индивидуального представления ПрО, свойственного, в том числе, отдельному пользователю. При этом уже сегодня возможно технологическое включение кадрового потенциала науки и образования в процессы формирования информационных ресурсов (реферирование и индексирование документов, рецензирование и оппонирование научных работ, подготовка аналитических справок о состоянии и перспективах научных направлений). Это, с одной стороны, обеспечит на регулярной основе идентификацию и сравнительную оценку новой информации, а с другой – будет способствать оперативному развитию отраслевых понятийно-терминологических систем. Интерактивные процедуры реферирования-индексирования в этом случае реализуют принцип дополнительности: представление знания в виде извлекаемых из текста ключевых слов и отношений АИС осуществляет с точки зрения «устоявшейся» системы понятий (статистической значимости), а человек, внося изменения и дополнения в построенный системой граф, фиксирует «отличия», характеризующие новизну и специфику по отношению к устоявшемуся и усредненному представлению знаний. Более того, использование при создании электронных учебных курсов специализированных информационных технологий подготовки информационных продуктов (систематизации, реферирования, индексирования) станет основой для эффективной реализации гибкой технологической среды и учебно-методических модулей, обеспечивающих возможность формирования и управления индивидуальной образовательной траекторией.

По существу это означает, что наряду с двумя «традиционными» потоками - документов (блок издательских систем на рис. 2) и запросов (блок ИПС на рис. 2) в явной форме реализуется поток вариантных (с разной степенью общности/отличий) представлений предметных областей, семантически и технологически оперативно связывающий две тоже традиционные, но достаточно изолированно существующие формы представления ПрО – лингвистическое обеспечение ИС и понятийно-терминологические системы отдельных ПрО, создаваемые в соответствии с той или иной картиной мира. При этом технологической основой является взаимодополнительность:

          Использование авторов и аналитиков в качестве экспертов для автоматизированного формирования информационных образов документов и ПрО

          Сохранение знаний путем связывания документального и понятийно-терминологического уровней

          Гибкость и адаптивность поисковых процедур

          Предоставление средств статистического и лингвистического анализа на уровне потоков документов и характеристической лексики ПрО

          Предоставление возможности ведения персональных представлений предметной области

          Использование информационных ресурсов различного типа

Именно технология интеграции распределенных процессов основной и информационной деятельности в общей среде, обеспечивающей диффузию технологий ИД в ОД, и с другой стороны, использование некоторых форм представления объектов и результатов ОД в качестве информационных ресурсов позволяют говорить о переходе от отдельных форм (специализированных, для которых характерна видовая, тематическая, организационная специализация) информационного обслуживания к интегральным (по функциям) и интегрированным (по процессам ОД и ИД) системам, а в итоге к информационной среде генерации, обработки и хранения знаний.

В целом такой подход позволит обеспечить не только адекватное обслуживание пользователей актуальной информацией, но и общность информационного пространства, преемственность и оперативное развитие информационной поддержки процесса познания на всех этапах его жизненного цикла.

Литература

1. Дружинин В.В., Конторов Д.С. Проблемы системологии. М.: Советское радио, 1976.

2. Князева Н.Н., Курдюмов С.П. Основания синергетики. М.: КомКнига, 2006.

3. Эшби У.Р. Введение в кибернетику. – М.: КомКнига, 2006.

4. Чернавский Д.С. Синергетика и информация. М.: Едиториал УРСС, 2004.

5. Николис Г., Пригожин И. Познание сложного. Введение. М.: Едиториал УРСС, 2003.

6. Урманцев Ю.А. Общая теория систем: Состояние, приложения и перспективы развития //Система, Симметрия, Гармония. М., Мысль, 1988, с. 38-124.

7. Яблонский А. И. Модели и методы исследования науки. Серия: Философы России XX века. М.: Едиториал УРСС, 2001.

8. Васина Е.Н., Голицына О.Л., Максимов Н.В. и др. Документальная информационно-аналитическая система xIRBIS: программа для ЭВМ. Свидетельство о гос. Регистрации № 2008611511 от 25.03.2008.

9. Васина Е.Н., Голицына О.Л., Максимов Н.В. Архитектура АИПС: технологии и средства поиска в документальных информационных ресурсах // НТИ, сер. 1, 2007, №10, С. 1-14.

СНОСКИ

1 Совокупность таких представлений с точки зрения общей теории систем (ОТС) [6] может быть определена как система Si, =< Mi, Ai, Ri, Zi >, i=1,n, где i – аспект, который отвечает своему закону композиции Zi , связывающему множество элементов Mi , определенных на множестве характеристических признаков Ai и связанных отношениями Ri.

2С энергоматериальной точки зрения особенным свойством информационных объектов является то, что для данной ПрО они обладают способностью «переключающего воздействия». Для такого взаимодействия информационных объектов и предметной области характерно:

1)энергетика порождения информации (точнее, отдельного объекта, отражающего свойства ПрО) настолько мала, что не влечет существенного изменения состояния ПрО;

2)предметная область имеет точки бифуркации, где сравнительно малая энергия информационного объекта влечет существенные изменения объекта предметной области. Такая точка может быть следствием «естественной» неустойчивости предметной области или искусственно «встраиваемой».

3 Отметим, что из целенаправленности взаимодействия следует, что информационная среда, по существу, представляет собой функциональную структуру, реализующую процесс управления путем формирования и реализации в текущий момент времени ti информации - объекта, осуществляющего управляющее воздействие, построенного на основе данных о предыдущем состоянии объекта в ti-1 для достижения им целевого состояния в последующий момент времени ti+1. .

________________________________________

Максимов Николай Вениаминович - доктор технических наук, профессор, профессор кафедры cистемного анализа Национального исследовательского ядерного университета «МИФИ»


&copy Информационное общество, 2009, вып. 6, с.58-67.