О журнале
Рекомендации
Применение новых информационных технологий в системах информационного обеспечения
Димитрова С., Киркова Р.
_____________________
Димитрова С., Киркова Р.
- Дальнейшее развитие работ в области научных исследований и практической реализации полученных результатов должно базироваться на создании оптимальной информационной среды. Дан анализ некоторых возможностей традиционных и новых информационных технологий, применяемых в системах информационного обеспечения. Предложен новый подход к построению таких систем и рассмотрен основанный- на нем проект многофункциональной системы баз данных о технологиях HYTECH. В основе этого подхода лежит конструкция гипертекста, преимущества которой показаны в работе. Выделены направления дальнейшего развития информационных технологий.
На основе систематизации и обобщений можно сформулировать следующие перспективы развития систем информационного обеспечения [5]:
развитие архитектурных концепций, глобальная стандартизация функциональных интерфейсов и протоколов взаимодействия систем;
универсализация структур информационных объектов и механизмов обработки информации;
интеллектуализация информационных систем, развитие семантических структур и включение их в состав систем баз знаний, правил интерпретации данных и логики вывода;
- технологический прогресс аппаратно-программных компонент;
Анализ возможностей традиционных технологий (на примере пакета
CDS-ISIS-микро)
Основными функциями традиционных систем информационного обеспечения являются: сбор, накопление и хранение информации; ее аналитико-синтетическая обработка, поиск, выбор и сортировка; обеспечение потребителей актуальной, достоверной, релевантной их запросу и своевременной информацией. Для автоматизации некоторых из этих функций разрабатываются и применяются различные инструментарии'. В ИЦТТ "ИНФОРМА" давно применяется программный пакет CDS/ISIS-микро [6 ] для накопления фондов технологий: библиографические данные информационных первоисточников, содержащих фактографическую информацию о технологических решениях и оборудовании в самых разных областях науки и техники; сведения о высококвалифицированных специалистах и т. д. Этот пакет позволяет создавать структурированные текстовые базы данных и управлять ими.
Уникальной особенностью пакета CDS/ISIS-микро является его специальное предназначение для обработки полей переменной длины, что позволяет оптимально использовать дисковую память и дает полную свободу при определении максимальной длины поля.
Основными функциями CDS/ISIS-микро являются: определение баз данных; ввод новых записей в базу; модификация, корректирование и удаление существующих записей; автоматическое создание файлов для прямого доступа к базам данных с целью увеличения быстродействия поиска; поиск записей по их содержанию при помощи специализированного поискового языка; визуализация полных записей или их частей в соответствии с требованиями пользователей, представленными на специализированном языке форматирования выхода; сортировка записей по заданным пользователем условиям; вывод каталогов и/или индексов; разработка специальных приложений; формирование и запись на дискетах выходных текстовых файлов для обслуживания пользователей информации; формирование выходных файлов в стандарте ISO 2709 для объединения баз данных или добавления записей из внешних баз.
Версия 2.3 пакета CDS/ISIS-микро содержит восемь основных функциональных модулей, четыре из которых обеспечивают пользовательские функции, а остальные - системные (предназначенные для администратора баз данных при создании новых баз и для осуществления различных системных запросов). Среди системных модулей есть и пакет для работы с языком программирования CDS/ISIS PASCAL. Создавая пользовательские выходы на языке PASCAL, можно расширить функциональные возможности системы CDS/ISIS.
В CDS/ISIS база данных (БД) имеет файловую структуру. Для пользователя БД представляет собой только один файл с информацией, а в действительности она состоит из нескольких логически связанных и физически разделенных файлов. Пользователь не должен знать структуру этих файлов. Различаются следующие типы файлов: файл описания БД, главный (master) файл и инверсный файл.
Главный файл содержит записи, которые состоят из набора полей переменной длины. Чтобы обеспечить доступ к записям главного файла, CDS/ISIS формирует специальный файл (справочный), который содержит индексы, характеризующие месторасположение записей в главном файле. Инверсный файл содержит все термины, используемые как точки доступа во время поиска в БД. Этот файл можно рассматривать как предметный указатель к содержанию файла документов главного файла.
Базу данных на CDS/ISIS можно рассматривать как файл связанных данных, которые собираются, чтобы удовлетворить информационные потребности группы конечных пользователей. Пользовательский интерфейс обеспечивает легкость работы и предполагает у пользователя только основные операционные знания работы с CDS/ISIS. Доступ к БД осуществляется, как к самостоятельно функционирующим элементам определенной системы. Администратор БД должен еще при проектировании предусмотреть связь между отдельными базами данных.
Рассматриваемая версия пакета дает возможность осуществить связь только между конкретными полями в записях одной базы, заполненными различной информацией. Различного рода поиск по термину (булевому выражению) можно выполнять только в пределах одной базы. Поиск в пределах нескольких баз можно организовать только путем последовательного задания их имен. Поисковые выражения составляются на специализированном языке или путем прямого выбора на экране дисплея терминов из визуализированного словарного файла. Пользователь сам должен позаботиться о том, в какой очередности он будет задавать свои вопросы, как будет отбирать релевантные записи и запоминать их в специальных файлах, подлежащих распечатыванию или дополнительной текстовой обработке. При помощи специальной функции R можно составить список заданных вопросов к отдельным базам с указанием конкретных ответов на них. Каждому вопросу соответствует уникальный номер. При необходимости пользователь имеет возможность указать номер какого-то из предыдущих вопросов, а также усложнить поисковое выражение вопроса, чтобы сузить область поиска и добиться большей релевантности ответа. Следует отметить, что каждый раз осуществляется заново физический поиск в БД и результаты записываются в список. Записи, выбранные как ответ на конкретный вопрос, можно запомнить в отдельном файле, поименованном самим пользователем сразу после получения ответа.
Следует отметить, что для комплексного информационного обеспечения пользователя нет средств навигации в БД и нет инструментария, поддерживающего историю поиска в этих базах.
Преимущества гипертекста и гипертекстовой технологии
Некоторые из перечисленных недостатков можно преодолеть, разрабатывая и внедряя новые информационные технологии. Одним из примеров является гипертекст, который воспринимается как технологическое средство "интеллектуального обслуживания" и поддержки творческого процесса машинными средствами. Основная идея гипертекстовой технологии заключается в нелинейном представлении текста в виде сети [1, 4,5].
Гипертекст - это специальная форма документа, в котором информация хранится в сетевой структуре; каждый узел сети содержит фрагмент документа или какой-либо набор элементов данных; узлы могут содержать текстовую, графическую, звуковую, видеоинформацию или комбинацию этих данных; доступ к информации осуществляется путем интерактивного просмотра и выбора связей для перехода к следующим узлам. Таким способом гипертекст позволяет тому, кто вносит информацию, делать ссылки, а тому, кто извлекает, - определять, какие связи должны быть прослежены и в каком порядке. В этом смысле гипертекст как бы уменьшает ограничения для того, кто пишет или читает.
Гипертекст определяется [1, 4] и как метод организации БД, обеспечивающий новые возможности прямого доступа к информации. Характерной его особенностью является поддерживаемое системой прослеживание ссылок. В гипертексте связи описываются одним или несколькими словами, которые позволяют легко и быстро достичь при поиске нужное место в гипердокументе. Существует несколько типов связей: указательные, иерархические, связи по каналам поиска и кластер связи. В инженерно-ориентированных гиперсистемах пользователь предпочитает иерархическую организацию связей. Узлы формируются самим пользователем. Обычно они содержат информацию об одной идее или одном понятии.
Наконец, гиперсистемы обладают специфическим интерактивным интерфейсом, в который встроены средства для работы с окнами. На каждом этапе навигационного процесса пользователь оценивает полученную информацию и решает, в каком направлении следует продолжать поиск. Ему предоставлена возможность естественного просмотра текста и поиска по ключевым словам.
Конечно, при применении гипертекстовых технологий существуют и проблемы. Они связаны в основном с визуализацией связей и с навигацией в системе [1, 4 ]. В большой гипертекстовой сети достаточно трудно ориентироваться, т. е. трудно ответить на вопросы: где я? куда мне идти? как достичь...? и т. п.
Иными словами, в такой сети можно "заблудиться". Еще больше сложностей возникает в динамически развивающейся сети с постоянно меняющимися узлами и связями. Кроме того, работа с гипертекстами создает и дополнительную психологическую нагрузку. Для пользователя возникают сложности выбора при наличии нескольких альтернативных путей. Он должен постоянно заботиться о структуризации текста, оптимальном установлении связей и их наглядном отображении.
Проект многофункциональной системы HYTECH
Современный этап развития технологий вполне может быть назван технологическим взрывом. В условиях быстрого роста числа новых технологий представляется чрезвычайно важным оснастить специалистов эффективными средствами выбора, сравнения и оценки технологий. С целью удовлетворить некоторые из этих требований коллектив специалистов из ИЦТТ "ИНФОРМА" и Института математики Болгарской АН начал разработку проекта многофункциональной системы ДБ по технологиям HYTECH [2 ].
С организационной точки зрения этот проект будет базироваться на опыте специалистов ИЦТТ "ИНФОРМА" по применению технологий, в эксплуатации систем информационного обеспечения. Поэтому базой проекта будет информационный фонд по технологиям (созданный с помощью пакета CDS/ISIS-микро): фактографическая информация о технологических решениях и оборудовании в разных областях науки и техники; библиографические данные информационных первоисточников; сведения об организациях и специалистах, связанных с этими технологиями, и т. д. Это обеспечит возможность экспериментировать с реальными данными и в реальных условиях.
Учитывая преимущества и недостатки традиционных и новых информационных технологий, для реализации проекта HYTECH разработчики решили использовать научно-прикладные результаты по применению гипертекстовых технологий.
"Интеллектуальная" база данных [3 ] представляет собой совокупность относительно обособленных блоков информации, структурно и функционально объединенных на основе общей предметной области, к которой они относятся. Выбранная структура БД (так называемая гиперструктура) обеспечивает логическую связь между элементами "интеллектуальной" базы. С ее помощью обеспечивается прослеживание путей отдельного пользователя в процессе поиска информации. На основе заданной гиперструктуры пользователи имеют возможность последовательно искать информацию в соответствии со своими критериями в произвольно выбранном информационном множестве БД или следовать предусмотренному в системе сценарию поиска.
Основной управляющей компонентой системы является монитор, состоящий из управляющего ядра, модулей управления диспетчерского и потребительского интерфейса, модуля управления и поддержки БД и ее структуры, модуля связи с другими системами, а также модулей реализации сервисных и вспомогательных функций.
Учитывая большие массивы информации и следуя классификации гипертекстовых систем с точки зрения их применения [1 ], первая версия проекта HYTECH будет реализована как система для просмотра (browsing). При этом связи будут играть первостепенную роль в организации нелинейного текста, так как их семантика, функции и скорость продвижения в сети существенно влияют на восприятие системы пользователем. Предусмотрено реализовать основные типы связей (указательные, организационные и связи по ключам) с целью поддержки следующих основных функций: связь ссылки с документом, связь с текстом комментария или аннотации, связь между секциями оглавления или между рубрикой оглавления и текстом, соотношение между двумя фрагментами текста, связь между таблицей или рисунком и их описанием и т. д.
HYTECH разрабатывается для персональных компьютеров типа IBM PC/XT/ AT под управлением MS-DOS.
Выводы
Дальнейшее развитие работ болгарских специалистов в области научных исследований и практическая реализация полученных результатов в этом направлении будут базироваться на создании оптимальной информационной среды для передачи информации по технологиям. Гипертехнология является естественным продолжением, новым этапом развития информационных технологий. Ее массовое внедрение в информационную практику - вопрос недалекого будущего. Исследования в этом направлении позволяют сделать вывод о том, что разработанные на ее основе проекты будут системами, вполне удовлетворяющими потребности завтрашнего дня по передаче информации по технологиям.
Гипертекстовые системы, дополненные средствами профессионального анализа и планирования решений, электронными справочниками, вычислительными процедурами и другими средствами, создадут в будущем новую информационно-вычислительную среду. Развитие гипертекстовых систем в больших, средних и малых информационных центрах позволит интегрировать локальные и распределенные гипертекстовые БД. Решение задач построения распределенных гипертекстовых систем даст пользователям новые возможности в работе с мировыми информационными ресурсами.
Таким образом, будущие системы информационного обеспечения в значительной мере преобразуют облик информационной индустрии. Принципы открытости и развитой функциональности станут общепринятыми и обеспечат объединение малых, средних и больших систем.
Литература
- Conklin J. Hypertext: An Introduction and Survey// ШЕЕ Computer, 1987, Sept., p. 17-41.
2. Dencheva Б., Dlmitrova St., К i г к о v а К. Data Base Access Extension Using Hypertext Organization// Breitenbrunn (GDR), 1990, Mai, Proc. of WG-25 KNUUT, 1990, 4, Bucarest (Rumania) (to appear).4
3. Белецкая И. П. Гипертекстовые системы. Современное состояние// Тр. РГ-26 КНВВТ "Знания-диалог-решение". - Киев, 1990, с. 269 - 282.
4. Горностаев Ю. М. Современные тенденции развития систем обработки текстовых баз данных// Проблемы информационных систем. - М., МЦНТИ, 1989, вып. 7, с. 71 - 95.
5. Мини-микро CDS/ISIS: Справочное руководство (вер. 2,3). - ЮНЕСКО, 1989, март.
- Статья поступила в редакцию 27 ноября 1990 г. Информационный центр для трансфера технологий "ИНФОРМА" (г. София, Болгария); Институт математики с ВЦ БАН (г. София, Болгария)
С. Димитрова - канд. экон. наук;
Р. Киркова - канд. мат. наук