О журнале
Рекомендации
Фактографическая модель технического решения в области химии и химической технологии
Л. С. Гордеев, В. В. Дубровская, В. В. Кафаров, Е. В. Наумова, В. В. Сергиевский
______________________________________________
Л. С. Гордеев, В. В. Дубровская, В. В. Кафаров, Е. В. Наумова, В. В. Сергиевский
Освещена центральная проблема информационной технологии применительно к автоматизированным информационно-поисковым системам, состоящая в формализации естественного языка. Показано, что безызбыточная модель технологического решения в области химии, содержащая необходимую и достаточную для пользователя информацию, может быть создана только на основе базовых понятий функциональной химической науки, технологии и производства.
Сложившаяся в настоящее время информационная система ориентирована либо на обеспечение доступа пользователя к первичным документам (документальное обслуживание), либо на удовлетворение потребностей непосредственно в отдельных данных, фактах (фактографическое обслуживание), в ситуативной информации, содержащей оценку анализируемых сведений, тенденций развития тех или иных предметных областей (концептографическое обслуживание), предварительно извлекаемых специальными информационными работниками из первичных документов [ 2].
Центральной проблемой информационной технологии применительно к автоматизированным информационно-поисковыми системам является проблема формализации естественного языка, которая отражается, главным образом, в преодолении противоречия, существующего между смысловым характером информации, выражаемой средствами естественного языка,и необходимостью формальной ее обработки [ 3].
В автоматизированных информационно-поисковых системах проблема формализации текстов в предметной области нашла выражение в разработке и применении искусственных информационо-поисковых языков (ИПЯ), базирующихся на естественном языке. Для обеспечения формализованного поиска необходимо, чтобы сопоставление осуществлялось не на уровне самого документа и запроса, а на уровне их поисковых образов, отражающих в "свернутом" виде основное содержание, представленное на ИПЯ. После осуществления поиска выдается информация, которая представляет собой или библиографическую ссылку на первоисточник, или реферат, или полнотекстовое описание. Недостатки таких форм представления информации в базах данных очевидны: избыточность полнотекстовых описаний, недостаточность информации при ее представлении в виде библиографических данных.
Свертывание первичной информации при ее переносе на машиночитаемые носители при фактографическом обслуживании сопряжено с определенным обеднением и искажением информации. Этих недостатков можно избежать, если привлечь авторов первичных документов к предоставлению исходной информации в структурированном виде, удобном для обработки на ЭВМ. Значительный интерес в условиях рыночной экономики представляет патентная информация. В данной работе на примере технических решений, относящихся к химии и химической технологии, рассмотрена возможность структурирования первичной патентной информации, приведения ее к виду, пригодному для реализации безбумажной технологии подачи заявок на изобретение.
Достижения в области химии и химической технологии являются основной для различных отраслей науки и техники. Одно из недавних выдающихся достижений химии — создание керамических высокотемпературных сверхпроводников, поэтому около трети мирового потока патентной информации составляют технические решения в области химии, фактографическая модель технического решения должна учитывать специфику знаний и информации в этой области.
Имеются различные определения понятия "информация", обзор которых содержится, например,в монографии [ 2]. Высказано мнение [2, с. 18], что "информацию нельзя считать ни атрибутом материи, ни функцией реальных систем; она вообще не существует в объективной действительности, данной вне и независимо от познающего субъекта". На наш взгляд, информация является свойством материи. Поэтому выявление специфики информации в той или иной предметной области целесообразно проводить с использованием представлений о формах движения материи и адекватных им науках. Практически все классификации в качестве основных выделяют физическую, химическую и библиографическую формы движения материи. В этой последовательности имеет место увеличение числа специфических носителей той или иной формы движения, их усложнение и индивидуализацию. Так, физика является наукой, изучающей простейшие и наиболее общие закономерности явлений природы, свойства и строение материи и законы ее движения [ 4]. Химию обычно определяют как "науку о веществах и их превращениях". К химическим относятся те свойства, которые выявляются в результате взаимодействия между компонентами. Так, Н. Н. Семенов подчеркнул, что "химические превращения, т. е. процессы получения из определенных веществ (сырье) новых веществ (продуктов), обладающих существенно иными свойствами, являются основным и наиболее характерным предметом химии и как науки, и как производства" [5}.
Специфика этих форм движения материи проявляется как в практике отнесения технических решений к той или иной предметной области, так и в их сущности. Физика — наука о свойствах материи, отчужденных от индивидуальных свойств вещества. Как правило, инвариантны по отношению к индивидуальным свойствам веществ и технические решения в области физики. Предметом технических решений в области химии и химической технологии являются как вещества, так и способы их получения.
Таким образом, безызбыточная модель технического решения, содержания необходимую и достаточную для пользователя информацию в виде, удобном для хранения и обаботки в автоматизированных базах данных, может быть создана только на основе базовых понятий фундаментальной химической науки, технологии и производства. Только в этом случае может представиться простая возможность структурирования информации о событиях и явлениях, происходящих в физико-химических системах. Кроме того, при разработке модели представляется необходимым учитывать постепенное признание нашим обществом коммерческо-экологической парадигмы. Согласно этой парадигме, создаваемые решения должны быть конкурентоспособными, а их реализация не должна наносить вред окружающей среде. Выполнение этих условий способствует социальной защите разработчиков.
При анализе фонда авторских свидетельств было установлено, что техническим решениям в области химии присуща различная глубина проработки: существуют технические решения, проработанные на уровне лабораторных исследований, и решения, апробированные в процессе промышленного освоения, т. е. на уровне, где решаются вопросы экологии и техники безопасности, обезвреживания отходов и определения потребительских характеристик выпускаемой продукции.
Основными подсистемами предлагаемой с учетом сказанного модели как системы являются следующие:
1 — "задача";
2 — "подзадача";
3 — "система компонентов";
4 - "условия проведения процесса";
5 — "условия осуществления производства";
6 — "назначение продукта";
7 — "результат".
Каждая из подсистем (ниже рассматриваются некоторые из них) включает основные элементы, выбранные на основе анализа законов и практики химии и химической технологии.
Выбирая и обосновывая эти элементы, составляющие подсистемы, мы исходили из внешне парадоксального факта, заключающегося в том, что появление нового свойства, результата является следствием творческого акта познания и не основано на известной закономерности, как трактует патентное законодательство СССР, но в то же время набор средств, который позволил получить это новое свойство и которыми оперирует химия, не является бесконечным множеством. Разработанная модель была опробована на ретроспективном фонде зарубежных патентов и авторских свидетельств, относящихся к различным разделам химии. При структурировании технического решения, созданного в химии, раздел 1 "задача", как правило, совпадает с названием изобретения и указывает на общественную потребность в ее решении.
В разделе 2 "подзадача" идет формирование поискового образа документа (ПОД) конкретного технического решения по-следующим элементам:
2. 1 — сырье, обрабатываемое вещество, субстрат;
2. 2 — вещество, которым обрабатывают;
2. 3 — основной метод, путь, прием;
2. 4 — характеристика конечного продукта, специфической области его назначения, применения.
Например, описаны два способа выращивания монокристаллов ВТСП. В первом способе выращивание ведут из расплава путем кристаллизации при охлаждении его с определенной скоростью. Во втором способе получение монокристаллов осуществляют из расплава, имеющего аналогичный качественный состав, но отличающегося большим избытком ВаО.
Тогда для первого случая при формулировке задачи: выращивание монокристаллов ВТСП в разделе 2. 1 указывают расплав , в разделе 2. 2 не приводят какой-либо информации, поскольку решение не предусматривает обработку сырья (в данном случае расплава) каким-либо веществом, и в системе происходит физико-химическое превращение, в разделе 2. 3 указывают кристаллизацию.
Аналогичным образом, для второго случая задача и подзадача формулируются в виде:
задача — выращивание монокристаллов ЙТСП;
подзадача 2.1- расплав содержащий избыток ВаО, 2. 2 — информация не приводится, 2. 3 — кристаллизация.
Заполнение этих граф осуществляется с использованием специальных словарей по каждому подразделу и, таким образом, ПОД представляет собой набор КС, по которому может производиться поиск информации.
В раздел 4 "условия проведения процесса" включены такие элементы как стадии процесса (при многостадийном процессе), термодинамические и кинетические параметры, характеристика реакционной среды, условия массообмена, активирующие энергетические воздействия. Применительно к приведенному примеру получения монокристалла ВТСП это будут диапазоны температур кристаллизации и скорость охлаждения; охлаждение от 1250 до 1236 °С со скоростью 1 град/ч для первого случая и от 1000 до 880 °С со скоростью 4—15 град/ч для второго случая.
В разделе 5 "условия осуществления производства" следует отметить, что в нем находят отражение такие элементы системы, как регенерация реагентов, обезвреживание отходов, замкнутые материальные и энергетические потоки — все элементы безотходных технологий, а также вопросы организации техники безопасности, т. е. все то, без чего технология на современном этапе не может считаться приемлемой.
Анализ технических решений в различных областях, в том числе в синтезе ВТСП показывает, что, как правило, имеются чистые поля по этому разделу, что свидетельствует о недостаточной глубине прорабо1ки этих решений, т. е. исследователи, как правило, не ставят своей задачей решение проблемы в комплексе, а ограничиваются выбором реагента, а также кинетических и термодинамических параметров процесса синтеза. В то же время проработка именно этих элементов решаемых задач позволяет говорить о решении задачи в комплексе, а само решение может быть рекомендовано к реализации и имеет коммерческую ценность.
В результате 7 "результат" в случае ВТСП приводятся такие показатели, как температура перехода и ее диапазон, критический ток, устойчивость во времени и т. д.
Анализируя разработанную модель технического решения, можно говорить о многоаспектности ее использования. Во-первых, на стадии создания технического решения она ориентирует разработчика на решение задачи в комплексе, предлагает ему разработать технологию с учетом тех требований, которые сегодня предъявляют химикам: экологичность, нетоксичность, техника безопасности и т. д. При этом степень заполнения матрицы свидетельствует о глубине проработки решения.
Во-вторых, при подаче заявки на изобретение по безбумажной технологии предусмотрена корректировка заполненной матрицы в диалоговом режиме с персональной ЭВМ с целью определения объема притязаний разработчика — вступают юридические аспекты использования данной модели.
В-третьих, хранение и поиск информации в таком виде устраняет необходимость обращения к первоисточнику, что делает поиск менее трудоемким и более оперативным.
Использование предлагаемой матрицы может предотвратить юридически необоснованную выдачу различных охранных документов практически на Одно и то же техническое решение. Действительно, нормативные документы и сложившаяся практика составления заявок на изобретения, выделение объекта и связанного с ним объема охраны юридически не регламентировано и приводит к многочисленным вариантам защиты одной и той же сущности. Так, типичным примером тиражирования патентных документов без приращения знания может служить изобретательство в области комплексной переработки сырья. Например, разработан способ комплексной переработки сырья А с получением одновременно продуктов В и С. Сложившаяся практика подачи заявки на изобретение не препятствует тому, что одна и та же сущность способа может быть представлена двумя независимыми техническими решениями: "Способ получения вещества С". Возможность такого неправомерного, на наш взгляд, дублирования патентного документа устраняется введением понятия "подзадача" в рассматриваемой модели, которая позволит организовать материал в соответствии с реальной предметной областью и сущностью протекающих в материальной системе процессов.
Изобретательское право в СССР базируется на представлении об изобретении как категории относительной: понятие "изобретение" предполагает сопоставительный анализ с прототипом, относительно которого признается или не признается изобретением новое решение той же задачи. Не требует пояснений тот факт, что от представления известной совокупности признаком и ее трактовки во многом зависит вывод о наличии или отсутствии изобретения в сопоставляемом с прототипом решении.
Из практики научно-технической экспертизы хорошо известны систуации, когда известные технические решения представлены в избыточном или неполном виде. Можно предложить следующую классификацию источников неоднозначности в сопоставлении с прототипом:
излишне детально описан прототип;
прототип описан в виде идеи или рекламной информации и не содержит полной совокупности необходимых признаков;
в качестве прототипа выбран промышленный способ, которому противопоставляется решение на лабораторном уровне, разный масштаб осуществления приводит к появлению противоречивых сведений;
в описании решения — (прототипа) отсутствуют данные по достигаемому эффекту.
Развертывание технических решений предлагаемого и известного в одной и той же матричной форме и удобном для сопоставления виде позволяет легко сделать вывод о наличии новизны в предлагаемом решении. Для этого достаточно лишь констатировать несовпадение признаков, отраженных в двух развернутых позициях. Для более глубокого анализа соответствия заявленного решения критериям изобретения необходимо установить, известна ли из уровня техники причинно-следственная связь между новым признаком и новым эффектом. В настоящее время, когда базы данных, из которых можно было бы черпать сведения об известности или неизвестности таких причинно-следственных связей, практически не существуют, целесообразно начать формирование такой базы, уделяя особое место в разрабатываемой модели информации, в которой могут быть сведения подобного характера. Поиск области, из которой взяты аналоги, не детерминирован и в основном зависит от интуиции как разработчика, так и эксперта. Практика нучно-технической экспертизы показывает, что даже в рамках одного и того же отдела и даже одной и той же группы экспертов анализ на соответствие решения критерию "существенные отличия" проводится с привлечением различных массивов информации и соответственно различной логики. Специалисты в узких областях техники, работающих в качестве привлеченных экспертов, предпочитают искать аналоги в близких им областях знаний, причем внешняя похожесть приемов часто создает иллюзию его известности не только в совокупности приемов, в которой этот признак предлагается. Эксперты, далекие от практической деятельности, как правило, склонны использовать учебную литературу и справочные изделия, трактуя рассматриваемые признаки в терминах известных им изделий. Субъективизм в оценке изобретательского уровня заявленных решений неизбежен и является на сегодняшний день основной причиной споров разработчиков и экспертов. В случае если каждое вновь создаваемое техническое решение будет содержать анализ причинно-следственной связи действий и эффектов, достаточно быстро находится база, использование которой будет в равной степени полезно различным категориям пользователей. Такой анализ, с нашей точки зрения, является необходимой составной частью модели технического решения.
Проведение анализа предполагает два уровня.
Первый — разработчик констатирует, что причинно-следственная связь между признаками, отличающими заявленное решение от известного, неизвестна не только в данной области, но и в смежных областях химии и химической технологии;
второй - разработчик устанавливает, что отличительный признак или признаки сообщают новое свойство разрабатываемому объекту, но сами они известны из определенных источников информации, причем причинно-следственные связи между их наличием и функциями носят иной характер. В предлагаемой модели эта ее составная часть является независимой и формирует самостоятельную базу, которая может быть использована как независимая информация.
Неотъемлемой составной частью заявки на изобретение являются примеры выполнения, иллюстрирующую фактуру, детали технического решения. Именно они несут доказательность, придавая подлинность решения, демонстрируют осуществимость гипотезы, идеи, заложенной в решении. Матричная модель, форматируемая в машинном варианте, позволяет включать необходимую информацию, расположенную в соответственных графах вертикальной развертки.
Для анализа и синтеза научно-технической информации с использованием разрабатываемой модели нет необходимости в привлечении специальных служб научно-технической информации, поскольку пополнять сеть будет непосредственно разработчик нового решения в диалоге с персональной ЭВМ, имеющей выход на сеть. Разработчик в процессе диалога и работы с моделью может решать различные задачи: оформление заявки на изобретение; текущего информирования; справочно-информационного обслуживания в режиме ретроспективного поиска; получения фактографических справок; подготовки справок о состоянии и тенденциях развития тематических направлений; получения сведений конъюнктурного характера.
Таким образом, авторами предлагается концепция создания экспертной системы в области химии и химической технологии, основанной на оригинальном способе извлечения знаний, их формализации и представления. Эта концепция фактически приводит к построению своеобразной "дисциплинарной матрицы", которая составляется из упорядоченных элементов той или иной предметной области. Каждый из этих элементов в последующем может быть дополнительно расчленен и классифицирован. Матрица учитывает объективную принадлежность ее элементов к той или иной науке или группе наук. В частности, было установлено, что для представления изображений в области аналитической химии большинство элементов представленной матрицы должно быть заменено на соответствующие понятия этой дисциплины. Это отвечает тому, что современная аналитическая химия находится на стыке различных наук и не сводится к взаимодействию веществ и определению условий, определяющих результаты этого взаимодействия.
Предложенная концепция может быть использована и для свертывания фактографической информации, содержащейся в других первичных документах.
ЛИТЕРАТУРА
1. Г л у ш к о в В. М., Каныгин Ю.М. Новая отрасль народного хозяйства — индустрия переработки информации // Кибернетика: Дела практические. М., 1984, с, 20.
2. Б л ю м е н а у Д. И. Информация и информационный сервис. - Л.; Наука, 1989, 192 с.
3. Н и к и т и н С, Е. Семантический анализ языка науки. М.: Наука, 1987, с. 25.
4. Физический энциклопедический словарь. М.: Советская энциклопедия, 1984,
5. С е м е н о в Н. Н. Наука и общество. М.: Наука, 1973, с. 76.
Статья поступила в редакцию 21 мая 1991 г.
Московский химико-технологический институт им. Д. И. Менделеева,
Московский инженерно-физический институт
______________________________________________
Л. С. Гордеев - д-р техн. наук; В. В. Дубровская, канд. техн. наук;
В. В. Кафаров - академик АН СССР;
Е. В. Наумова
В. В. Сергиевский - д-р техн. наук
© Информационное общество, 1991, вып. 3, с. 26-32.