О журнале
Рекомендации
Кто умнее нейрокомпьютеров?
Золотарев В.В.
___________________________________
В.В. Золотарев
Дается свое понимание проблемы "человек - машина" в современных условиях. Анализируются причины успеха нейросетевых технологий.
Стремительный рост возможностей современной цифровой техники опережает многие идеи фантастической литературы и расширяет пределы применения компьютеров во всех их ипостасях с невиданной стремительностью. При этом специалисты совершенно свободно манипулируют мегабайтами оперативной памяти по принципу "этому пакету — 3 Мб, а этому надо выделить еще б". Что же касается производительности, то упоминаний о ней при любых дискуссиях уже почти не бывает: всегда можно купить более быстрый компьютер или акселераторную плату под конкретную проблему и даже спецкомпьютер под некоторый класс задач.
Но формируется ли при этом, у Человека все более способный помощник? Конечно, он есть и берет на себя все более тяжелый груз текущих забот: просчитать, подготовить, найти. Й все же это в большей степени функции калькулятора, невообразимо быстрого и старающегося представить выполняемые им задачи и получаемые результаты в более удобном для человека виде. А поскольку потребность в "настоящем друге'* у человека постоянна, то и решение проблемы "подумай и прими решение" на базе вычислений стали искать фактически еще раньше, чем появились серьезные надежды на будущие возможности ЭВМ. В настоящее время есть,' видимо, два основных, этапа, которые следует считать уже пройденными в развитии компьютеров с внесшим» важнейший вклад в углубление понимания проблемы "человек - машина", которая, вполне может рассматриваться теперь как уже "почти вечная".
Первым серьезным результатом в формировании еще только задатков интеллектуального помощника для человека в различных сферах после естественного появления сложных расчетных, программ стали разнообразные пакеты интерполяции и эксрапрляции, использовавшие в максимально возможной степени весь. потенциал классических математических дисциплин, в первую очередь корреляционного анализа. Отсчет начала развития новых способностей вычислительной техники именно от этих событий определяется тем, что даже при больших первоначальных трудностях оперативного представления результатов использования этих программ в графическом виде, наиболее эффективное и удобное конечное отображение итогов их работы было именно'в виде различных кривых, поверхностей и других визуализируемых объектов, что сначала делалось вручную. А глаз - наиболее емкий и весьма "умный", орган связи с внешней средой, как известно, и сам производящий дополнительные вычисления при восприятии внешнего мира. Другим важнейшим моментом, определившим выделение этого периода как начала ''новой эры" в компьютеризации цивилизации, является особая качественная новизна такого вида услуг ЭВМ. Дело, в том, что фактически корреляторы впервые "взяли на себя" один важный аспект "раздумий", занимающих у человека значительные силы, и массу времени. Именно в тот момент, когда экстраполируемый параметр после тех или иных оценок внутри ПЭВМ предстаёт на экране или распечатке в виде кривой, которая частично воцарилась на графике уже и в будущем времени по отношению к моменту анализа, — тут компьютер становится весьма уважаемым советчиком безотносительно к тому, что его программы написаны тем же человеком, который решал эту задачу, или другим. Просто компьютер "научился" прогнозировать. С этого момента он влияет на решения человека через свою способность предоставлять ему информацию в более подходящем виде. Напомним, что, согласно основам теории информации, никакие сколь угодно мощные ЭВМ с любыми хитроумными программами не создают никакой новой информации. Они только преобразуют входные данные к виду, удобному для восприятия.
Ограничения возможностей такого подхода к воспитанию компьютерных помощников человеку очевидны. С ростом размерности задачи до десятков даже при единственном выходном' параметре задача правильного оценивания усложняется настолько, что при всех тех скоростях счета, которые доступны, будущее становится уже прошлым, так как машина не успевает закончить вычисления вовремя. Кроме того, судьбу решаемых подобными средствами многомерных задач решило активное участие человека в самом анализе, а не только в восприятии конечных результатов. Сам этот процесс требует очень высокой квалификации и от человека, анализирующего, данные. А он нередко ошибается и забывает. Круг замкнулся. И продолжение, вполне успешное, решения многих задач численными методами на все более мощной счетной технике достаточно контрастно выделяет границы, их применимости. Все подобные методы сохраняют основные черты очень хорошего калькулятора.
Новая волна интереса к возвышению сферы деятельности цифровых систем связана с глубокими разработками теории искусственного интеллекта (ИИ). Обратившись к анализу того, как человек принимает решения, невозможно не заметить, что он активно использует большое число как очевидных, так и весьма нетривиальных правил. Возникновение тематики экспертных систем (ЭС) как раз и было связано именно с вполне успешным глубоким пониманием того, как следует поступать в различных ситуациях в зависимости от действующих в анализируемой.системе правил. При этом исходят из договоренности, что все установленные в системе законы должны выполняться, а при наличии тех или иных противоречии создаются подходы и конкретные механизмы их анализа и, по возможности, нейтрализации или устранения. Однако достаточно длительный срок применения зкспертных систем различного класса в контуре управления организация, ми, диагностики сложных технических систем и в других сферах привел специалистов к осознанию, что именно вывод правил, которые должны выполняться в системе, как раз и относится к той весьма и весьма трудновыполнимой задаче в сложной проблеме построения корректных и эффективных ЭС, что и устанавливает серьезные пределы для сферы их использования. Подавляющее число реальных систем, функционирование которых связано с необходимостью."что-то подправить", управляются, причем вполне успешно, людьми, которые не могут сформулировать точно причину как промежуточного, так и конечного решения. Это относится и к врачам с хорошими диагностическими способностями, и к водителям, и к тем же системщикам компьютерных комплексов, а также ко многим другим профессионалам. Неуловимость многих моментов, когда проявляется влияние интуиции лица/принимающего решение, на некоторое, время выпало спад интереса к ЭС и переключение внимания специалистов на другие методы, возможности которых долго не были востребованы;
Новая волна интереса к "разумоподобным" системам, схлынувшая уже со страниц "масс медиа" и специальных изданий на Западе, но реально только набирающая еще силу у нас, относится к возрожденной после очень долгого забвения тематике нейронных сетей (НС), которые, несмотря на закономерный спад долгой шумихи вокруг них, проникают во все структуры науки, производства, финансов и вообще сфер человеческой деятельности. Они составляют третье, весьма обширное поколение методов искусственного интеллекта, решающих широкий круг проблем, в том числе особенно ценных во всех сферах деятельности человека задач оценивания и прогнозирования (отметим, что сейчас можно говорить о переживаемой передовыми странами уже пятой волне обновления средств ИИ, связанной с генетическими алгоритмами, перед которыми была четвертая волна методов нечеткой логики, но эти важнейшие события последнего времени должны быть проанализированы отдельно).
Если остановиться только на одном аспекте применения и успеха нейросетевых технологий, то главная причина особого к ним внимания определяется тем, что они оказались первыми неожиданно очень удобными. для человека средствами передачи и накопления опыта. Им нужны те же данные, на которых обучался бы в аналогичных ситуациях человек, а кроме того, для многих случаев предполагаемой работы нейронную сеть действительно можно обучить именно в том смысле, какой вкладывается в учебу, например детей. И это несмотря на то, что все модели самих нейронов, используемых в этих сетях, и структура сети крайне примитивны и ни при каких условиях не могут претендовать на подобие мозгу высших млекопитающих. Отчасти такая сеть напоминает ту, которую можно увидеть в нервной системе самых простых животных, например лягушки. Но самое главное — способность обучаться — у этой системы есть! Такое четко выраженное основное свойство сложных биологических систем в технических комплексах проявилось безусловно впервые. Причем нейросеть готова учиться всему фактически без каких-либо ограничений. Открыты практически реализуемые методы таких форм обучения, которые можно считать плодом науки, искусства и удачи. И во многих случаях при наличии упорства из аморфной сначала нейронной сети можно действительно создать нейросетевого распознавателя или хорошего прогнозиста, правда, если терпение специалиста, обучающего сеть, близка к аналогичным возможностям школьного учителя.
Обширность сферы применения нейронных сетей практически несопоставима ни с какими средствами, которые придумывали до сих пор. изощренные научные и программистские умы. Одну из причин успеха - обучаемость практически чему угодно, мы уже отметили. Но тут есть и еще очень важные причины. Указанная возможность на тех же данных, что и человек, сводит на нет вмешательство самого человека, из чего и следует революционное снижение, в принципе, числа ошибок в этих данных из-за уменьшения влияния на них человеческого воздействия (т.е. просто вносимых им же ошибок) при Подготовке системы к нейросетевому обучению.
Следующим полезнейшим обстоятельством при использовании НС является то, что машина ничего не забывает. Хотя считается абсолютной нормой то, что компьютер полностью запоминает необходимые данные и программы. Но в преломлении проблемы решения человеческих задач (это всегда так и было) на компьютере, но человеческими же методами, т.е. на основе опыта (в этом и новизна!) оказывается, что опять весьма неожиданно появляется практически гарантированная возможность как в процессе обучения» так и потом в процессе принятия решений избавиться от людской забывчивости и эмоций, которые более чем часто приводят ко многим труднейшим проблемам. Никогда ранее в процессе технического развития цивилизации человечество. не получало возможности попутного избавления от столь серьезных недостатков биологической природы человека.
И наконец, может быть, самое главное. В большинстве случаев в обыденной жизни для принятия массы текущих решений люди руководствуются двумя-тремя причинами или обстоятельствами. Иначе говоря, типичным пространством принятия решений человека является плоскость или аналог физического трехмерного мира. Координатами такого пространства решений могут быть параметры типа "дорого - красиво" или "хочу - можно - некогда" и т.д. В более сложных случаях при мобилизации опыта, и, если она есть, интуиции, возможно принятие решений по четырем-пяти параметрам, описывающим ситуацию. В большинстве же случаев даже перечисление, а не только необходимость правильного принятия во внимание пяти существенных параметров какой-то достаточно непростой ситуационной задачи вызывает у человека реакцию скуки и отторжения такой проблемы из-за ее сложности. Полный же постоянный учет шести параметров той или иной ситуации весьма Проблематичен и для людей, которые считаются гениями, что и позволяет самокритично оценивать человеческие возможности в процессах принятия решений. Так что магическое число семь является для людей практически недостижимым уровнем размерности пространства решений. Что же касается нейронных сетей, то при правильном и полном обучении такая НС без каких-либо серьезных проблем вполне способна безусловно учитывать десятки и даже сотни обстоятельств, то есть принимать решения не в обычном четырех-пятимерном человеческом пространстве параметров, а в фантастическом по объему, например, семисотмерном пространстве, ничего не забывая и обязательно все учитывая. Конечно, рекордный объем пространства решений потребует и очень мощных вычислительных средств, но во многих случаях решения задач, имеющих размерность не более ста (но ведь не 5 или 7!), достаточной может оказаться обычная ПЭВМ. В подобных. Случаях вполне допустимо обучение сети в течение нескольких десятков часов (изредка — несколько суток), поскольку эта процедура й занимает основное время создания и подготовки сети к работе. А работа с обученной сетью весьма проста: параметры на входе - оцениваемая величина на выходе как в обычном автомате, производящем, вообще говоря, мгновенные несложные вычисления, которых, однако, довольно много. Но все равно длительность обучения превышает время выдачи решения уже готовой сетью на несколько, иногда на очень много порядков. Разумеется, приведенное сопоставление возможностей относится только к нескольким из наиболее популярных в прикладном плане видам нейронных сетей (которых известно несколько десятков типов), соответствующих, например, парадигме многослойного перцептрона с обучением методами обратного распространения (back propagation).
Исключительно полезными оказываются при использовании НС и их свойство самостоятельно оценивать важность параметров, используемых для обучения, а также возможность их исключения из рассмотрения в случае несущественного влияния на конечный результат.
В тематике нейронных сетей получено уже множество результатов, которые позволяют дообучать сети в связи с изменением ситуации и использовать совместно сети, реализующие различные парадигмы для решения весьма сложных задач. Допустимо иметь и неточные данные (что, разумеется, должно быть обязательно известно и сети, и специалисту, который ее обучает), а также удовлетворяющие различным особым условиям. Возможно даже, что часть параметров в различных обучающих примерах можно будет считать просто неизвестными. Столь высокая гибкость НС в их нынешнем восприятии и позволяет обеспечить высочайший уровень их адаптации к различным проблемам, непрерывно возникающим в различных сферах деятельности.
Самым очевидным приложением НС следует считать именно оценки ситуаций и прогнозирование, то есть главные функции, выполняемые человеком в процессе управления и принятия решений во всех сферах. Исходя из вышеприведенных аргументов, человечество может ожидать (практически уже создает) появления весьма эффективного помощника, способного очень много усвоить, отфильтровать и выдать конечный результат, учитывающий практически все. Знания и опыт лучших экспертов любых специальностей могут быть сконцентрированы в нескольких НС, содержащихся в основном ПК любой организации, что многократно повысит и качество диагностики, и экстраполяцию последствий практически большинства управленческих решений и внешних событий.
Что касается нерешенных проблем в области НС, то их список весьма обширен и постоянно растет. Только перечисление трудностей обучения, корректного выбора данных для настройки и тестирования, определения структуры сети или даже просто действий специалиста по обучению сетей в типичной ситуации недостатка количества самих обучающих примеров - все это может занять десятки страниц. Вместе с тем успехи нового направления столь значимы, что определенные трудности роста никого не смущают и НС находят своих сторонников во все новых сферах бытия. Отдельного разговора заслуживают методы совместного использования ЭС и НС, которые вобрали в себя все лучшие возможности обеих основных ветвей тематики ИИ.
Кроме того, весьма интенсивно проводятся исследования НС и для их совместного применения с генетическими алгоритмами и методами вычислений на базе нечеткой логики. Такие гибриды еще более расширяют возможности многих постепенно "умнеющих" систем, действительно помогающих человеку на совершенно новом уровне управления - принятии решений.
Обзор применения НС в различных сферах деятельности затрудняется тем существенным обстоятельством, что число ежегодных конференций в мире, на которых обсуждаются эти вопросы, составляет многие десятки. Оставаясь очень наукоемкой областью и требуя для работы в этой сфере весьма высококвалифицированных специалистов, нейронные сети существенно сокращают разрыв между возможностями и потребностями в поис тине "умных" помощниках человека во всем многообразии его деятельности.
По различным данным сейчас на нейрокомпьютерном рынке США присутствуют более 100 фирм с годовым оборотом до полумиллиарда долларов. Наиболее серьезное финансирование в США имеют военные приложения НС. Успешно проведены работы по их применению в системах для программы "звездных войн", для управления механической рукой на космическом корабле "Шаттл", для ряда проектов в военной авиации, подводном флоте, радиолокации и для прогнозирования надежности различных технических систем. Фактически ведущую роль играют НС в комплексах по обработке изображений земной поверхности, где они могут использоваться практически на всех этапах выделения особого интереса, обнаружения, распознавания и классификации объектов. Особое внимание это ведомство сейчас сосредоточило на проблеме анализа и выделения движущихся изображений, где уже получено множество полезных результатов.
Серьезные раздумья вызывает также известие о идущем сейчас в США весьма закрытом длительном эксперименте на компьютерной сети, в которую были введены результаты сканирования мозга маленького ребенка. Результаты, полученные к настоящему времени, свидетельствуют о появлении элементов личности в этой сети, а также постепенном развитии и взрослении сформированной таким образом объемной нейросетевой структуры.
Вторую по масштабам и эффективности применения нейронных сетей сферу составляют банки и биржи. Наличие обширных финансовых баз данных за многие десятилетия позволяет строить хорошо обученные на достоверном материале НС, прекрасно работающие на валютных биржах, оценивающие риски кредитования, фьючерсные контракты и многое другое. Например, финансовая империя American Expreee при затратах около 10 млн. дол. сумела уменьшить годовые потери от мошенничества с кредитными карточками на 20 млн. дол. Банк Chase Manhattan, шестой по величине банк США, установил в своих аналитических отделах систему оценки рейтингов ценных бумаг, обеспечивающую точность прогнозирования не ниже 84 %, что существенно выше обычного уровня. Страховая компания Nippon Life (Япония), внедрив новую систему финансового прогнозирования, резко увеличила прибыли и буквально "влетела" в верхние позиции списка Global 500 журнала Fortune, в котором за год до этого ее не было вообще.
По данным журнала Futuries, из 300 типов программных пакетов, используемых брокерами США для игры на фьючерсах, 40 базируется на нейронных сетях. Интересно видеть реакцию некоторых российских бизнесменов, которые искренне удивляются, узнав, что многие компании на Западе активно используют почти везде, в том числе, конечно, и на валютных торгах нейрокомпьютеры: "Так это мы здесь играем против тамошних компьютеров с нейронными "мозгами"?" Да. Хорошие открытия нужно делать вовремя.
Вообще же даже на уже давно существующем рынке НС в США никаких признаков насыщения еще долго не будет видно. На нем продаются и простенькие программы за пару сотен долларов для студентов, и более сложные, анализирующие и прогнозирующие что угодно с завидной точностью, комплексные пакеты ценой во многие тысячи "баксов". Расширяется также уже богатый рынок специализированных нейросетевых компьютеров, в которых нейронные структуры являются частью архитектуры на аппаратном уровне, что чрезвычайно увеличивает их скорость обучения. Есть и специальные акселераторные платы для обычных IBM PC, которые также обеспечивают многократное ускорение всех работ. Большинство нейронных фирм процветает, недовольных практически нет.
Разумеется, необходимо подчеркнуть, что речь не идет о новом "абсолютном оружии". НС имеют ряд ограничений, которые надо учитывать при их использовании. Так, нейронная сеть обычно не в состоянии предугадывать ситуации, не похожие на те, что были ранее ей предъявлены, такие, как впервые случившийся "черный вторник", поведение доллара в "коридоре", внезапные изменения таможенных тарифов и т.д. Кроме того, выходные прогнозируемые параметры, не укладывающиеся в тот диапазон, в котором обучалась НС, всегда будут оценены ошибочно, да и других проблем в тематике сетей тоже хватает. К счастью, исследования финансового рынка в развитых странах ведутся с начала века и за это время случалось всякое — крахи финансовых пирамид и кризисы власти, локальные войны и смуты междуцарствия и прочее, прочее, прочее... Поэтому многие явления, которые кажутся нам уникальными и присущими только сегодняшней России, на самом деле хорошо известны и изучены и вполне поддаются прогнозированию.
А что у нас? Не так давно несколько энтузиастов взялись проанализировать применимость продуктов нейросетевого рынка США в России и нашу готовность к применению методов ИИ в текущих делах. Нынешнее развитие применения нейросетевых подходов в ряде отраслей можно назвать как резкий взлет. В настоящее время число нейросетевых компаний США, с которыми активно взаимодействует московский "ТОРА-Центр", уже более 30, их круг быстро растет. Центр выбирает по ряду весьма жестких параметров программные и аппаратные средства, которые можно распространять в РФ. Почти все они, особенно программные средства, начиная с 1995 г., успешно внедряются в десятках организаций, как государственных, так и прочих. Общее число абсолютно уникальных для российского рынка систем ИИ, которые распространяются сейчас в Москве, уже более 50. Но это создало массу проблем развития. Нужны консультанты, положительные примеры использования НС у нас и многое другое. Кстати, с положительными примерами очень просто. Причем, большинство достижений оказываются чисто российскими. Рынок ГКО и КО, игра на валютной бирже в Москве, планирование и оптимизация продаж "окорочков", успешная медицинская диагностика в сложнейших случаях и очень многое другое. Широкую известность среди пользователей нейронными сетями в Москве приобрела фирма "ОГО", о которой уже писал журнал PC WEEK, регулярно публикующий статьи по нейросетевой тематике, ее различным приложениям и другим средствам ИИ новой волны. АО "ОГО" закупила для своего аналитического отдела почти все пакеты программ нового поколения, и не только нейросетевые. Начала фирма приобретать и аппаратные средства. И сразу стала известна практически во всех коммерческих сферах, получив прекрасные результаты по прогнозированию фьючерсов, урожайности и в других областях. Что не замедлило оценить и руководство АО, не говоря уже о его многих зарубежных партнерах.
Чтобы позволить любому аналитическому отделу, действительно оправдывающему такое название, выйти на новый уровень деятельности в оценках и прогнозах пока достаточно потратить лишь несколько тысяч долларов. Но это сегодня. Через полгода, когда необходимость дальнейшей модернизации аналитических инструментов осознают конкуренты, эта цифра возрастет в несколько раз. Уже есть и некоторая статистика развития рынка нейронных сетей в нашей стране. Подавляющее большинство пользователей останавливает свой первоначальный выбор на пакетах семейства Brain Maker фирмы CSS (США). Он не является самым мощным. Банки Запада обычно используют гораздо более эффективные (но и существенно более дорогие) системы. Однако авторы пакета нашли ту "золотую середину" между широтой возможностей и простотой интерфейса, которая позволила им получить звание "Лучший пакет года" в рейтинге PC Magazine в 1990 г. и статус самого продаваемого нейропакета США в 1994 г. Новую версию пакета - Brain Maker Professional 3.11 for Windows уже приобрели более 30 банков Москвы, а также ряд брокерских контор и коммерческих фирм. Brain Maker Professional является одним из немногих профессиональных и одновременно недорогих аналитических пакетов. Он позволяет строить прогнозы на основе данных, содержащих до 8000 входных параметров и произвольное количество фактов. Для автоматизации подготовки данных авторы пакета предусмотрели широкие возможности импорта данных - из текстовых файлов, из Clipboard Windows, из форматов Lotus, dBase, Excel, MetaStock, CompuTrade и других. Встроенная электронная таблица позволяет облегчить такие типичные операции аналитика, как вычисление всевозможных "дельт", сдвиг данных для преобразования "вчера в сегодня" и другой рутины, съедающий до 80 % драгоценного времени эксперта. Любопытная особенность пакета Brain Maker Professional - наличие аналитического блока, безусловно полезного и для тех, кто не верит никаким компьютерным прогнозам. Этот блок позволяет накапливать информацию для установления корреляции между входными и выходными данными, а также строить графики зависимостей типа "один от двух", "один от всех" и другие, которые могут принести пользу любому специалисту.
Разумеется; после первой пробы возможностей НС в своей текущей деятельности у каждого Л1овопытствующеге пользователя (а кто из программистов к таким себя не относит?) может возникнуть желание сделать что-нибудь и под конкретный круг проблем. Для этого среди других систем, нашедших самое место на рынке России, можно выделить пакет OWL, представляющий собой уникальное "собрание сочинений" авторов всех известных нейресетевых алгоритмов, Пакет объединяет выдержанные в едином стиле исходные тексты на языке Си двадцати классов алгоритмов, обладающих способностью к обучению. Имея, такой "конструктор", разработчик может создавать собственные аналитические системы любого назначения.
Кстати, из указанных 50 безусловных новинок искусственного интеллекта в "Тора-Центре" можно найти и пакеты, относящиеся к упомянутым выше вскользь волнам четвертого и пятого поколения ИИ.
А пока специалисты могут обращаться в московский Столешников переулок в "ТОРА-Центр", предварительно позвонив по тел. (095) 229-32-86 или (095) 233-45-80, где им помогут освоиться в среде новейших информационных технологий XXI века.
Статья поступила в редакцию
в ноябре 1995 г.
АО «ОГО»
Золотарев В.В. - доктор технических наук
© Информационное общество, 1995, вып. 5, с. 59-66.