О журнале
Рекомендации
Искусственный интеллект в медицине и здравоохранении
Unknown Author
Искусственный интеллект в медицине и здравоохранении
_____________________
Гусев А.В., Добриднюк С.Л.
Статья рекомендована Ю.Е. Хохловым 5.09.2017.
Аннотация
В работе рассматриваются перспективы применения технологий искусственного интеллекта в медицине и здравоохранении. Описывается история развития искусственного интеллекта, анализируются технологии машинного обучения и нейронных сетей. Приводится обзор уже реализованных проектов применения искусственного интеллекта, дается прогноз наиболее перспективных, по мнению авторов, направлений развития технологий искусственного интеллекта на ближайший период.
Ключевые слова: искусственный интеллект, машинное обучение, нейронные сети, здравоохранение, медицина.
В настоящее время искусственный интеллект (ИИ) считается одним из важнейших направлений ИТ-исследований, движителем прорывного индустриального роста, который в последнее время называют «Индустрией 4.0».
Как изобретение электричества привело к промышленной революции в XIX в., так и искусственный интеллект и информационные технологии воспринимаются сегодня как источник глубокой трансформации общества и экономики [1]. Однако в отличие от прежних промышленных революций, основной движитель этих тектонических изменений – не технологии, и не ИТ. Изменяется само общество, его уклад. Информатизация преобразует поведение потребителей. Имея доступ к разного качества информации, они становятся более искушенными и требовательными. Применяя ИТ, менеджмент получил качественные профессиональные инструменты наблюдения, управления и контроля. Меняется политика государства и инвесторов: они больше не хотят вкладывать средства в деятельность, которая унаследовала рутину, в которой применяется низкоквалифицированный ручной труд. На смену прежним технологиям приходят роботы и когнитивные информационные системы.
Согласно данным International Data Corporation (IDC), объем рынка когнитивных систем и технологий ИИ в 2016 г. в денежном выражении составил приблизительно 7,9 млрд. долл. В 2017 году, как ожидается, он вырастет на 59,3% и достигнет 12,5 млрд. долл. Аналитики полагают, что до конца текущего десятилетия среднегодовой темп роста окажется на уровне 54%. В результате в 2020 г. стоимость продукции отрасли превысит 46 млрд. долл. Наибольшую долю этого рынка составят когнитивные приложения, которые автоматически изучают данные и составляют различные оценки, рекомендации или прогнозы. Инвестиции в программные платформы ИИ, которые предоставляют инструменты, технологии и сервисы на основе структурированной и неструктурированной информации, будут измеряться 2,5 млрд. долл. в год [2]. Рынок искусственного интеллекта в области здравоохранения и наук о жизни, по оценкам Frost & Sullivan, также будет расти на 40% в год и достигнет в 2021 г. 6,6 млрд. долл. [5].
История искусственного интеллекта
Искусственный интеллект имеет относительно долгую историю, начиная с теоретических исследований Тьюринга по кибернетике, относящихся к началу XX в. А концептуальные предпосылки появились еще ранее – с философской работы Рене Декарта «Рассуждение о методе» (1637) и Томаса Гоббса «Человеческая природа» (1640).
В 1830-х годах английский математик Чарльз Бэббидж предложил идею сложного цифрового калькулятора — аналитической машины, которая, как утверждал разработчик, могла рассчитывать ходы для игры в шахматы. В 1914 г. директор одного из испанских технических институтов Леонардо Торрес Кеведо изготовил электромеханическое устройство, способное разыгрывать простейшие шахматные эндшпили почти так же хорошо, как человек.
С середины 30-х годов прошлого столетия, с публикации работ Тьюринга, в которых обсуждались проблемы создания устройств, способных самостоятельно решать различные сложные задачи, к проблеме искусственного интеллекта в мировом научном сообществе стали относиться внимательно. Тьюринг предложил считать интеллектуальной такую машину, которую испытатель в процессе общения с ней не сможет отличить от человека. Тогда же появилась концепция Baby Machine, предполагающая обучение искусственного разума на подобие маленького ребенка, а не создание сразу «умного взрослого» робота – прообраз того, что сейчас мы называем машинным обучением.
В 1954 г. американский исследователь Ньюэлл решил написать программу для игры в шахматы. К работе были привлечены аналитики корпорации RAND Corporation. В качестве теоретической основы программы был использован метод, предложенный основателем теории информации Шенноном, а его точная формализация была выполнена Тьюрингом.
Летом 1956 года в Университете Дартмута в США прошла первая рабочая конференция с участием таких ученых, как Маккарти, Минский, Шеннон, Тьюринг и другие, которые впоследствии были названы основателями сферы искусственного разума. В течение шести недель ученые обсуждали возможности реализации проектов в сфере искусственного интеллекта. Именно тогда и появился сам термин artificial intelligence (AI) – искусственный интеллект [1].
Следует уточнить, что работы в области ИИ не всегда оказывались успешными. После взрывного интереса в 1950-е годы и фантастических ожиданий, что вот-вот компьютер заменит человеческий мозг, в 1960-1970-е годы наступило тяжелое разочарование. Возможности компьютеров того времени не позволяли проводить сложные вычисления. В тупик зашли и исследования по разработке математического аппарата ИИ. Этим пессимизмом окрашены многие учебники по прикладной информатике, выпускаемые до сих пор. В общественной культуре сформировался образ робота или кибернетического алгоритма как жалкого, недостойного внимания агента, который может выполнять свои функции только под контролем человека. Однако в середине 1990-х годов интерес к ИИ начал возрождаться, и с этого времени наблюдается настоящий взрыв исследований и патентной работы по этой тематике.
Современные тенденции
В 2005–2008 гг. в работах по ИИ произошел качественный скачок. Математический научный мир нашел новые теории и модели обучения многослойных нейронных сетей, ставших фундаментом развития другой теории – глубокого машинного обучения. А ИТ-отрасль стала выпускать высокопроизводительные и, главное, недорогие и доступные вычислительные системы. Итогом совместных усилий математиков и инженеров стало достижение за последние 10 лет выдающихся успехов, включая разнообразные практические результаты. Первые примеры впечатляющих результатов применения ИИ удалось достичь в деятельности, требующей учета большого числа часто изменяющихся факторов и гибкой адаптивной реакции человека, например, в развлечениях и играх.
В 1997 г. компьютер IBM под названием Deep Blue стал первым компьютером, победившим чемпиона мира по шахматам Гарри Каспарова.
В 2011 г. когнитивная самообучающаяся система IBM Watson победила бессменных чемпионов в игре Jeopardy! (российский аналог – программа «Своя игра»).
В начале 2016 г. программа AlphaGo от Google обыграла в игру Го Фаня Хуэя, чемпиона Европы. Еще через два месяца AlphaGo со счетом 4:1 разгромила Ли Седоля, одного из лучших игроков Go в мире. Это стало историческим рубежом: раньше считалось, что компьютеру не обыграть игрока такого уровня – слишком велика степень абстракции и слишком много сценариев развития событий для перебора. В некоем смысле компьютеру в игре Go надо уметь творчески «думать» [2].
В январе 2017 г. программа Libratus, разработанная в Университете Карнеги–Меллона, победила в 20-дневном покерном турнире «Brains Vs. Artificial Intelligence: Upping the Ante», выигрыш составил более 1,7 млн. долл. Следующая победа была одержана улучшенной версией ИИ под названием Lengpudashi, против выступал участник Мировой серии покера (WSOP) Алан Дю, а также ряд ученых и инженеров. Особенность этой ситуации состояла в том, что игрок планировал одержать победу над ИИ, используя его слабые стороны. Тем не менее стратегия не сработала, и продвинутая версия Libratus вновь одержала победу. Как сообщает Blomberg, один из разработчиков Libratus Ноам Браун сказал, что человек недооценивает искусственный интеллект: «Люди думают, что блеф характерен для людей, но это не так. Компьютер может понять, что если блефуешь, то выигрыш может быть больше» [4].
За последние несколько лет решения на базе ИИ удалось внедрить во многих сферах деятельности, добившись повышения эффективности процессов, и не только в сфере развлечений. Технологические гиганты Facebook, Google, Amazon, Apple, Microsoft, Baidu и ряд других компаний вкладывают в исследования ИИ гигантские средства и уже сейчас применяют различные разработки в своей практической деятельности. В мае 2017 г. компания Microsoft выступила с заявлением, что планирует применять механизмы ИИ в каждом своем программном продукте и сделать их доступными для любого разработчика [6].
Снижение стоимости ИИ-платформ и повышение их доступности позволило работать с ними не только крупным корпорациям, но и специализированным компаниям и даже стартапам. В последние пару лет появилась масса небольших исследовательских команд, насчитывающих несколько человек и не обладающих гигантскими финансовыми возможностями, которые тем не менее умудряются предлагать новые и перспективные идеи и конкретные работающие решения, построенные на базе ИИ. Один из самых известных примеров – это стартап, создавший очень популярное мобильное приложение Prisma: команда разработчиков предложила сервис для обработки фотографий с возможностью стилизации под того или иного художника.
Массовое развитие и внедрение ИИ сразу во множестве направлений стало возможным благодаря сразу нескольким ключевым факторам развития ИТ-отрасли: проникновению высокоскоростного интернета, существенному росту производительности и доступности современных компьютеров с одновременным снижением стоимости владения, развитию «облачных» решений и мобильных технологий, росту рынка свободного программного обеспечения (СПО).
Наиболее восприимчивыми к использованию ИИ считаются отрасли массового и распределенного обслуживания потребителей: реклама, маркетинг, торговля, телеком, государственные услуги, страхование, банковское дело и финтех. Дошла волна изменений и до таких консервативных сфер деятельности, как образование и здравоохранение.
Что же такое искусственный интеллект?
В начале 1980-х годов ученые в области теории вычислений Барр и Файгенбаум предложили следующее определение ИИ: «Искусственный интеллект — это область информатики, которая занимается разработкой интеллектуальных компьютерных систем, то есть систем, обладающих возможностями, которые мы традиционно связываем с человеческим разумом, – понимание языка, обучение, способность рассуждать, решать проблемы и т. д.» [1]. Джефф Безос (CEO Amazon), пишет об ИИ так: «За последние десятилетия компьютеры автоматизировали многие процессы, которые программисты могли описать через точные правила и алгоритмы. Современные техники машинного обучения позволяют нам делать то же самое с задачами, для которых намного сложнее задать четкие правила» [15].
В настоящее время к искусственному интеллекту фактически относят различные программные системы и применяемые в них методы и алгоритмы, главной особенностью которых является способность решать интеллектуальные задачи так, как это делал бы размышляющий над их решением человек. К числу наиболее популярных направлений применения ИИ относятся прогнозирование различных ситуаций, оценка любой цифровой информации с попыткой дать по ней заключение, а также анализ различных данных с поиском скрытых закономерностей (data mining). Подчеркнем, что пока что компьютеру не под силу моделировать сложные процессы высшей нервной деятельности человека, такие как проявление эмоций, любовь, творчество. Это относится к сфере так называемого «сильного ИИ», где прорыв ожидается не ранее 2030–2050-х годов.
Вместе с тем компьютер успешно решает задачи «слабого ИИ», выступая в роли кибернетического автомата, работающего по предписанным человеком правилам. Растет число успешно внедренных проектов т.н. «среднего ИИ», где ИТ-система включает элементы адаптивного самообучения, совершенствуясь по мере накопления первичных данных, по-новому реклассифицируя текстовые, графические, фото/видео-, аудиоданные.
Нейронные сети и машинное обучение – основные понятия ИИ
Сейчас накоплены и систематизированы самые разнообразные подходы и математические алгоритмы для построения систем ИИ, такие как байесовские методы, логистическая регрессия, метод опорных векторов, решающие деревья, ансамбли алгоритмов и т.д. В последнее время ряд экспертов приходит к выводу, что большинство современных и действительно удачных реализаций – это решения, построенные на технологии глубоких нейронных сетей (deep neural networks) и глубокого машинного обучения (deep learning) [3].
Нейронные сети (neural networks) основаны на попытке воссоздать примитивную модель нервной системы биологических организмов. У живых существ нейрон – это электрически возбудимая клетка, которая обрабатывает, хранит и передает информацию с помощью электрических и химических сигналов через синаптические связи. Нейрон имеет сложное строение и узкую специализацию. Соединяясь друг с другом для передачи сигналов с помощью синапсов, нейроны создают биологические нейронные сети. В головном мозге человека насчитывается в среднем около 65 млрд. нейронов и 100 трлн. синапсов [12]. По сути, это и есть базовый механизм обучения и мозговой деятельности всех живых существ, т.е. их интеллект. Например, в классическом опыте И.П. Павлова каждый раз непосредственно перед кормлением собаки звонил колокольчик, и собака быстро научилась связывать звонок колокольчика с пищей. С физиологической точки зрения результатом опыта стало установление синаптических связей между участками коры головного мозга, ответственными за слух, и участками, ответственными за управление слюнными железами. В итоге при возбуждении коры звуком колокольчика у собаки начиналось слюноотделение [1]. Так собака обучилась реагировать на поступающие из внешнего мира сигналы (данные) и делать «правильный» вывод.
Именно способность биологической нервной системы обучаться и исправлять свои ошибки легла в основу исследований в области искусственного интеллекта. Их исходной задачей была попытка воспроизвести низкоуровневую структуру мозга, т.е. создать компьютерный «искусственный мозг». В результате была предложена концепция «искусственного нейрона» – математической функции, которая преобразует несколько входных фактов в один выходной, назначая для них веса влияния. Каждый искусственный нейрон может взять взвешенную сумму входных сигналов и в случае, если суммарный вход будет превышать определенный пороговый уровень, передать двоичный сигнал дальше.
Искусственные нейроны объединяют в сети, соединяя выходы одних нейронов с входами других. Соединенные и взаимодействующие между собой искусственные нейроны создают искусственную нейронную сеть – определенную математическую модель, которая может быть реализована на программном или аппаратном обеспечении. Упрощенно нейронная сеть – это просто программа, которая на входе получает данные, а на выходе выдает ответы. Будучи построена из очень большого числа простых элементов, нейронная сеть способна решать чрезвычайно сложные задачи.
Математическая модель единичного нейрона (персептрона) была впервые предложена в 1943 г. американскими нейрофизиологами и математиками Уорреном Мак-Каллоком и Уолтером Питтсом, они же предложили определение искусственной нейронной сети. Физически модель при помощи компьютера была смоделирована в 1957 г. Френком Розенблаттом. Можно сказать, что нейросети – это одна из старейших идей практической реализации ИИ.
В настоящее время существует множество моделей реализации нейронных сетей. Есть «классические» однослойные нейронные сети, которые применяются для решения простых задач. Однослойная нейронная сеть идентична в математическом смысле обычному полиному, весовой функции, традиционно применяемой в экспертных моделях. Число переменных в полиноме равно числу входов сети, а коэффициенты перед переменными равны весовым коэффициентам синапсов.
Есть математические модели, в которых выход одной нейросети направляется на вход другой; таким образом создаются каскады связей, так называемые многослойные нейронные сети (MNN, multilayer neural network) и один из наиболее мощных их вариантов – сверточные нейронные сети (CNN, convolutional neural network). MNN обладают большими вычислительными возможностями, но и требуют огромных вычислительных ресурсов. С учетом размещения ИТ-систем в облачной инфраструктуре многослойные нейросети стали доступны большому числу пользователей и сейчас они составляют фундамент современных ИИ-решений. В 2016 г. компания Digital Reasoning из США, занимающаяся когнитивными вычислительными технологиями, создала и обучила нейронную сеть, состоящую из 160 млрд. цифровых нейронов. Она значительно мощнее нейросетей, имеющихся в распоряжении компании Google (11,2 млрд. нейронов) и Национальной лаборатории США в Ливерморе (15 млрд. нейронов) [7].
Другой интересной разновидностью нейросетей являются нейронные сети с обратной связью (RNN, recurrent neural network), когда выход со слоя сети подается обратно на один из входов. У таких платформ есть «эффект памяти», и они способны отслеживать динамику изменения входных факторов. Простой пример – улыбка. Человек начинает улыбаться с еле заметных движений мимических мышц глаз и лица, прежде чем явно покажет свои эмоции. RNN позволяет обнаружить такое движение еще на ранних фазах, что бывает полезно для прогнозирования поведения живого объекта во времени посредством анализа серии изображений или конструирования последовательного потока речи на естественном языке.
Машинное обучение (machine learning) – это процесс машинного анализа подготовленных статистических данных для поиска закономерностей и создания на их основе нужных алгоритмов (настройки параметров нейронной сети), которые затем будут использоваться для прогнозов. Созданные на этапе машинного обучения алгоритмы позволят в дальнейшем компьютерному искусственному интеллекту сделать корректные выводы на основании предоставленных ему данных [1]. Различают два основных подхода к машинному обучению – с учителем и самообучение [13].
В обучении с учителем используются специально отобранные данные, в которых уже известны и надежно определены правильные ответы, а параметры нейронной сети подстраиваются так, чтобы минимизировать ошибку. В этом способе ИИ может сопоставить правильные ответы к каждому входному примеру и выявить возможные зависимости ответа от входных данных. Например, коллекция рентгенологических снимков с указанными заключениями будет являться базой для обучения ИИ, т.е. его «учителем». Из серии полученных моделей человек в итоге выбирает наиболее подходящую, например, по максимальной точности выдаваемых прогнозов.
Нередко подготовка таких данных и ретроспективных ответов требует большого человеческого вмешательства и их ручного отбора. Кроме того, на качество полученного результата влияет субьективность человека-эксперта. Если по каким-либо соображениям он не рассматривает при тренировке всю совокупность выборки и ее атрибутов, его понятийная модель ограничена текущим уровнем развития науки и техники, указанной «слепотой» будет обладать и полученное ИИ-решение. Важно отметить, что нейросети являются функцией с нелинейными преобразованиями и обладают гиперспецифичностью: результат работы алгоритма ИИ будет непредсказуем, если на вход будут поданы параметры, выходящие за границы значений обучающей выборки. Поэтому важно обучать ИИ-систему на примерах, адекватных последующим реальным условиям эксплуатации. Большое значение имеют географический и социодемографический аспекты, что в общем случае не позволяет использовать без потери точности математические модели, натренированные на популяционных данных других стран и регионов. За репрезентативность обучающей выборки отвечает эксперт.
Самообучение применяется там, где нет заранее заготовленных ответов и алгоритмов классификации. В этом случае ИИ ориентируется на самостоятельное выявление скрытых зависимостей и поиск онтологии. Машинное самообучение позволяет распределить образцы по категориям за счет анализа скрытых закономерностей и «автовосстановления» внутренней структуры и природы информации. Это позволяет исключить ситуацию системной «слепоты» врача или исследователя, например, в ситуации, когда они разрабатывают модель ИИ-прогноза сахарного диабета 2-го типа, сосредотачивая основное внимание на показателях глюкозы в крови или весе пациента. Однако одновременно они вынужденно игнорируют всю другую информацию из истории болезни, которая также могла бы быть полезна. Глубокий подход к обучению позволяет тренировать ИИ на всей многомиллионной базе пациентов и проанализировать любой тест, который когда-либо был внесен в электронную медицинскую карту пациента.
В механизмах глубокого машинного обучения (deep learning), как правило, используются многослойные нейросети и очень большое число экземпляров объектов для тренировки нейронной сети. Число записей в обучающей выборке должно насчитывать сотни тысяч или даже миллионы примеров, а когда ресурсы не ограничены – и больше. Для того чтобы научить ИИ распознавать лицо человека на фотографии, команде разработчиков в Facebook потребовались миллионы изображений с метаданными и тегами, говорящими о наличии лица на фото. Успех Facebook в реализации функции распознавания лиц обусловлен именно огромным количеством исходной информации: в социальной сети имеются аккаунты сотен миллионов людей, которые выкладывают гигантское количество фотографий и при этом указывают на них лица и идентифицируют людей. Глубокое машинное обучение на основе такого количества данных позволило создать надежный искусственный интеллект, который теперь за считанные миллисекунды не просто обнаруживает лицо человека на изображении, но и достаточно часто угадывает, кто именно изображен на фотографии.
Большое количество записей обучающей выборки необходимо ИИ и для создания необходимых правил классификации. Чем больше разнородных данных будет загружено в систему на этапе машинного обучения, тем точнее будут выявлены эти правила и тем в конечном итоге точнее будет результат работы ИИ. Например, при обработке рентгенограмм и МРТ многослойные нейросети способны по изображениям составить представление об анатомии человека и его органах. Вместе с тем придумать в своей компьютерной классификации названия органов, аналогичные классической врачебной терминологии, компьютеры не смогут. Поэтому им на первых порах требуется переводчик с внутреннего машинного словаря на профессиональную лексику.
Следует учитывать, что из-за нелинейности у многослойных нейросетей нет «обратной функции», т.е. компьютер в общем случает не сможет объяснить человеку, почему он пришел к такому выводу. Для подготовки мотивированного суждения нужен человек-эксперт, либо, как ни парадоксально, другая нейросеть, натренированная на задачи написания корректных расшифровок и заключений на естественном человеческом языке.
Метод обучения с учителем более удобен и предпочтителен в тех ситуациях, когда есть накопленные и достоверные ретроспективные исходных данные: обучение на их основе требует меньших затрат времени и позволяет быстрее получать работающее ИИ-решение. Там, где возможность использования базы данных с сопоставленной информацией и ответами на нее отсутствует, необходимо применять методы самообучения на основе глубокого машинного обучения – такие решения не будут нуждаться в надзоре человека.
Представляется, что исследователям и стартапам, только начинающим знакомиться с ИИ и ищущим возможности его применения в здравоохранении, целесообразно начать именно с методов машинного обучения с учителем. Это потребует меньше затрат (временных, финансовых) на создание прототипа работающей системы и практическое освоение методик ИИ. Функционирующую систему ИИ под конкретную задачу в этом случае можно получить быстрее. В настоящее время на рынке представлено большое число качественных библиотек программного кода для искусственных нейросетей, таких как TensorFlow https://www.tensorflow.org/ для математического моделирования, OpenCV http://opencv.org/ для задач распознавания изображений, поставляемых бесплатно, по лицензии «свободное программное обеспечение».
Кроме практического эффекта – повышенной точности, которая сегодня может достигать 95%, системы ИИ обладают еще одним преимуществом: у них высокая скорость обработки данных. Неоднократно проводились эксперименты, например, по распознаванию образов с разных ракурсов, в которых соревновались человек и компьютер. Пока темп показа изображений был невысокий – 1–2 кадра в минуту, человек выигрывал у машины. При анализе изображений патологии ошибка человека составляла не более 3,5%, а компьютер давал ошибку диагностики 7,5%. Однако при повышении темпа до 10 кадров в минуту и более у человека ослабевала реакция, наступала утомляемость, что приводило к браку в работе. Компьютер же непрерывно учился на своих ошибках и в следующей серии только повышал точность результата. Перспективным оказался режим парной работы человека и компьютера, при котором удалось повысить точность диагностики на 85% на относительно высокой для человека скорости демонстрации изображений [5].
Разумеется, нельзя говорить об эффективном построении моделей ИИ и их точности, если отсутствует необходимая отечественная оцифрованная информация для их обучения. Поэтому критически важно, пусть даже в режиме неполного отказа от классического бумажного документооборота, а дублирования медицинского документооборота и в бумажной, и в электронной форме, начинать накапливать российские банки электронных данных. Нужно, кроме того, обеспечить возможность использования таких данных в обезличенном виде, без разглашения персональных данных пациентов, для создания и совершенствования отечественных ИИ-решений.
Чем отличается создание ИИ от обычной разработки программного обеспечения?
Главное отличие методов искусственного интеллекта от обычного программирования состоит в том, что при создании ИИ программисту не нужно знать все зависимости между входными параметрами и тем результатом, который должен получиться (ответом). Там, где такие зависимости хорошо известны или где есть надежная математическая модель, например, расчет статистического отчета или формирование реестра на оплату медицинской помощи, вряд ли стоит искать применение искусственному интеллекту – современные программные продукты справляются с задачей пока лучше, надежнее и в приемлемое время.
Технология глубокого машинного обучения эффективна там, где нельзя задать четкие правила, формулы и алгоритмы для решения задачи, например, есть ли на рентгенологическом снимке патология? Эта технология предполагает, что вместо создания программ для расчета заранее заданных формул машину обучают с помощью большого количества данных и различных методов, которые дают ей возможность выявить эту формулу на основе эмпирических данных и тем самым научиться выполнять задачу в будущем. При этом команда разработчиков трудится именно над подготовкой данных и обучением, а не над попыткой написать программу, которая будет как-то анализировать снимок по заранее заданным алгоритмам и получать ответ, есть на нем аномалия или нет.
Появился целый класс информационных систем, получивших обозначение «IT+DT+AI+IOT», или Цифровые платформы, построенных на данной парадигме. Сокращение «IT» в них обозначает всеобщую цифровизацию процессов и компьютеризацию рабочих мест, «DT» – накопление данных и использование технологий мощной обработки информации, а «AI» говорит о том, что на накопленных данных будут создаваться роботизированные алгоритмы ИИ, которые будут действовать как в партнерстве с человеком, так и самостоятельно. Сокращение «IOT» означает «интернет вещей» (internet of things) – вычислительную сеть, состоящую из физических предметов («вещей»), оснащенных встроенными технологиями для взаимодействия друг с другом или с внешней средой. Создание цифровых платформ для нужд здравоохранения стоит в числе стратегических приоритетных задач перед развитыми экономиками мира, включая Россию [17].
Риски и опасения, связанные с ИИ
Вместе с лавинообразным ростом публикаций относительно перспектив ИИ и появления все новых и новых примеров создания ИТ-решений на его основе усиливаются опасения, связанные с последствиями, которые могут наступить в ближайшие годы и десятилетия вследствие их внедрения. Опасения экспертов заключаются в том, что, хотя искусственный интеллект и принесет радикальное повышение эффективности в различных сферах жизнедеятельности, для простых людей внедрение соответствующих технологий чревато безработицей и неопределенностью в карьере, поскольку «человеческие» рабочие места будут заменяться машинами. По мнению профессора Стивена Хокинга, «автоматизация ускорит и без того растущее экономическое неравенство во всем мире … Интернет и платформы, которые делают это возможным, позволяют небольшим группам людей получать огромные прибыли при использовании очень небольшого количества помощников. Это неизбежно, это прогресс, но он также является социально разрушительным» [14].
И такие опасения возникают не на пустом месте. Например, американская компания Goldman Sachs уже заменила трейдеров, занимавшихся торговлей акциями по поручению крупных клиентов банка, на автоматически работающий бот на базе ИИ. Сейчас из 600 человек, работавших в 2000 г., осталось два – остальных заменили торговые роботы, к обслуживанию которых привлечено 200 инженеров. На электронной площадке Amazon арбитражем взаимных претензий покупателей и продавцов товаров занимаются программы-роботы. Они обрабатывают свыше 60 млн. претензий в год, что почти в 3 раза больше числа всех поданных исков через традиционную судебную систему США.
Разумным видятся аргументы сторонников умеренного внедрения ИИ и роботов, которые предлагают сдерживать темп их внедрения т.н. «налогом на роботов». Собираемые с каждого нового роботизированного рабочего места налоги могли бы пойти на финансирование программ обучения, переквалификации и трудоустройства высвобождаемых сотрудников.
Вероятно, такие же перемены следует ожидать и в сфере здравоохранения, хотя для нашей страны, возможно, это будет в чем-то даже благом, учитывая серьезную проблему кадрового дефицита, огромную территорию и низкую плотность населения.
Какие именно задачи можно поручать ИИ?
Andrew Ng, лидер команды Google Brain (Google Brain team) и бывший директор Лаборатории искусственного интеллекта Стэнфорда (Stanford Artificial Intelligence Laboratory), говорит о том, что в настоящее время СМИ и шумиха вокруг ИИ иногда придают этим технологиям нереалистическую силу. На самом деле реальные возможности применения ИИ достаточно ограничены: современный ИИ пока способен давать точные ответы лишь на простые вопросы [3].
Совместно с большим объемом исходных данных для обучения, именно реальная и посильная постановка задачи является важнейшим условием будущего успеха или провала ИИ-проекта. Пока ИИ не может решать сложные задачи, непосильные и врачу, вроде создания фантастического прибора, самостоятельно сканирующего человека и способного поставить ему любой диагноз и назначить эффективное лечение. Сейчас ИИ, скорее, позволяет решать более простые задачи, например, оценить, присутствует ли инородное тело или патология на рентгенологическом снимке или ультразвуковом изображении, имеются ли раковые клетки в цитологическом материале и т.д. Но неуклонный рост точности диагностики посредством ИИ-модулей заставляет задуматься. В публикациях уже заявлялось о полученных значениях точности ИИ в 93% при обработке радиологических изображений, МРТ, маммограмм, пренатальных УЗИ, в 94,5% при диагностике туберкулеза, в 96,5% при предсказании язвенных инцидентов [16]. По мнению эксперта Andrew Ng, реальные возможности ИИ на данное время можно оценить таким простым правилом: «Если обычный человек может выполнить мысленную задачу за секунды, то, вероятно, мы можем автоматизировать ее с помощью ИИ или сейчас, или в ближайшем будущем» [3].
Конкретные алгоритмы или даже решения – не самое главное в успехе ИИ в медицине. Примеры перспективных идей публикуются открыто, а программное обеспечение уже сейчас доступно по модели СПО. Например, DeepLearning4j (DL4J) – https://deeplearning4j.org/, Theano - http://deeplearning.net/software/theano/ , Torch – http://torch.ch/ , Caffe – http://caffe.berkeleyvision.org/ и ряд других.
Интересным подходом к разработке ИИ-решений является подход краудсорсинга – посредством коллективного экспертного обсуждения. Так на площадке Kaggle https://www.kaggle.com/ в 2017 г. зарегистрировано свыше 40 тыс. экспертов- «датасциентистов» со всего мира, которые решают задачи ИИ, поставленные коммерческими и общественными организациями. Качество полученных решений порой бывает выше качества разработок коммерческих компаний. Участники с площадки зачастую мотивированы не денежным призом (его может и не быть) за успешное решение проблемы, а профессиональным интересом к задаче и повышением своего личного рейтинга как эксперта. Краудсорсинг позволяет экономить финансы и время разработчиков и заказчиков, только начинающих работать с ИИ.
На самом деле, существует только два основных барьера на пути массового применения ИИ в здравоохранении: потребность в большом количестве данных для обучения и профессиональном и креативном подходе к тренировке ИИ. Без выверенных и качественных данных ИИ не будет работать, без талантливых людей простое применение готовых алгоритмов к подготовленным данным также не будет давать результат, т.к. ИИ необходимо настроить на понимание этих данных для решения конкретной прикладной задачи [3].
Искусственный интеллект в медицине и здравоохранении сегодня и завтра
Медицина и здравоохранение уже сегодня считаются одной из стратегических и перспективных областей с точки зрения эффективного внедрения ИИ. Использование ИИ может массово повысить точность диагностики, облегчить жизнь пациентам с различными заболеваниями, повысить скорость разработки и выпуска новых лекарств и т.д.
Пожалуй, самым крупным и наиболее обсуждаемым проектом применения ИИ в медицине является американская корпорация IBM и ее когнитивная система IBM Watson. Первоначально систему стали обучать и затем применять в онкологии, где IBM Watson уже длительное время помогает ставить точный диагноз и находить эффективный способ излечения для каждого пациента.
Для обучения ИИ IBM Watson было проанализировано 30 млрд. медицинских снимков, для чего корпорации IBM пришлось купить компанию Merge Healthcare за 1 млрд. долл. К этому потребовалось добавиться 50 млн. анонимных электронных медицинских карт, которые IBM получила в свое распоряжение, купив стартап Explorys [16]. В 2014 г. IBM объявила о сотрудничестве с Johnson & Johnson и фармацевтической компанией Sanofi с целью обучения Watson пониманию результатов научных исследований и клинических испытаний. По утверждению представителей компании, это позволит существенно сократить время клинических испытаний новых лекарств, а врачи смогут подбирать терапию, наиболее подходящую конкретному пациенту. В том же 2014 г. IBM объявила о разработке программного обеспечения Avicenna, позволяющего интерпретировать и текст, и изображения. Для каждого типа данных используются свои алгоритмы. Avicenna сможет понимать медицинские снимки и записи и будет выполнять функции ассистента радиолога. Над похожей задачей ведется работа в рамках другого проекта IBM – Medical Sieve. В данном случае речь идет о развитии искусственного интеллекта «медицинского ассистента», который сможет быстро анализировать сотни снимков на предмет отклонения от нормы. Это поможет радиологам и кардиологам заняться теми вопросами, в которых искусственный интеллект пока бессилен [16].
Недавно разработчики IBM совместно с Американской кардиологической ассоциацией приняли решение расширить возможности Watson, предложив помощь системы и кардиологам. По задумке авторов проекта, когнитивная облачная платформа будет анализировать огромное количество медицинских данных, имеющих отношение к тому либо иному пациенту. В число этих данных входят изображения УЗИ, рентгеновские снимки и вся прочая графическая информация, позволяющая уточнить диагноз. В самом начале возможности Watson будут использоваться для поиска признаков стеноза аортального сердечного клапана. При стенозе отверстие аорты сужается за счет сращивания створок ее клапана, что препятствует нормальному току крови из левого желудочка в аорту. Проблема состоит в том, что выявить стеноз клапана непросто, несмотря на то, что это очень распространенный порок сердца у взрослых (70–85% случаев среди всех пороков). Watson попытается определить, что он «видит» на медицинских изображениях: стеноз, опухоль, очаг инфекции или просто анатомическую аномалию – и дать соответствующую оценку лечащему врачу, чтобы ускорить и повысит качество его работы [10].
Врачи Boston Children’s Hospital, занимающиеся редкими детскими болезнями, используют IBM Watson, чтобы ставить более точные диагнозы: искусственный интеллект будет искать необходимую информацию в клинических базах данных и научных журналах, которые хранятся в медицинском облаке Watson Health Cloud [16].
Следует отметить, что проект Watson, как и любой новаторский продукт, не ставил перед создателями явные экономические цели. Затраты на разработку его компонентов обычно превышали плановые, а его содержание весьма обременительно, если сравнивать с традиционными бюджетами в здравоохранении. Скорее, его можно рассматривать как некий испытательный полигон, на котором можно обкатывать перспективные ИТ-технологии и вдохновлять исследователей. Проверенные и испытанные прототипы следует переводить в серийное производство, добиваясь более высоких показателей по критерию цена–качество и пригодности к эксплуатации в реальных условиях. Почти на каждой конференции по ИИ сегодня звучат доклады от исследователей стран мира с заявлениями «Мы делаем свой Watson, и он будет лучше оригинала».
Весной 2017 г. в журнале Nature появилась публикация о технологии, которая позволяет с помощью машинного обучения распознавать у людей рак кожи [9]. С помощью системы искусственного интеллекта Emergent исследователям удалось выявить пять новых биомаркеров, на которые могут быть нацелены новые лекарства при лечении глаукомы. По словам ученых, для этого в систему ИИ вводится информация о более чем 600 тыс. специфических последовательностей ДНК 2,3 тыс. пациентов и данные о генных взаимодействиях [16].
Проект DeepMind Health, который ведет британская компания, входящая в состав Google, создала систему, которая способна за несколько минут обработать сотни тысяч медицинских записей и выделять из них нужную информацию. Хотя этот проект, основанный на систематизации данных и машинном обучении, находится еще на ранней стадии, DeepMind уже сотрудничает с Глазной больницей Мурфильдса (Великобритания) с целью повышения качества лечения. Используя миллион анонимных полученных с помощью томографа изображений глаз, исследователи стараются создать алгоритмы на базе технологий машинного обучения, которые бы помогали обнаруживать ранние признаки двух глазных заболеваний – влажной возрастной макулярной дистрофии и диабетической ретинопатии. Похожими исследованиями занимается и другая компания, входящая в Google, – Verily. Специалисты этой фирмы используют искусственный интеллект и алгоритмы поисковика Google, для того чтобы проанализировать, что же делает человека здоровым [11].
Израильская компания MedyMatch Technology, в штате которой насчитывается всего 20 человек, разработала на базе ИИ и Big Data решение, благодаря которому врачи могут точнее диагностировать инсульт. Для этого в режиме реального времени система MedyMatch сравнивает снимок мозга пациента с сотнями тысяч других снимков, которые есть в ее «облаке». Известно, что инсульт может быть вызван двумя причинами: кровоизлиянием в головной мозг и тромбом. Соответственно, каждый из этих случаев требует разного подхода в лечении. Однако, по статистике, несмотря на улучшение в области КТ, количество ошибок при постановке диагноза за последние 30 лет не изменилось и составляет приблизительно 30%. То есть, почти в каждом третьем случае врач назначает пациенту неверное лечение, что приводит к печальным последствиям. Система MedyMatch способна отследить мельчайшие отклонения от нормы, которые не всегда может заметить специалист, таким образом сводя вероятность ошибки в постановке диагноза и назначении лечения к минимуму [16].
Все больше внимания в последнее время уделяется применению технологии ИИ не только при создании решений для врачей, но и для пациентов. Примером может служить мобильное приложение британской компании Your.MD, запуск которого произошел в ноябре 2015 г. Эта программа использует технологии ИИ, машинного обучения и обработки естественного языка. В результате пациент может просто сказать, к примеру: «У меня болит голова»,– и получить от смартфона рекомендации по последующим действиям и экспертный совет. Для этого система искусственного интеллекта Your.MD подключена к самой большой в мире карте симптомов, созданной Your.MD: в ней учтено 1,4 млн. симптомов, на идентификацию которых потребовалось более 350 тыс. часов. Каждый симптом был проверен специалистом британской системы здравоохранения. Искусственный интеллект выбирает наиболее подходящий симптом, основываясь на уникальном профиле владельца смартфона [16].
Другая компания, Medtronic, предлагает приложение, позволяющее предсказать критическое снижение уровня сахара в крови за три часа до события. Для этого Medtronic совместно с IBM используют технологии когнитивной аналитики к данным глюкометров и инсулиновых помп. С помощью приложения люди смогут лучше понимать влияние ежедневной активности на диабет. В рамках еще одного интересного проекта IBM, на этот раз совместного с диагностической компанией Pathway Genomics, создано приложение OME, объединяющее когнитивную и прецизионную медицину с генетикой. Цель приложения – предоставить пользователям персонализированную информацию для повышения качества жизни. Первая версия приложения включает в себя рекомендации по диете и упражнениям, сведения по метаболизму, которые зависят от генетических данных пользователя, карту с информацией о привычках пользователя и состоянии его здоровья. В будущем в приложение будут добавлены электронные медицинские карты, информация о страховке и другие дополнительные сведения [16].
Помимо прямого клинического применения, элементы ИИ могут быть использованы во вспомогательных процессах медицинской организации. Например, уместным будет использовать ИИ при автоматической диагностике качества работы медицинской информационной системы, в вопросах обеспечения информационной безопасности. Системы ИИ могут помочь с выдачей рекомендаций по своевременной настройке справочников, тарифов или даже заметить аномальное поведение сотрудника и порекомендовать его руководителю направить его на обучение работе с системой, так как возникли подозрения в его невысоком профессионализме и замедленной реакции.
Подытоживая сказанное, считаем, что уже в недалеком будущем в здравоохранении при помощи ИИ будут применяться следующие инновационные процессы.
1. Автоматизированные методы диагностики, например, анализ рентгенологических или МРТ-снимков на предмет автоматического выявления патологии, микроскопический анализ биологического материала, автоматическое кодирование ЭКГ, электроэнцефалограмм и т.д. Хранение большого количества расшифрованных результатов диагностического обследования в электронном виде, когда имеются не только сами данные, но и формализованное заключение по ним, позволяет создавать действительно надежные и ценные программные продукты, способные если не заменить врача, то оказать ему эффективную помощь, например, при выявлении рутинной патологии, сокращать время и стоимость обследования, внедрять аутсорсинг и дистанционную диагностику.
2. Системы распознавания речи и понимания естественного языка могут оказать существенную помощь как врачу, так и пациенту. Начиная от уже обычной расшифровки речи и превращения ее в текст в качестве более продвинутого интерфейса общения с медицинскими информационными системами (МИС), обращения в Call-центр или голосового помощника до таких идей, как автоматический языковой перевод при поступлении иностранца, синтез речи при прочтении записей из МИС, робот-регистратор в приемном отделении больницы или регистратуре поликлиники, способный отвечать на простые вопросы и маршрутизировать пациентов и т.д.
3. Системы анализа и предсказания событий также являются вполне решаемыми уже сейчас задачами ИИ, и они могут дать существенный эффект. Например, оперативный анализ изменений заболеваемости позволяет быстро предсказывать изменение обращаемости пациентов в медицинские организации или потребность в лекарственных препаратах.
4. Системы автоматической классификации и сверки информации помогают связать информацию о пациенте, находящуюся в различных формах в различных информационных системах. Например, можно будет построить интегральную электронную медицинскую карту из отдельных эпизодов, описанных с разной детализацией, без четкого или противоречивого структурирования информации. Перспективной является технология машинного анализа содержимого контента социальных сетей, интернет-порталов с целью быстрого получения социологической, демографической, маркетинговой информации о качестве работы системы здравоохранения и отдельных лечебных учреждений.
5. Автоматические чат-боты для поддержки пациентов могут оказать существенную помощь в приобщении пациентов к здоровому образу жизни и следовании назначенному лечению. Уже сейчас чат-боты могут научиться отвечать на рутинные вопросы, подсказывать тактику поведения пациентов в простых ситуациях, соединять пациента с нужным врачом средствами телемедицины, давать рекомендации по диете и т.д. Такое развитие здравоохранения в сторону самообслуживания и большей вовлеченности пациентов в охрану собственного здоровья без визита к врачу может сэкономить значительные финансовые ресурсы.
6. Развитие робототехники и мехатроники. Всем известный робот-хирург DaVinci – это лишь первый шаг в сторону если не замены врача машиной, то как минимум повышения качества работы медицинских сотрудников. Интеграция робототехники с ИИ рассматривается сейчас как одно из перспективных направлений, благодаря которому можно будет переложить на машины рутинные манипуляции – в том числе и в медицине.
Безусловно, когда речь идет о здоровье человека, важен принцип «не навреди», реализация которого предполагает жесткое нормативно-правовое поле и тщательную доказательную базу при внедрении новых технологий. Но стоит ли заранее относиться к новым технологиям со скепсисом и отрицать их возможное в будущем практическое применение, игнорируя очевидные успехи? Следует признать, что в XXI столетии ИИ как технология будет оказывать наибольшее преобразующее влияние на нашу жизнь, из того пакета технологий, которые мы применяем в медицинской профессии.
Литература
1. Искусственный интеллект (ИИ) / Artificial Intelligence (AI) как ключевой фактор цифровизации глобальной экономики // URL: https://www.crn.ru/news/detail.php?ID=117544 (дата обращения 06.03.2017)
2. Сверхразум как бизнес-идея // URL: http://fastsalttimes.com/sections/technology/865.html (дата обращения 07.03.2017)
3. Andrew Ng. What Artificial Intelligence Can and Can’t Do Right Now // Harvard Business Review. URL: https://hbr.org/2016/11/what-artificial-intelligence-can-and-cant-do-right-now (дата обращения 03.05.2017)
4. Poker-Playing Engineers Take on AI Machine - And Get Thrashed // URL: https://www.bloomberg.com/news/articles/2017-04-10/poker-ai-again-trounces-human-challengers-from-china-this-time (дата обращения 03.05.2017)
5. From coding to cancer: How AI is changing medicine - NBR, CNBC.com // URL: http://nbr.com/2017/05/11/from-coding-to-cancer-how-ai-is-changing-medicine/
(дата обращения 14.05.2017)
6. Microsoft Build 2017: Microsoft AI – Amplify human ingenuity // URL: https://blogs.microsoft.com/blog/2017/05/10/microsoft-build-2017-microsoft-ai-amplify-human-ingenuity/#sm.0000wf98mzy2dfiyr722jwsyktgq6 (дата обращения 14.05.2017)
7. Создана самая большая нейронная сеть, предназначенная для реализации технологий искусственного интеллекта // URL: http://www.dailytechinfo.org/infotech/7173-sozdana-samaya-bolshaya-neyronnaya-set-prednaznachennaya-dlya-realizacii-tehnologiy-iskusstvennogo-intellekta.html (дата обращения 10.05.2017)
8. Стельмах С. Рынок технологий искусственного интеллекта будет ежегодно расти на 54% // URL: https://www.pcweek.ru/ai/article/detail.php?ID=194039 (дата обращения 10.04.2017)
9. Dermatologist-level classification of skin cancer with deep neural networks // URL: http://www.nature.com/nature/journal/v542/n7639/full/nature21056.html (дата обращения 29.04.2017)
10. Когнитивная система Watson поможет врачам поставить точный диагноз пациентам с заболеваниями сердца // URL: https://geektimes.ru/company/ibm/blog/287100/ (дата обращения 02.04.2017)
11. 7 лучших систем искусственного интеллекта для обработки медицинской информации // URL: http://evercare.ru/7best-ai (дата обращения 03.04.2017)
12. Нейрон // URL: https://ru.wikipedia.org/wiki/Нейрон (дата обращения 02.05.2017)
13. Введение в глубинное обучение // URL: https://proglib.io/p/intro-to-deep-learning/ (дата обращения 03.05.2017)
14. Stephen Hawking: Automation and AI is going to decimate middle class jobs // URL: http://www.businessinsider.com/stephen-hawking-ai-automation-middle-class-jobs-most-dangerous-moment-humanity-2016-12 (дата обращения 04.05.2017)
15. Amazon's Jeff Bezos constantly reminds his workers about the biggest enemy: 'Irrelevance. Followed by excruciating, painful decline.' // URL: http://www.businessinsider.com/read-amazon-ceo-jeff-bezos-2016-letter-to-shareholders-2017-4 (дата обращения 04.05.2017)
16. Utilizing Predictive Models for Evaluation of a Patient Medical Profile to Predict an Individual Pressure Ulcer Risk Assessment // URL: http://www.ehob.com/img/documents/document_123.pdf (дата обращения 14.05.2017)
17. Указ Президента Российской Федерации от 09.05.2017 г № 203 «О Стратегии развития информационного общества в Российской Федерации на 2017 - 2030 годы» // URL: http://publication.pravo.gov.ru/Document/View/0001201705100002 (дата обращения 14.05.2017)
18. Искусственный интеллект в медицине: главные тренды в мире // URL: https://medaboutme.ru/zdorove/publikacii/stati/sovety_vracha/iskusstvennyy_intellekt_v_meditsine_glavnye_trendy_v_mire/ (дата обращения 05.05.2017)
_______________________________________
ГУСЕВ Александр Владимирович
Кандидат технических наук, заместитель директора по развитию компании «Комплексные медицинские информационные системы» (К-МИС)
ДОБРИДНЮК Сергей Леонидович
Директор по исследованиям и инновациям компании «Диасофт Системы»
© Информационное общество, 2017, вып. 4-5, с. 78-93.