О журнале
Рекомендации
Инфокоммуникационное обеспечение исследовательского центра: задачи и инфраструктура
Щур Л.Н., Меньшутин А.Ю., Шикота С.К.
задачи и инфраструктура
___________________
Щур Л.Н., Меньшутин А.Ю., Шикота С.К.
Статья рекомендована Ю.Е. Хохловым 27.10.2011
Аннотация
Статья посвящена проблеме обеспечения коллективов исследовательских центров современными информационными, вычислительными и телекоммуникационными технологическими средствами. Выделены основные задачи, которые необходимы для решения этой проблемы – как технические, так и организационные. Кратко обсуждается необходимая для решения проблемы программно-аппаратная инфраструктура.
Ключевые слова: информационное развитие, исследовательский центр, научно-образовательный центр, инфокоммуникационные технологии, распределенные системы совместной работы, программно-аппаратная инфраструктура
Актуальность проблемы
Наблюдаемый в последние годы процесс глобализации разных видов деятельности требует новых средств для обеспечения выполнения работ. Само развитие процесса глобализации неразрывно связано с развитием информационных и телекоммуникационных технологий. Очевидно, что два эти процесса, глобализации и информационного развития, имеют сильное взаимовлияние. Научная деятельность – по сути, глобальный процесс, и ее зависимость от успешного развития и внедрения современных технологий особенно сильна. Именно в научной среде была разработана и внедрена концепция всемирной паутины, которая сегодня составляет основу всей современной сети Интернет.
Научные идеи оказали сильное влияние на современный рынок программного обеспечения. Сегодня заметную долю разрабатываемого программного обеспечения составляет свободно распространяемое программное обеспечение (СПО) [1]. СПО – это некоммерческие программы, находящиеся в свободном доступе, причем их исходный код открыт и может быть модифицирован при соблюдении достаточно разумных условий. Главные преимущества для пользователя при использовании СПО – возможность экономии средств на лицензионных отчислениях, возможность доработки программного обеспечения под свои потребности и возможность использования готовых компонентов для создания своих собственных программных систем и комплексов. Такие преимущества позволяют легко и достаточно быстро создавать сложные многокомпонентные системы, потребность в которых в научной среде особенно высока.
Научно-исследовательский центр состоит из научных коллективов (лабораторий, секторов и т.п. научных подразделений), проводящих исследования в конкретных областях наук. В настоящей работе мы ограничимся анализом обеспечения работы научных коллективов как элементарного элемента более сложного организма – научно-исследовательского или научно-образовательного центра. На уровне центра существенны дополнительные, а также интегрирующие специализированные технологии. В то же время обсуждение инфокоммуникационного обеспечения интеграции научных коллективов в научно-исследовательский и научно-образовательный центры выходит за рамки настоящей работы, и мы оставляем его для будущего рассмотрения.
Можно выделить два подхода к решению проблемы обеспечения научных коллективов современными информационными технологиями.
Первый подход – это объединение различных ресурсов исследовательских центров или лабораторий в виртуальную организацию для совместного использования имеющихся ресурсов. В качестве примера можно привести концепцию Грид [2], в основе которой лежит именно задача обеспечения работы распределенных коллективов. Основная идея концепции Грид состоит в создании программного инструментария и аппаратной инфраструктуры, которые обеспечили бы условия работы виртуального коллектива вне зависимости от географического расположения членов коллектива, их административной принадлежности и организационной структуры частей коллектива. Система Грид обеспечивает прозрачное и удобное использование всех объединенных аппаратных и программных ресурсов для членов виртуального коллектива и закрывает доступ к этим ресурсам для всех посторонних.
Второй подход – это создание готовой инфраструктуры для предметной области, в которой любой пользователь имеет возможность удаленного использования ресурсов, созданных и поддерживаемых третьей стороной. Так, популярный проект NanoHub американского Национального научного фонда (NSF) по созданию среды для вычислительных нанотехнологий [3] относится ко второму типу. Основная идея подхода – создание вычислительных и информационных ресурсов по определенной предметной области. Эти ресурсы на сегодняшний день базируются на облачной технологии вычисления и хранения информации и доступа к ним через специальный интерфейс.
В рамках такого подхода пользователь должен иметь только современный браузер и доступ в интернет для работы с программным обеспечением, запускаемым где-то в сети поставщика услуги.
Таким образом, в первом случае мы имеем механизм для создания виртуального коллектива, а во втором случае – механизм для использования коллективного ресурса.
В настоящей работе мы анализируем мероприятия, которые необходимо провести для создания современной информационной инфраструктуры для поддержки и обеспечения работы научного коллектива. Как будет видно из обсуждения, такая система должна включать в себя, в частности, и оба упомянутых выше механизма. Анализируя состав естественнонаучной деятельности, мы формулируем требования к программным и аппаратным средствам комплекса современной исследовательской лаборатории.
Постановка задачи
Обозначим основные проблемы и задачи, возникающие при проведении научных исследований:
1) задача поддержания высокого темпа проводимых исследований с целью достижения их конкурентоспособности предполагает быстрое распространение информации в научной среде посредством электронных публикаций и материалов конференций, приводит к их быстрому использованию другими коллективами, особенно в хорошо финансируемых областях естественных наук (энергетика, новые материалы, микроэлектроника); для конкурентоспособности необходим эффективный доступ к информации, а также высокий темп проведения исследований, который можно поддерживать с применением новых инфокоммуникационных средств поддержки работы коллектива;
2) проблема глобальности процесса научных исследований требует поддерживать международное сотрудничество, для чего необходимы эффективные средства поддержки работы виртуальных коллективов;
3) проблема воспроизводства научных кадров, то есть осуществления процесса обучения как на уровне студентов старших курсов, так и на уровне практикантов и аспирантов, важна для организации процесса обучения в новых условиях с повышенным темпом накопления и обновления информации, для чего необходима разработка и внедрение соответствующих инфокоммуникационных средств;
4) задача достижения критической массы коллектива для его успешной и конкурентной научной деятельности: существует связь между размером научного коллектива и его успешностью [4]. Оказывается, успешные и устойчиво развивающиеся научные коллективы имеют численность его членов выше некоторого значения, «критической массы» коллектива. Это значение различается для разных областей естественных наук. Средства обеспечения работы виртуальных коллективов могут эффективно увеличить критическую массу за счет объединения лабораторий в виртуальный коллектив со сверхкритической массой и обеспечить ему успешное функционирование;
5) задача автоматизации операций научных исследований предполагает сбор и генерирование данных, их обработка, анализ и визуализация, что очевидно требует применения высокоэффективных инфокоммуникационных технологий.
Применение современных инфокоммуникационных технологий позволяет решить все перечисленные проблемы и сделать исследование эффективным. Обработка данных в электронном виде, доступ к современной литературе, электронные учебные курсы — все эти элементы существуют по отдельности, но часто плохо стыкуются между собой.
Основная задача состоит в обеспечении научно-исследовательского коллектива инфокоммуникационной системой, интегрирующей в себе через единый интерфейс информационные, телекоммуникационные и вычислительные ресурсы, необходимые для успешной научной деятельности исследовательского коллектива.
Научная деятельность коллектива
Как отмечается в исследовании инфраструктуры для е-науки [5], в настоящее время отсутствует точный набор требований для нее, поскольку не существует до конца реализованного и опробованного проекта, – поэтому лучший на сегодня вариант состоит в том, чтобы обсуждать применение моделей, инструментов и технологий в рамках сценариев деятельности. Преимущество подхода на основе сценариев состоит в возможности выстраивания логики взаимодействия элементарных действий при осуществлении научной деятельности. Сценарий, по сути, представляет собой блок-схему процесса выполнения некоторой «сценарной» задачи и относительно легко отображается на модели, инструментах и технологии. Неудивительно, что сценарии обсуждают методы и инструменты, но не собственно элементы научной деятельности. Недостаток сценарного подхода состоит в том, что сценарий будет навязывать способ осуществления реально проводимой научной деятельности и, таким образом, влиять на стиль работы научного коллектива.
Стиль научной работы определяется как предметной областью, так и культурными особенностями, а также законодательной базой и административными подходами. Важно, что необходим этап, предваряющий формулировку сценария: нужно провести анализ научной деятельности, разложить ее на элементарные операции, которые следует учесть в формулировке сценариев. Иными словами, – разложить научную деятельность на составляющие, определить методы и технологии для каждой из составляющих, и лишь затем построить из них сценарий.
Предлагаемая нами методика состоит в анализе составляющих научной деятельности, подборе компонентов программного и аппаратного обеспечения этих составляющих, адаптации и/или доработки компонентов СПО для конкретных целей, и, наконец, синтеза этих составляющих в единый программно-аппаратный комплекс исследовательского центра.
Научная деятельность в области естественных наук может быть разложена на следующие составляющие:
- научная деятельность члена научного коллектива, в том числе:
- реализация экспериментальных исследований;
- осуществление теоретических исследований;
- проведение вычислений, численных экспериментов и моделирования;
- обработка результатов вычислений, их визуализация;
- обсуждение текущей научной работы на семинарах научного коллектива;
- подготовка научных статей, научных отчетов, устных и стендовых докладов, презентаций;
- общение с коллегами из других коллективов;
- участие в семинарах и конференциях в качестве докладчика и слушателя;
- написание заявок в научные фонды на проведение научных работ и конференций;
- преподавательская деятельность члена научного коллектива:
- подготовка учебных материалов – лекций, методических пособий;
- чтение лекций и проведение семинаров;
- научная работа со студентами и аспирантами;
- административная деятельность члена научного коллектива:
- участие в научных советах;
- реферирование статей, экспертиза грантов, заявок и т.п.;
- решение текущих административных вопросов – финансирование, материальное обеспечение исследований.
Перечень не отражает важность и значение составляющих, причем в ряде научных коллективов некоторые составляющие могут отсутствовать, в то время как значимыми могут быть и некоторые другие, не приведенные выше.
Необходимо осуществить исследования по составу и характеру научной деятельности коллектива с целью выявления общих и важных черт научной деятельности для дальнейшего использования результатов при проектировании востребованных компонентов инфокоммуникационных систем.
При реализации системы для конкретного научного коллектива необходимо в первую очередь провести отбор основных видов деятельности. Далее необходимо провести выбор подходящих компонентов из существующего СПО и его адаптацию или модернизацию для решения конкретного набора задач. И наконец, – провести интеграцию компонентов в единую инфокоммуникационную систему научного коллектива.
Для реализации поставленных задач можно применить такие элементы ИКТ, как: электронная почта, различные системы видеоконференц-связи (программные – Skype, AccessGrid, EVO, аппаратные системы – Polycom и Tandberg), вычислительные ресурсы, принадлежащие коллективу/организации или доступные посредством GRID-технологий, Web 2.0 сервисы – GoogleDocs, научные блоги, Wiki и многое другое.
Компоненты ИКТ
Применение инфокоммуникационных технологий эффективно в случае их адресного приложения. Каждая область деятельности имеет свои специфические черты, несмотря на то, что имеется похожесть многих аспектов деятельности в разных областях. Эта похожесть упрощает задачу поиска компонентов системы. При этом отобранные компоненты системы подвергаются необходимой доработке и настройке. Будучи собрана из отдельных локализованных компонентов, система в целом будет решать специфические задачи конкретной области человеческой деятельности.
Для инфокоммуникационного обеспечения каждой из составляющих необходим выбор конкретных компонентов программного и аппаратного обеспечения. Обсуждение и их обзор выходят за рамки настоящей статьи, которая призвана обозначить рамки проблемы и пути ее решения. Приведенный список подчеркивает масштаб задачи. Для пояснения деталей мы приведем несколько примеров, иллюстрирующих идею нашего подхода.
Заметим, что для осуществления скоординированной деятельности научного коллектива, работающего над конкретной проблемой, и научно-исследовательского центра в целом необходима система, которая обеспечивает совместную работу над проектами и документами, включая поддержку версий документов, контроль даты этапов проекта, а также имеет систему генерации отчетов. Пример такой системы – Egroupware [6]. Для обеспечения проведения семинаров, групповых обсуждений научного коллектива и участия в конференциях может быть использована, например, система AccessGrid [7].
Практически для каждой из вышеперечисленных составляющих научной деятельности исследовательского коллектива имеется богатый выбор компонентов свободно распространяемого программного обеспечения. Однако интеграция разнородных компонентов в единую систему – это задача чрезвычайно высокого уровня сложности, так как в этом случае возникают вопросы отсутствия единых интерфейсов и протоколов.
Аппаратные решения в настоящее время включают в себя использование рабочих станций, вычислительных кластеров и персональных систем. По-видимому, весьма перспективен «облачный» подход для большей части аппаратного и программного обеспечения, так как он позволит сократить издержки и упростить использование различных ресурсов. Необходимым элементом для успешности проекта в целом является также наличие развитой скоростной телекоммуникационной инфраструктуры.
Синтез указанных компонентов с точки зрения пользователя может быть осуществлен с применением веб-ориентированного подхода с привлечением облачных технологий. Использование облачных технологий уровня PaaS (Platform as a Service – платформа как услуга), когда пользователю предоставлен доступ к платформе, для которой он сам может разрабатывать необходимые ему приложения – оптимальный вариант для создания научных систем, интегрирующих в себя различные компоненты. Системы более низкого уровня IaaS (Insfrastructue as a Service – инфраструктура как услуга) достаточно сложны для эффективного использования конечным пользователем, а системы более высокого уровня SaaS (Software as a Service – программное обеспечение как услуга) сложны для использования провайдером.
Несмотря на все сложности использования сервис-ориентированного подхода, он дает потребителям услуг много преимуществ. Часть услуг может использоваться в рамках концепции облачных технологий, что позволит сделать использование ресурсов более эффективным, позволит построить масштабируемую и более надежную систему. Другая часть услуг может быть реализована средствами и на основе ресурсов, принадлежащих самому пользователю.
Отдельные элементы развиваемого нами подхода апробированы в Научном центре РАН в Черноголовке и применяются для работы над научными проектами [8]. Так, для обмена информацией между сотрудниками отдела ПСИ НЦЧ РАН используется система коллективной работы Egroupware, которая позволяет хранить общий список контактов, работ, проектов, контролировать сроки их выполнения, рассылать уведомления и напоминания. Для организации общения в удаленном режиме с другими научными коллективами используется система AccessGrid. Доступ к вычислительным ресурсам, находящимся в сети НЦЧ РАН, организован с использованием системы очередей Torque, а использование единой файловой системы на кластерах позволяет пользователю запускать задачи на всех доступных ему ресурсах.
Выбор программно-аппаратных решений, обеспечивающих функционирование системы в целом, выходит за рамки настоящей статьи.
Заключение
В данной статье мы обсудили рамочный подход к проблеме интенсификации научной деятельности, проблеме повышения ее конкурентоспособности за счет внедрения новых инфокоммуникационных технологий. Это дает необходимую принципиальную возможность повысить вовлечение научного коллектива в мировую науку. Существенно, что система должна быть ориентирована на пользователя, научного сотрудника, аспиранта и студента. Такая постановка, однако, совсем не противоречит тому, что система в целом, с точки зрения информационных технологий, должна быть сервис-ориентированной. Синтез таких точек зрения должен быть признаком успешного проекта в целом.
Работа выполнена при поддержке Министерства образования и науки Российской Федерации, ГК № 07.514.11.4041.
Литература
1. Иванников В.П. Что такое СПО // Перспективные компьютерные системы: устройства, методы и концепции / Под ред. Р.Р. Назирова и Л.Н. Щура. Москва, 2011. С. 106-114.
2. Foster I., Kesselman C., Tuecke S. The anatomy of the grid: enabling scalable virtual organizaions // Int. J. High Performance Comp. Applications. 2001. V.15. No 3. P. 200-222.
3. McLennan M. The Hub Concept for Scientific Collaboration // URL: http://hubzero.org/resources/12
4. Kenna R., Berche B. Critical mass and the dependency of research quality on group size // Scientometrics. 2011. V. 86. P. 527-540.
5. De Roure D., Jennings N., Shadbolt N. Research Agenda for the Semantic Grid: A Future e-Science Infrastructure // Report commissioned for EPSRC/DTI Core e-Science Programme.
6. Проект EGroupware // URL: http://www.egroupware.org/
7. Проект AccessGrid // URL: http://www.accessgrid.org/
8. Проекты Отдела прикладных сетевых технологий НЦЧ РАН // URL: http://www.comphys.ru/projectsanr/
_______________________
Щур Лев Николаевич
Доктор физико-математических наук, профессор МФТИ
Заведующий сектором вычислительной физики Института теоретической физики им. Л.Д. Ландау РАН
Заведующий отделом прикладных сетевых исследований Научного центра РАН в Черноголовке
Меньшутин Антон Юрьевич
Кандидат физико-математических наук
Младший научный сотрудник Института теоретической физики им. Л.Д. Ландау РАН
Шикота Светлана Каликстовна
Программист отдела прикладных сетевых исследований Научного центра РАН в Черноголовке
© Информационное общество, 2011 вып. 4, с. 56-63 .