Проблема многоязычия в информационном обществе и новые интеллектуальные переводческие технологии
Колин К.К.

Проблема многоязычия в информационном обществе и новые интеллектуальные переводческие технологии

__________________________________

К.К. Колин, А.А. Хорошилов



Аннотация. Рассматривается проблема обеспечения многоязычия в лингвистическом пространстве глобального информационного общества. Показана ее связь с другими глобальными проблемами развития современной цивилизации и пути решения на основе созданных в России интеллектуальных технологий автоматизированного перевода текстов. Предлагается план мероприятий по реализации международного проекта, направленного на решение данной проблемы.

Ключевые слова: глобальные проблемы, информационная бедность, информационная культура, лингвистическая культура, машинный перевод, международное сотрудничество.

1. Актуальность проблемы

В начале 21-го века ЮНЕСКО введено новое понятие – «информационная бедность», которое характеризует положение информационно отсталых стран в мировом информационном пространстве и является одной из характеристик уровня их социального развития, а также качества жизни в этих странах. Борьба с информационной бедностью становится одной из глобальных проблем современности. Решение этой проблемы видится на пути развития системы образования и его опережающей информатизации. Только это может развить у людей новые информационные потребности, которые и должны послужить стимулом формирования новой информационной культуры общества.

Исследования показывают, что в ближайшие годы будет возрастать значение лингвистических аспектов информационной культуры личности, способностей человека получать и передавать информацию на тех языках, на которых представлены глобальные знания, а также осуществляются информационные коммуникации в деловой и повседневной жизни. Поэтому лингвистические аспекты проблемы информационного неравенства, вероятнее всего, будут обостряться и потребуют принятия специальных мер на уровне государственной политики отдельных стран и мирового сообщества в целом.

Проблема обеспечения многоязычия в современном обществе в последние годы объективно становится все более актуальной. Сегодня эту проблему следует квалифицировать не только как проблему развития культуры, но также и как стратегически важную глобальную проблему дальнейшего развития современной цивилизации. В качестве аргумента для этого вывода можно привести ссылки на следующие основные факторы.

Нарастание социальной и политической напряженности в современном мире, которое может быть остановлено лишь путем развития экономических, научно-образовательных и культурных связей между народами, говорящими на различных языках и поэтому еще недостаточно хорошо знающими и понимающими друг друга.

Развитие процессов глобализации общества и связанных с этим процессов развития сетевой экономики, открытого образования, международного научно-технического сотрудничества, которое требует скорейшего преодоления языковых барьеров, ставших тормозом на пути научно-технологического прогресса и решения глобальных проблем преодоления бедности и сокращения социального неравенства.

Нарастание глобальных угроз в области экологии, энергетики и обеспечения продовольствием, противодействие которым требует существенно большей, чем это имеет место сегодня, консолидации усилий мирового сообщества, повышения уровня образованности людей и обеспечения их доступа к глобальным знаниям, сегодня представленных, главным образом, на шести основных международных языках ООН.

К сожалению, следует констатировать, что связь перечисленных выше глобальных проблем развития цивилизации с проблемой многоязычия в современном обществе сегодня еще недостаточно осознана. Об этом наглядно свидетельствует тот факт, что этой проблеме не уделяется должного внимания в национальных системах образования, а также в крупных программах международного сотрудничества. Необходимые для решения этой проблемы средства сегодня не выделяются, а соответствующие специалисты практически не готовятся.

2. Некоторые итоги Второй международной конференции «Языковое и культурное разнообразие в киберпространстве»

О том, что меры по решению глобальной проблемы обеспечения многоязычия в современном обществе остаются сегодня на уровне благих намерений, наглядно свидетельствует содержание итогового документа Второй международной конференции «Языковое и культурное разнообразие в киберпространстве», которая состоялась в России в июле 2011 г. (Якутск). Этот документ, получивший название Якутского воззвания, содержит следующий План действий по подготовке Всемирного саммита по многоязычию в 2017 г.:

  • встречи и консультации экспертов в разных регионах мира – 2012 г.;
  • проведение Конференции по проблемам многоязычия на уровне министерств – 2013 г.;
  • создание международной комиссии для подготовки доклада по проблемам многоязычия и разработка проекта решения Генеральной конференции ЮНЕСКО о проведении Всемирного саммита – 2013 г.;
  • разработка проекта решения Генеральной ассамблеи ООН о проведении Всемирного саммита по многоязычию – 2014 г.;
  • тематические встречи и региональные конференции по подготовке Саммита – 2015-2017 гг.;
  • проведение Всемирного саммита по многоязычию – 2017 г.

Как следует из этого перечня, никаких международных практических проектов в этом документе к реализации не предлагается, а рассмотрение самой проблемы на уровне ООН откладывается до 2017 г., т.е. еще на шесть лет. Конечно, встречи, консультации и конференции – все это полезно и необходимо. Но этого недостаточно – нужны практические проекты и разработки, без выполнения которых существующая ситуация не изменится, а будет только усугубляться. Ведь глобальные проблемы развития цивилизации быстро нарастают. Прогнозные исследования показывают, что уже в ближайшее десятилетие мир может оказаться перед лицом таких проблем, по сравнению с которыми современный глобальный финансово-экономический кризис будет казаться лишь легкой разминкой перед началом основного времени финального матча «Человек – Природа», исход которого сегодня совершенно неясен. При сохранении существующего положения вещей этот исход, вероятнее всего, будет не в пользу человека. Поэтому предлагаемая в рассмотренном выше документе пассивная позиция мирового сообщества в отношении одной из важных глобальных гуманитарных проблем развития цивилизации представляется нам стратегически опасной.

К сожалению, авторы настоящей работы по объективным причинам не смогли принять личное участие в работе указанной выше Международной конференции и изложить ее участникам свою точку зрения, хотя краткий доклад по данной проблеме в оргкомитет этой Конференции они представили. Но содержание его не обсуждалось, и в итоговых материалах Конференции учтено не было. Поэтому ниже приводятся некоторые практические предложения из этого доклада, а также их краткая аргументация.

3. Новые возможности для решения проблемы многоязычия в киберпространстве на основе интеллектуальных технологий машинного перевода

В последние годы в России созданы, апробированы и практически используются принципиально новые интеллектуальные технологии машинного перевода текстов. Они основаны на концепции так называемого фразеологического перевода. Эта концепция была предложена профессором Г.Г. Белоноговым еще в середине 20-го века, но практически реализована только в последние годы, когда появились персональные компьютеры с необходимыми параметрами памяти и быстродействия, принципиально позволяющие реализовать эту концепцию [1; 2].

Принципиальное отличие данной технологии состоит в том, что в ней для перевода используются подготовленные с участием экспертов специальные компьютерные словари, которые содержат не только отдельные слова, но также словосочетания и отдельные фразы переводимых текстов. За счет этой «избыточной» информации и достигается существенно более высокое качество перевода, что сегодня является главной проблемой в данной области. Ведь ни одна из известных сегодня систем машинного перевода таким качеством не обладает [3].

Еще одна принципиально важная особенность рассматриваемой технологии состоит в том, что в ней используется иерархическая трехуровневая система словарей для каждого языка, которая включает:

  • базовые политематические словари общей лексики;
  • тематические словари по отдельным направлениям деятельности (энергетика, машиностроение, авиация, информационные технологии и т.п.);
  • персональные словари конкретных пользователей, которые они могут самостоятельно пополнять в процессе своей работы в конкретной предметной области.

В процессе перевода текстов наивысший приоритет имеют персональные словари пользователей, затем – тематические словари, которые могут быть заранее подготовлены и выбраны пользователем из определенного перечня, и, наконец, базовые словари общей лексики. Это позволяет существенным образом повысить качество перевода текстов, относящихся к определенным предметным областям деятельности, в которых часто используются специфические профессиональные термины, понятия и выражения. Именно поэтому для составления тематических словарей и привлекаются квалифицированные эксперты. Они должны обладать не только определенным уровнем знания соответствующего языка, но также быть специалистами в соответствующей предметной области для того, чтобы правильно выбрать тот или иной вариант перевода специфического термина или словосочетания.

Таким образом, все используемые в данной технологии словари, включая персональные словари пользователей, представляют собой не базы данных, а базы знаний экспертов, которые специальным образом организованы для повышения качества перевода. Это и позволяет квалифицировать данную технологию как интеллектуальную.

Современное состояние интеллектуальных технологий машинного перевода и их некоторые характеристики

В настоящее время в России разработана и практически используется англо-русская версия системы фразеологического перевода, которая получила название «Метафраз». Она включает:

  • базовые политематические словари общей лексики на английском и русском языках (общим объемом порядка 5 млн фраз);
  • более 140 тематических словарей (общим объемом порядка 2 млн фраз);
  • программное обеспечение пользователей, которое дает возможность использовать систему в индивидуальном или групповом режиме работы, формировать англо-русские порталы и сайты в сети Интернет, переводить сообщения электронной почты;
  • технологическое программное обеспечение для создания словарей, включающее в себя также и средства автоматизации деятельности экспертов.

Технология создания и использования этой системы более подробно рассмотрена в работах [1; 2; 4].

Основные пути решения проблемы информационного обеспечения многоязычия в киберпространстве и первоочередные мероприятия

Разработанная в России интеллектуальная технология машинного фразеологического перевода текстов принципиально позволяет в течение ближайших 5-10 лет вывести состояние проблемы информационного обеспечения многоязычия в киберпространстве глобального информационного общества на качественно новый уровень. Однако для этого потребуется соответствующая организационная и финансовая поддержка, придание этой технологии статуса приоритетного международного проекта под эгидой ЮНЕСКО. Координатором этого проекта могла бы стать Межправительственная комиссия программы ЮНЕСКО «Информация для всех».

В содержательном плане реализации этого проекта представляется целесообразным выделить следующие мероприятия:

  • Создание Международной группы координаторов проекта из числа специалистов России, США, Германии, Франции, Испании, Китая и Индии.
  • Разработка комплекса англо-русских тематических словарей по наиболее актуальным проблемам современности (глобалистика, образование, экология, информационное общество и др.) – 2012 г.
  • Создание сетевой структуры обучения и консалтинга пользователей в образовательных, административных, научных и коммерческих организациях – 2013-2015 гг.
  • Развитие уже существующих Базовых политематических словарей общей лексики на русском и английском языках с использованием возможностей супер-компьютеров и грид-технологий – 2012-2015 гг.
  • Разработка базовых политематических словарей общей лексики на немецком, французском, испанском и китайском языках, а также на хинди – 2013-2017 гг.

Разработка тематических словарей по наиболее важным глобальным проблемам развития современной цивилизации (глобализация, информационное общество, экология, образование, здравоохранение, информационная безопасность и др.) – 2013–2020 гг.

Предлагаемая программа реализации рассмотренного выше международного проекта кому-то может показаться фантастической. Нам же она представляется вполне реалистичной. Ведь принцип решения проблемы уже найден и экспериментально апробирован. Нужны лишь соответствующая организация проекта, международная кооперация в его реализации и, конечно же, финансирование, адекватное масштабам этой проблемы. Ее решение позволит создать лингвистическое обеспечение для международного сотрудничества, основанное на принципиально новых принципах представления экспертных знаний в области машинного перевода текстов, представленных на различных языках. Это будет реальный практический шаг по пути формирования новой информационной культуры общества, без которой решение многих глобальных проблем современности практически невозможно.

Концепция фразеологического перевода и привлечение экспертов для формирования базовых и тематических словарей по различным направлениям социальной активности общества принципиально позволяют создавать в дальнейшем достаточно эффективные системы машинного перевода как для других европейских, так и для восточных языков.

Конечно, при реализации этой концепции необходимые объемы памяти для хранения базовых и тематических словарей оказываются гораздо большими, чем в других системах автоматического перевода. Но большим препятствием это не является, так как параметры современных персональных компьютеров уже таковы, что эта концепция может быть использована не только для создания корпоративных систем, но также и для систем, ориентированных на массового пользователя, в том числе студентов и школьников. Поэтому она может стать основой для формирования новой лингвистической культуры общества как важного элемента его новой информационной культуры [5].

Литература

1. Белоногов Г.Г. Теоретические проблемы информатики. Том 2. Семантические проблемы информатики. М.: КОС*ИНФ, 2008.

2. Белоногов Г.Г., Хорошилов Ал-др А., Хорошилов Ал-сей А. Фразеологический машинный перевод текстов с одних естественных языков на другие // Научно-техническая информация. Серия 2. М.: ВИНИТИ. 2010. № 10.

3. Переводческие технологии для Европы. М.: ЦБС, 2008. 64 с.

4. Колин К.К. Информационное пространство культуры: проблема многоязычия в информационном обществе. //Вестник Кемеровского государственного университета культуры и искусств. 2011. № 15. С. 8–17.

5. Колин К.К., Урсул. А.Д. Информационная культурология: предмет и задачи нового научного направления. Saarbrucken, Germany. LAP LAMBERT Academic Publishing, 2011. 249 p.

____________________________________________________________

Колин Константин Константинович
Доктор технических наук, профессор
Главный научный сотрудник Института проблем информатики Российской академии наук

Хорошилов А.А.
Доктор технических наук
Институт проблем информатики Российской академии наук


&copy Информационное общество, 2012 вып. 1, с. 62-67.