О журнале
Рекомендации
Сеть для развития. Гармоничная многоязычная система и сеть доменных имен
Франсис Мюге
_____________________________________________
Франсис Мюге
Введение
Многоязычие является ключевым аспектом нового информационного общества, в котором люди имеют законное право на выражение собственных мыслей на родном языке. Языковое разнообразие играет важную роль в сохранении мира, так как учит пониманию других культур. Оно стимулирует процесс творчества, поскольку каждый из нас думает на определенном языке, а наличие множества языков способствует разнообразию понятий.
Я хотел бы процитировать Президента России Дмитрия Медведева, который, выступая на десятом Всемирном конгрессе русской прессы, призвал сделать все зависящее, чтобы в будущем добиться присвоения доменных имен в интернета на кириллице. «Это символ значимости русского языка и кириллицы. Это неплохая сфера сотрудничества», — отметил президент.
«Наказание» Puny1 для доменных имен и «наказанный» Puny по почте
Для интернационализированных доменных имен2 решение, предлагаемое ICANN3, основано на использовании преобразования Puny Code, которое трансформирует набор кодовых символов Unicode4 (как правило, UTF-8) в цепь символов ASCII5 уникальным и обратимым способом. Например, в названии доменного имени «académie-française.org» буквы с апострофами не являются кодами ASCII. Puny Code преобразует данное доменное имя в «xn—acadmie-franaise-npb1a.org», а, например, http://русский.idn.icann.org превращает в http://xn—h1acbxfam.idn.icann.org. При этом знаки, не являющиеся кодами ASCII, пропадают в таком названии.
С помощью UTF-8 можно представлять символы любого языка в мире, в то время как с помощью основной кодовой таблицы ASCII можно представлять только буквы английского алфавита. Приведенные выше примеры демонстрируют использование способа «заплаток». Часто, однако, такие «заплатки», которые изначально служили в качестве быстрого и простого решения конкретной проблемы (IDN для веб-браузера), могут привести к чрезмерно сложным и неудобоваримым конструкциям, которые нельзя использовать в качестве универсального решения для электронной почты, обмена файлами и т. д. Такой подход решает только часть проблемы представления доменных имен на национальном языке. Данный подход выявил неожиданные проблемы, которые некоторые специалисты называют проблемами «Funy Code»6. Связаны они с тем, что при преобразовании символов, которые не входят в основную кодовую таблицу ASCII, в Puny Code возможны проблемы с безопасностью и многочисленные искажения. Эта проблема наиболее зримо проявляется в написании адресов электронной почты.
Например, если попытаться послать электронное сообщение по адресу «secrétaire@académie-française.org» или на «иван@русский.ру», проблема усложняется, поскольку «secrétaire» и «иван» кодируются в UTF-8, а наименования доменных имен «académie-française.org» и «русский.ру», зарегистрированных в соответствии с правилами, кодируются с использованием Puny Code. Вследствие этого нельзя, например, производить операцию «копировать и вставить» для данного адреса, чтобы поместить его в список рассылки, поскольку одна часть кодируется одним способом, а другая часть — другим.
Создание протокола, который должен решить эту проблему, еще не закончено ICANN. Текущий подход ICANN предполагает необходимость внесения изменений в сервер SMTP, в результате которых именно на этот сервер будут возложены обязанности по обработке запросов IDN и преобразованию Unicode в Puny Code.
На сегодняшнем этапе неясно, сможет ли пользователь в рамках подхода ICANN использовать полный набор символов Unicode для выражения собственных лингвистических отличий в конкретном IDN. Вполне вероятно, что пользователи не смогут использовать, например, китайские имена в кириллическом IDN, и это обстоятельство будет существенно ограничивать права языковых меньшинств.
В итоге возникает простой вопрос: является ли возможным создание однородной и гармоничной системы на основе UTF-8? Для того чтобы найти ответ на этот вопрос, следует проанализировать программное обеспечение, используемое ныне для управления DNS, не отвлекаясь на политиканские ухищрения в борьбе за контроль над корневыми базами данных. Необходимо уделить внимание трем составляющим данной проблемы: технологической, юридической и политической, — поскольку они тесно переплетены в данном вопросе.
Подход, связанный с прямым преобразованием кодов ASCII в UTF-8, выглядит, на первый взгляд, наиболее простым и естественным, но нам представляется слишком недальновидным, так как на самом деле является достаточно сложным и может привести к множеству проблем.
Ключевое программное обеспечение BIND
До сего дня основное внимание уделялось контролю над корневыми базами данных DNS, при этом программные средства для доступа к базам данных DNS оставались в тени. В этой связи необходимо принять во внимание, что ICANN не владеет реальной подсетью серверов DNS и не управляет ею по контракту. Поддержку серверов DNS осуществляют на добровольной основе пользователи (в основном, провайдеры услуг интернета, компании, оказывающие услуги веб-хостинга, некоторые регистраторы и т. д.).
BIND7 — это бесплатное программное обеспечение, действующее на основании лицензии FreeBSD. То есть все могут вносить любые изменения в него и распространять новые версии. Оно поддерживается Консорциумом интернет-систем8 — независимой организацией, действующей в США. Между данным Консорциумом и ICANN не существует никаких юридических связей.
Одной из главных задач при разработке BIND версии 9 было обеспечить строгое соответствие стандартам Целевой группы по техническим аспектам интернета9, т. е. положениям «Запроса комментариев»10, учрежденного данной группой, однако полностью решить эту задачу пока не удалось.
Для серверов DNS существуют некоторые другие программные продукты, например, такое ПО выпускает Microsoft. Но чаще всего они просто повторяют функции BIND. Следует отметить, что BIND позволяет использовать различные сервисы разрешения имен, относящиеся к различным классам сети. Данная характеристика связана с происхождением BIND: это программное обеспечение было разработано в научном сообществе на заре развития интернета. То есть способность поддержки различных разрешающих сервисов была заложена изначально, на этапе разработки. В частности, программное обеспечение BIND использовалось внутри NSFnet (сеть Национального научного фонда11США) и затем, по мере развития интернета, перешло из чисто академического использования в коммерческую сферу. Таким образом, развитие интернета было изначально связано с NSF, затем возникла более тесная связь с Департаментом торговли США.
Данные, ассоциированные с доменными именами, содержатся в записях ресурсов12. Записи подразделяют на классы, каждый из которых соответствует определенному типу сети или программного обеспечения. В настоящее время существуют классы для интернет-сетей13 (любой сети на основе стека протоколов TCP/IP), сетей, базирующихся на протоколах Chaosnet14, и сетей, использующих программное обеспечение Hesiod. Намного более популярным является интернет-класс. Нам неизвестно, использует ли кто-либо до сих пор класс Chaosnet, а сфера применения класса Hesiod по большей части ограничивается стенами Массачусетского технологического института15.
До определенного времени не-ASCII символы просто не использовались, однако на каком-то этапе Джон Клензин16 предложил использовать новый класс, не ограничивающийся набором символов ASCII как чем-то изначально, по определению, заданным. Такой подход позволил бы сформировать более совершенную систему интернационализированных доменных имен и избежать зависимости от «заплатки», которую представляет собой Puny Code. Однако прозрачная интеграция такой системы, состоящей из двух классов, где записи нового класса служат для устранения недостатков класса «IN», была бы сопряжена с рядом технических сложностей. Эти проблемы не должны возникать, если начать работу только с одним классом, разработанным с учетом грядущей интернационализации.
Здесь было бы уместно упомянуть определение из RFC 2929 (см. врезку).
____________________________________________
КЛАСС (CLASS) — это целое число без знака, состоящее из двух октетов и содержащее один из кодов записей ресурсов (RR CLASS).
КЛАССы DNS использовались мало, однако они представляют собой еще одно измерение распределенной базы данных DNS. В частности, отсутствует необходимость в наличии связи между пространством имен или корневыми серверами одного КЛАССа и аналогичными сущностями другого КЛАССа. Одно и то же имя может иметь абсолютно разные значения для различных КЛАССов, несмотря на то, что типы меток совпадают, а нулевую метку можно использовать только в качестве корня для каждого КЛАССа. Однако по мере развития глобальных сетей и DNS, КЛАСС IN, или интернет-класс, получил при работе с DNS наибольшее распространение.
Существует две подкатегории КЛАССов для DNS: нормальные классы для хранения данных и классы QCLASS, которые имеют смысл только для запросов и обновлений.
Ниже приведено описание текущих назначений КЛАССов и некоторые соображения относительно их будущего:
Десятичная форма Шестнадцатеричная форма
0 0x0000 — назначение требует Действия в отношении стандартов IETF.
1 0x0001 — Интернет (IN).
2 0x0002 — доступен для назначения в соответствии с Общим соглашением IETF как класс (CLASS) данных.
3 0x0003 — Chaos (CH) [Moon 1981].
4 0x0004 — Hesiod (HS) [Dyer 1987].
5 — 127 0x0005 — 0x007F — доступны для назначения в соответствии с Общим соглашением IETF только в качестве классов (CLASS) данных.
128 — 253 0x0080 — 0x00FD — доступны для назначения в соответствии с Общим соглашением IETF только в качестве классов QCLASS.
254 0x00FE — QCLASS None («Ни один») [RFC 2136].
255 0x00FF — QCLASS Any («Любой») [RFC 1035].
256 — 32767 0x0100 — 0x7FFF — назначается по Общему соглашению IETF.
32768 — 65280 0x8000 — 0xFEFF — назначается исходя из Требуемой Спецификации в соответствии с [RFC 2434].
65280 — 65534 0xFF00 — 0xFFFE — Для частного использования.
65535 0xFFFF — могут быть назначены только Действием в соответствии с процедурой принятия стандартов IETF.
_______________________________________________
Таким образом, 216 = 65536 – 5 (в эту пятерку входят классы IN, CH, HS, None, Any) = 65531 можно использовать для поддержки других сервисов DNS в рамках BIND.
Преимущественно используется класс номер два, которому соответствует название «интернет». Все остальные классы практически не используются, они предписаны другим системам. Классы 128—253 доступны для повсеместного использования всеми желающими, в них упомянутый класс может быть предписан исключительно группой IETF, которая достаточно строго контролирует данный процесс, в то время, как классы в предпоследней строчке (65280 и т. д.) могут использоваться частными лицами для личных целей, для экспериментирования и т. д. То есть такая система делает возможным создание более чем 65 тысяч классов, среди которых 255 могут использоваться для частных целей. Фактически это создает неограниченные возможности для использования доменных имен, необязательно связанных с ICANN, которая контролирует только часть из них.
Но, конечно же, когда говорят, каким образом работает интернет, никогда не представляют его функционирование именно таким образом, каким мы сейчас его изложили. Положительным моментом является то, что ICANN не может возражать против использования еще одного класса, поскольку сама рекомендовала в мае 2001 года этот подход.
Более того, следует отметить, что исходная структура DNS допускает возможность будущего расширения, которое позволило бы в безопасном режиме создавать множественные корневые элементы в интернете для экспериментальных и прочих целей. Как отмечено в RFC 1034, для каждой ресурсной записи DNS содержит тег17 «class», который позволяет различать ресурсные записи разных классов, несмотря на их объединение в интернете. Для ресурсных записей в стандартной системе с корневым сервером значение тега такого класса задается равным «IN»; остальные значения были стандартизованы для конкретных целей, включая 255 возможных значений, зарезервированных для «частного использования», которые особенно подходят для экспериментов. Как сказано в недавнем предложении IETF, этот атрибут «class» позволяет использовать альтернативное пространство имен DNS с других корневых серверов таким образом, что это не мешает стабильной работе существующей унаследованной системы с корневым сервером. Те, кто использовал альтернативные корневые элементы, не применяли другой класс. Вместо этого они предпочли «замаскировать» ресурсные записи таким образом, как будто те исходят от стандартного корневого элемента. Подобная ситуация создает предпосылки для возникновения сбоев в операциях других систем.
Еще одна точка зрения состоит в том, что реальная подсеть серверов DNS (фактически одноранговая сеть18, но тогда этот термин еще не был придуман) должна обладать способностью поддерживать несколько систем DNS. Иными словами, она должна уметь разбивать «линейки» этого «общего оператора», чтобы породить «конкуренцию». Традиционно представлялось, что эта сеть может поддерживать только один сервис, хотя в действительности она может поддерживать целый ряд сервисов.
Технические аспекты реализации
Сейчас я подхожу к тому моменту, когда еще раз необходимо подчеркнуть взаимосвязи трех аспектов: технологического, политического и юридического.
В настоящее время только утилиты поиска в DNS (такие, как dig или host), относящиеся к системе BIND, позволяют адресовать серверу DNS запросы с полем class. Существующие сегодня браузеры делать этого не позволяют. Утилита dig позволяет обратиться к серверу DNS с запросом, в котором указано содержимое поле class. Для переопределения класса запроса по умолчанию («IN» для интернета) используется опция -c. В качестве класса может использоваться любой правильный класс, например, HS для записей Hesiod или CH для записей Chaosnet. Что является самым важным в этом предложении с точки зрения пользователей, и что отличает это предложение от концепции «альтернативных корневых серверов», имеющей, по моему мнению, плохую репутацию? Тот факт, что пользователи не должны указывать в настройках сервер DNS, отличный от сервера, предоставляемого провайдером услуг интернета.
1. Браузер пользователя может адресовать серверу DNS запрос, содержащий поле class.
2. На сервере DNS провайдера услуг интернета устанавливается свежая версия программного обеспечения BIND, которая можетподдерживать различные классы.
Для того чтобы упростить структуру запросов, генерируемых браузерами и другими приложениями (почтовыми программами, утилитами обмена файлами и т. п.), необходимо обобщить и обновить определение URL19 (URI20). Например: домен wikipedia в новом общем домене верхнего уровня21 (.open) с классом Net4d мог бы выглядеть следующим образом: http://4d%fr.wikipedia.open. Еще один пример: кириллический домен «Москва» в кириллическом gTLD (.ро) с кириллическим классом «Сеть», мог бы выглядеть так: http://ст%Москва.ро. Таким образом, можно получить доменное имя, полностью написанное на кириллице.
Иными словами, браузер пользователя может адресовать серверу DNS запрос, содержащий поле class, а на сервере DNS провайдера услуг интернета устанавливается версия BIND, которая может поддерживать различные классы.
Большое количество технических проблем может быть вызвано смешением символов из различных кодовых таблиц ASCII, например базовой и дополнительной, которое может привести к ситуации, когда один и тот же символ, например буква «Р» русская и буква «Р» латинская, используются одновременно, и непонятно, какой символ используется в конкретном случае. Это может привести к хаосу. Также это может быть использовано в нечестных целях: например, для фишинга22 и других преступлений.
В кириллическом классе «Сеть» можно также отметить исчезновение проблемы омографов и сопутствующих ей фишинга и судебных тяжб. Например, можно гарантировать, что в кириллическом классе «Сеть» доменные имена будут содержать только кириллические символы. При регистрации доменного имени в кириллическом классе «Сеть» использование в имени сочетания латинских и кириллических символов просто запрещено. Пользователи смогут настроить браузер таким образом, что по умолчанию последний будет использовать заданный класс, соответствующий определенному языку — во избежание путаницы.
Для того чтобы веб-браузер (например, Mozilla) мог обращаться к серверу DNS с запросом, содержащим поле class, в программное обеспечение браузера не придется вносить существенные изменения. Во всяком случае, это будет менее сложным, чем реализация Puny Code, зависимого от TLD (TLD с поддержкой IDN для Mozilla). Запрос, генерируемый веб-браузером, просто должен включать в себя поле class. После внесения указанных изменений необходимость в использовании подключаемого модуля или специфичного клиента отпадает.
В случае использования старых веб-браузеров пользователи могут заходить на требуемый адрес через индивидуальный портал для каждого класса. На стороне веб-сервера, например Apache, для того чтобы реализовать виртуальный хостинг, также потребуется внести относительно небольшие изменения.
Для приложений, связанных с электронной почтой, модификации также будут весьма незначительными.
Таким образом, предлагаемое решение гораздо легче в реализации, чем система, предложенная ICANN. Например, китайцы, когда пробовали воспользоваться системой ICANN для представления адресов электронной почты на китайском языке, в этом деле не преуспели. Подход ICANN не предоставил возможностей для таких операций.
Функции, доступные для класса IN, должны, в принципе, соответствовать требованиям RFC. Однако полностью обеспечить соблюдение этих требований RFC в текущей (девятой) версии BIND не удалось. С практической точки зрения сложность решения задачи будет зависеть от того, каким способом будет написан код BIND версии 10. Предпочтительным вариантом является «параметризация» существующих подпрограмм. Грубый метод состоит в реплицировании «тупиковых» процедур, в которых класс IN «зашит» в код, для нового класса. В настоящий момент ISC заново переписывает код BIND помодульно. Результатом этих усилий должно стать появление версии 10, позволяющей значительно упростить решение поставленной задачи.
Изменения, которые необходимо внести в свободное программное обеспечение, такое, как Mozilla и Apache, можно написать достаточно быстро и, что самое главное, легко включить в следующую официальную версию. Если же говорить о коммерческом программном обеспечении, то тут все будет зависеть от доброй воли разработчиков, однако, с учетом доминирования Apache среди веб-серверов и значимости Mozilla среди веб-браузеров, вряд ли стоит ожидать, что разработчики коммерческих продуктов смогут позволить себе отставание. Например, внедрение данных модификаций для веб-браузера Internet Explorer будет полностью зависеть от воли Microsoft — в отличие от бесплатных продуктов, где данные модификации будет сделать достаточно легко, и они приобретут официальный характер. Но даже если производители не сочтут нужным в краткосрочной перспективе внедрить подобные модификации, у пользователей будет возможность получить доступ к новым сервисам, открывающимся благодаря данным модификациям при использовании таких браузеров, как Mozilla.
И, наконец, последний, но немаловажный момент заключается в том, что каждый класс может использовать свою собственную систему корневых серверов.
Net4D образует другой набор классов сетей наподобие Hesiod и Chaosnet и также находится вне юрисдикции ICANN, т. к. последняя обладает правами только на класс IN. Конкуренцию классу ICANN IN и классу NET4D составят другие классы, а честная конкуренция всегда приветствуется.
Net4D и Семантический веб
Классы Net4D предназначены не только для предоставления минимальных сервисов как в случае ICANN, они были разработаны специально для предоставления услуг с добавочной стоимостью, призванных способствовать развитию Семантического веба23.
Держатели доменных имен Net4D должны будут поддерживать определенную онтологию, которая будет являться частью обязательств, направленных на формирование метаданных создание зоны доверия и обеспечение интероперабельности метаданных в конкретных предметных областях в соответствии с требованиями Семантического веба, создание системы открытых идентификаторов цифровых ресурсов24
, необходимость которой для развития Веба в будущем и аутентификации метаданных очевидна. Держатели также должны предоставлять открытые идентификаторы цифровых ресурсов, которые были бы дружественными по отношению к одноранговым, пиринговым сетям P2P и обеспечивали бы максимальное прохождение трафика в таких сетях, предоставляя возможность обмена большими массивами данных между узлами, которые связаны каналами с невысокой пропускной способностью.
Семантический веб — понятие, предложенное основателем Всемирной паутины (Веба) сэром Тимом Бернерсом-Ли25. Превратить интернет в гигантскую базу знаний при помощи метаданных — ключевая идея, лежащая в основе Семантического веба, в котором при помощи метаданных можно, например, связывать между собой тексты и обеспечивать автоматический перевод.
В основе новой концепции Net4D лежит следующее требование: обладатели доменных имен Net4D должны поддерживать определенную онтологию, под которой понимается конкретная схема организации метаданных. Изначально поисковые системы однозначно опирались на системы метаданных, но затем недобросовестные люди, такие как, например, разработчики порнографических сайтов, стали искажать метаданные, чтобы они обозначали те понятия, которые на самом деле в сайтах, описывающихся этими метаданными, не содержались. Для привлечения большего количества посетителей они в своих метаданных недобросовестно использовали наиболее популярные ключевые слова.
Данная ситуация злоупотребления ключевыми словами породила новый класс поисковых систем, внедряющих алгоритмы поиска, позволяющих перехитрить недобросовестных разработчиков сайтов в их подходе к искажению метаданных и исключить нерелевантные результаты поиска. Наиболее яркой из них является Google.
Если бы Cемантический веб существовал, то в таком механизме поиска, который был реализован в Google, не было бы необходимости. Во всяком случае, он не обладал бы такой значимостью, какой обладает сейчас.
Предложение состоит в том, чтобы люди, покупая доменное имя Net4D в соответствии с новым подходом, принимали на себя контрактное обязательство поддерживать определенную онтологию. Если они не подчиняются этим требованиям, то просто перестают пользоваться услугами — для них закрывается доступ. Данный контроль за соблюдением онтологии достаточно легко реализовать, поскольку существуют программные средства, позволяющие автоматически выявлять соответствие онтологии. Эту процедуру также можно осуществлять и вручную. И это не является нарушением свободы самовыражения, так как происходит контроль качества содержимого метаданных, но не самих данных.
Предлагаемая система обеспечивает исключение загрязнения метаданных, и тем самым обеспечивается взаимодействие, совместимость различных серверов между собой и более легкий обмен данными. Кроме того, данный подход позволит создать систему открытого идентификатора цифровых ресурсов. Ключевым здесь является слово «открытый», поскольку уже существует система идентификаторов цифровых ресурсов, которая является проприетарной, за пользование которой необходимо платить. В нашем подходе предлагается бесплатный открытый ресурс, а идентификаторы можно также использовать в сетях P2P, например в биллинговых системах. Данный подход позволяет более эффективно обмениваться данными, информацией между отдельными пользователями сети внутри одноранговых сетей, внутри сетей обмена данными между индивидуальными пользователями. Простота обмена данными будет обеспечена благодаря тому, что она не будет зависеть от пропускной способности канала. И это наиболее актуально для развивающихся стран, где использование интернета является достаточно дорогостоящим. В рамках сетей обмена данными между индивидуальными пользователями обмен информацией будет значительно упрощен. Если какой-то конкретный ресурс, например видеозапись конференции, пользуется большой популярностью, то в этом случае загрузка этого видео пользователями в какой-нибудь развивающейся стране будет сильно упрощена, поскольку этот ресурс будет одновременно находиться на компьютерах многочисленных пользователей, и его загрузка не будет зависеть от одного-единственного сервера, где это видео будет располагаться. Т. е. благодаря использованию метаданных можно будет загружать ресурс с компьютеров многочисленных пользователей, а не с одного конкретного сервера. В качестве примера использования данной концепции можно привести биллинговое телевидение, когда обмен телепрограммами происходит между компьютерами различных пользователей, что снижает нагрузку на сервера благодаря использованию многочисленных компьютеров для загрузки того или иного ресурса.
Говоря о создании инструментария для функционирования Семантического веба, я хотел бы выделить два основных сервиса: это WEB4D — «Сеть для людей» и EPC4D26 — «Сеть для вещей».
Для построения связи между конкретным продуктом в этом поле вещей должна происходить увязка только с двумя конкретными доменными именами в соответствии с нынешней господствующей концепцией.
Другие возможные общие доменные имена высокого уровня для Семантического веба включают в себя использование метаданных для обеспечения равноправной глобальной торговли, которая будет регулироваться Конференцией ООН по торговле и развитию (ЮНКТАД)27. Здесь смысл состоит в том, что благодаря использованию метаданных возможно сравнение однородных товаров на глобальном уровне, и, тем самым, торговля этими товарами приобретет более свободный и равноправный характер. Вторая область применения — это торговые марки, которые регулируются Всемирной организацией интеллектуальной собственности (ВОИС)28.
Семантический веб и лингвистический диалог
В качестве примера можно также привести лингвистическую систему доменных имен верхнего уровня для Семантического веба29 LSWgTLD. Смысл данной системы состоит в том, что для каждого языка должно быть присвоено расширение, позволяющее с легкостью находить и идентифицировать сайты или версии сайтов, написанные на конкретных языках. Это позволило бы значительно упростить работу поисковых систем и способствовало бы лингвистическому разнообразию. Основные преимущества этой инновационной технологии заключаются в возможности обмена данными между сайтами на разных языках с идентичной структурой метаданных и метаязыка, а также в облегчении автоматического перевода.
Качество автоматического перевода можно было бы существенно улучшить, если бы автоматические инструменты могли работать с несколькими переводами с одного и того же языка, сертифицированными человеком. К примеру, если на некоем сайте имеется документ, переведенный на английский и французский языки, и тот же документ был переведен переводчиками (людьми) на русский и корейский языки на других сайтах, то для инструментов автоматического перевода возможность получить доступ ко всем имеющимся версиям этого документа на разных языках и поработать с ними была бы исключительно полезной. Например, словосочетание sociйtй civile может быть переведено на испанский язык как sociedad civil (со значением «гражданское общество», а не «гражданская компания» или «гражданский бизнес»!) благодаря наличию правильной версии текста на английском языке. Разумеется, нужно, чтобы инструменты перевода могли находить и идентифицировать различные версии текста, расположенные в разных местах, а это означает необходимость в наличии идентификаторов и стандартизованных метаданных. Использование SWgTLD может стать важным подспорьем на пути к практическому — но не элитарному — многоязычию в Вебе.
Если текущая монопольная ситуация в сфере управления доменными именами изменится, если для всех классов будет действовать режим честной конкуренции, то у ICANN также появится возможность развиваться независимо, в отличие от сегодняшнего неопределенного юридического статуса и исторически сложившегося патронажа со стороны правительственных структур США. Это позволит избежать политической напряженности на международном уровне.
Если говорить об управлении Net4D и другими классами, то здесь предлагается рассмотреть схему прозрачного партнерства, предусматривающего всеобщую вовлеченность и распределение полномочий между правительственными организациями, техническими операторами, коммерческими компаниями, образовательными учреждениями и структурами гражданского общества. В соответствии с подходом, сформулированным в предложении по созданию Агентства ООН по многосторонним партнерствам30, такое партнерство должно быть полностью легитимным с точки зрения международного права.
Следует подчеркнуть, что именно многостороннее партнерство, включающее в себя различных участников, может придать законный статус новым предложениям по использованию доменных имен. Если же эта инициатива будет исходить только от конкретного сообщества (например, только от гражданского общества или только от госструктур), а не от всех в совокупности, то она может быть не признана другими.
Следует отдать должное консорциуму W3C, который исследует и разрабатывает во имя общественного блага открытые (не внутрикорпоративные) стандарты, протоколы и языки для Семантического веба. И существенную долю прибыли, полученной от продажи доменов WEB4D и EPC4D, необходимо направить на поддержку деятельности разработчиков в рамках консорциума W3C.
Классы Net4D должны быть открытыми и обеспечивать интероперабельность с другими системами для разрешения имен (такими как Handle.net). Например, это можно реализовать путем использования поля NAPTR31.
Заключение
В заключение я хотел бы представить достаточно схематичные и несколько провокационные основные выводы.
Версия DNS 1.0 является монополией ICANN. Web 1.0 HTML имеет американское происхождение и может функционировать только на основе английского языка.
В рамках новой системы DNS 2.0 предполагается открытая конкуренция в полностью свободном международном и многоязычном пространстве, включающая в себя, inter alia, Net4D, Семантический веб, XML, WEB4D — EPC4D.
Таким образом, предложенный открытый, гармоничный и безопасный подход к лингвистическому разнообразию радикально отличается от подхода, который исповедовался в DNS 1.0.
В обсуждении этой проблемы помимо ученых очень важно участие и представителей органов государственной власти. Ключевым моментом здесь является междисциплинарность, представленность различных сообществ, потому что именно в этом состоит сила нынешней системы управления использованием интернета, которая является междисциплинарной по своему характеру. Благодаря сочетанию политической, юридической и технической экспертиз система Net4D может стать весьма мощной. И если Россия всерьез озаботится обеспечением лингвистического разнообразия, если слова президента Медведева об использовании русского языка действительно являются серьезным утверждением, а не просто политической риторикой, то необходимо предпринять соответствующие действия, и вовлечь в обсуждение представителей государства, бизнеса, гражданского общества и научно-образовательного сообщества.
СНОСКИ:
1 Заголовок этого раздела статьи, который в английском оригинале звучал как «PUNYshment for Domain Names and PUNYshed from Mail», обыгрывает созвучие совершенно разных по смыслу слов: punish, punishment (наказывать, наказание) и названия этого кода — puny, которое в прямом переводе с английского означает «слабый, маленький, тривиальный, неновый, неоригинальный».
2 Англ.: Internationalized Domain Names (IDN).
3 ICANN (Internet Corporation for Assigned Names and Numbers) — Международная корпорация по присвоению имен и номеров. Создана в 1998 г. при участии правительства США для регулирования вопросов, связанных с доменными именами, IP-адресами и прочими аспектами функционирования интернета.
4 Unicode (по-русски произносится «Юникод» или «Уникод») — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.
5 ASCII (англ. American Standard Code for Information Interchange, по-русски произносится «аски») — американский стандартный код для обмена информацией, 7-битная кодировка для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов. В компьютерах обычно используют 8-битные расширения ASCII.
6 Игра слов английского языка «funny» (смешной) и «puny».
7 BIND (Berkeley Internet Name Domain, до этого: Berkeley Internet Name Daemon) — открытая и наиболее распространенная реализация DNS-сервера, обеспечивающая выполнение преобразования DNS-имени в IP-адрес и наоборот.
8 Англ.: Internet Systems Consortium (ISC).
9 Англ.: Internet Engineering Task Force (IETF).
10 Англ.: Request for Comments (RFCs).
11 Англ.: National Science Foundation (NSF).
12 Англ.: Resourse Records (RR).
13 Англ.: Internets.
14 Англ.: Chaosnet — старая сеть, которая имеет в большей степени историческую значимость.
15 Англ.: Massachusetts Institute of Technology (MIT).
16 John C. Klensin. В рамках IETF занимался вопросами приложений. В 1996—2002 гг. был членом, а с 2000 г. председателем Совета по архитектуре интернета (Internet Architecture Board).
17 Тег (англ. «tag» — ярлык, этикетка, бирка; метить) — ключевое слово, метка для категоризации чего-либо. Используется для поиска какой-либо информации или для форматирования текста.
18 Англ.: P2P network, где P2P означает «peer-to-peеr» (равный к равному, ровня к ровне).
19 Унифицированный указатель ресурса. От англ. URL — Uniform Resource Locator.
20 Унифицированный идентификатор ресурса. От англ. URI — Uniform Resource Identifier. Ранее назывался «универсальный идентификатор ресурса» (от англ. Universal Resource Identifier)
21 Англ.: general top-level domain (gTLD).
22 Фишинг (англ. phishing, от password — пароль и fishing — рыбная ловля, выуживание) — вид интернет-мошенничества, целью которого является получение доступа к конфиденциальным данным пользователей — логинам и паролям.
23 Семантический веб — англ. Semantic Web.
24 Англ.: Open Digital Resource Identifier (ODRI).
25 Sir Timothy John «Tim» Berners-Lee — знаменитый британский ученый, создатель Всемирной паутины (совместно с Робертом Кайо) и действующий глава Консорциума Всемирной паутины.
26 Electronic Product Code (EPC) — электронный код продукта. Это идентификатор по «принципу номерного знака», позволяющий присвоить уникальный идентификатор любому физическому объекту.
27 Англ.: United Nations Conference on Trade and Development (UNCTAD).
28 Англ.: World Intellectual Property Organization (WIPO).
29 Англ.: Linguistic Semantic Web TLD (Linguistic SWgTLD или LSWgTLD).
30 Англ.: United Nations Multi-Stakeholder Partnerships Аgency (UNMSP). См. http://unmsp.org.
31 NAPTR (англ: Name Authority Pointer) помещает Авторизованные Именные Сcылки и является новейшим типом записи DNS, который поддерживает перезапись базируемую на регулярных выражениях. Несколько записей NAPTR могут образовать цепочку, создаваемую вместо довольно сложных перезаписывающих правил URI. До достижения предельного условия запись может пройти любое число перезаписей.
32 Фр.: Ecole Nationale Supérieure de Techniques Avancées (ENSTA).
_____________________________________________________________
Франсис Фабьен Мюге - представитель Национальной высшей школы передовых технологий32 (Франция) и Динамической коалиции по линвистическому разнообразию при Форуме по управлению использованием интернета
© Информационное общество, 2008, вып. 3-4, с. 81-90.