Средства систематизации и анализа русскоязычных ресурсов Интернета
Соркин В.Э.

Средства систематизации и анализа русскоязычных ресурсов Интернета

В.Э. Соркин, генеральный директор компании V6





Много сказано о том, какое большое значение имеет в развитии современных информационных технологий Интернет. Однако следует предостеречь от некоторой эйфории по этому поводу и, может быть, излишних восторгов. Давайте посмотрим на цифры о распространении и использовании Интернета в Москве. По данным различных источников и, в частности, Регионального общественного центра Интернет-технологий, сейчас в Москве приблизительно 250 тысяч пользователей Интернета. Много это или мало? С одной стороны, по сравнению с количеством пользователей Интернета в России – это много, так как составляет около половины всех пользователей Интернета в стране. С другой стороны, это мало, если сравнить количество пользователей Интернета с числом владельцев домашних персональных компьютеров. Здесь цифры такие: примерно 10–15% от общего числа владельцев ПК подключено к Интернету. Таким образом, не проблема технического оснащения, то есть не отсутствие компьютера или телефонной линии сдерживают развитие сети в России. С другой стороны, таким ограничителем не может быть отсутствие информационных ресурсов, поскольку с нашей точки зрения в Интернете сейчас представлено практически все. Что же тогда? Как нам кажется, очень серьезным сдерживающим фактором является представление об Интернете как о некоторой информационной свалке. Если удастся это представление разрушить, то количество российских пользователей Интернета значительно возрастет. Мы считаем эту задачу очень важной и сосредотачиваем на этом направлении наши основные проекты.

Одним из таких проектов является создание каталога русскоязычных ресурсов Интернета «АУ». «АУ» – это единственный каталог, содержащий информацию обо всех русскоязычных ресурсах Интернета. Слово «всех» необходимо прокомментировать. Дело в том, что Интернет неуправляемая сущность и, конечно, нельзя гарантировать, что в каталоге «АУ», как и в любом другом, представлено все то, что есть сейчас во всемирной компьютерной сети. Однако каталог «АУ», повторяю, единственная система, которая ставит своей целью представить в идеале все информационные ресурсы русскоязычного Интернет-пространства. Два года тому назад, когда начинался этот проект, он содержал всего 700 записей. Сейчас в нем около 12 тысяч каталогизированных информационных ресурсов, то есть 12 тысяч Web-сайтов русскоязычного Интернета.

О некоторых принципах и идеях построения «АУ». Существуют два подхода к построению поисковых и систематизирующих средств в Интернете. Первый подход – создание поисковых машин, которые различными способами обшаривают Интернет-пространство, составляют внутренние индексы и предоставляют своим пользователям возможность по ключевым словам разыскивать ту информацию, которая представлена на Интернет страницах. В России первый подход широко развит и представлен такими известными компаниями и программными средствами как Апорт, Агама, Яндекс, Комптек. Второй подход состоит в том, что создается база данных, содержащая описание информационных ресурсов, представленных в Интернете. Эта база данных основана на специальном рубрикаторе и позволяет не только искать информацию по ключевым словам, но и осуществлять так называемую навигацию, то есть искать информацию, которая требуется пользователю, с помощью тематических разделов и рубрик, что представляет собой естественную и достаточно традиционную метафору информационного поиска. Каталог «АУ» относится к числу каталогов-рубрикаторов. Специальная группа экспертов осуществляет регулярный мониторинг русскоязычного Интернет-пространства, формулирует аннотации и вводит их в специализированную базу данных.

Здесь нецелесообразно подробно останавливаться на том, как эта технология реализована с программной точки зрения. Цель этой статьи в другом – дать представление о том, как использование каталогов позволяет систематизировать и организовать Интернет-пространство и помогает пользователю найти ту информацию, которая ему нужна. Специфика каталога и его преимущества в том, что любой человек может самостоятельно, с помощью уточнения своего поискового запроса, выбрать, найти именно те информационные ресурсы, которые ему нужны, что не всегда удается при ориентации на случайно подобранные ключевые слова. На заглавной странице есть большое количество информационных разделов. Можно обратиться к любому из них, например, «Страны и города», а затем с помощью многоуровневого рубрикатора найти именно тот, который нужен. Например, Москва и Московская область нас интересуют больше всего. Открывается этот раздел аннотациями Web-сайтов, которые в нем имеются. По списку можно выбрать любой из них и вызвать нужную информацию.

Каталог «АУ» предоставляет пользователям дополнительные возможности. Во-первых, можно оценить степень доступности конкретного Интернет-ресурса. Программные средства каталога «АУ» осуществляют регулярный мониторинг Интернета, контролируя доступность того или иного информационного ресурса. Выводится некая интегральная оценка доступности. Например, оценка «7» означает, что этот ресурс часто бывает недоступен. А цифра «10» является наивысшим баллом доступности.

Во-вторых, очень интересной и важной частью каталога является специальный раздел, который содержит так называемые тропы. Тропы представляют собой специализированные описания не одного, а нескольких ресурсов, связанных между собой по тематике. Они составлены так, что привлекают внимание к информационным ресурсам по той или иной теме. Таким образом, раздел «Тропы» является дополнительным поисковым средством к рубрикатору. То есть с его помощью можно выйти на множество ресурсов, которые заинтересуют пользователя по совершенно иным принципам.

В третьих, каталог «АУ» предоставляет самим создателям Web-сайтов возможность вносить в него описание своих ресурсов. С этой целью создан специальный раздел, который называется «Добавить». Создатели Web-страницы или Web-сайта, с помощью этого раздела могут ввести в каталог их описание. По нашей статистике, до 50% всех аннотаций каталога добавляется в него таким способом авторами или владельцами информационных ресурсов.

И в заключение – о роли каталогов в Интернете и перспективах их развития. По мере роста информационных ресурсов Интернета усложняется проблема информационного поиска в сети. Поэтому необходим постоянный поиск путей усиления организующего и систематизирующего начала в Интернете. Одно из направлений – создание так называемых Web-порталов, или, иначе, специальных Web-сайтов, которые известны всем и через которые различные категории пользователей осуществляют первичный вход в сеть. Входя через так называемый портал, человек получает первую организующую информацию об устройстве той или иной части Интернета. Ее предоставляет, как правило, каталог, рассказывающий о доступных ресурсах. Имеется также ряд дополнительных, специализированных Интернет-сервисов типа Web-конференции, средства on-line-общения, информационные каналы и информационные потоки. Каталог «АУ» можно рассматривать как образующее начало для создания русскоязычного портала, через который русскоязычный пользователь сможет быстро осуществить доступ к необходимым информационным ресурсам Интернета.


&copy Информационное общество, 1999, вып. 4, с. 50 - 51.