Изучение мотиваций создания внешних гиперссылок на университетских веб-сайтах: опыт Нигерии
Нвохири Энтони Метумараибе, Печников Андрей Анатольевич

Изучение мотиваций создания внешних гиперссылок на университетских веб-сайтах: опыт Нигерии

____________________

Антони Метумараибе НВОХИРИ, А.А. ПЕЧНИКОВ



Статья рекомендована А. М. Елизаровым 04.02.2013

Аннотация. В работе исследуются официальные сайты нигерийских университетов в целях выяснения мотиваций создания исходящих гиперссылок, сделанных с этих сайтов. Предложенная классификация мотиваций гиперссылок применена к множеству из более чем 6300 ссылок, сделанных с сайтов 86 нигерийских университетов. Наличие нескольких потенциальных мотиваций приводят авторов к модификации классификационной схемы в сторону объединения как нескольких мотиваций в одну, так и университетов в региональные группы. Применение статистических методов позволяет получить более четкую картинку мотиваций создания внешних гиперссылок на сайтах нигерийских университетов и дать ряд рекомендаций для разработчиков, направленных на улучшение использования внешних гиперссылок.

Ключевые слова: гиперссылка, университетский веб-сайт, университеты Нигерии, мотивация.

Введение

Несмотря на нынешний интерес к исследованиям гиперссылок в научных исследованиях и многим результатам, указывающим, что гиперссылки связаны с ранжированием результатов и результативностью поиска в Вебе [1−5], о мотивах создания гиперссылок сказано немного [6; 7]. Отсутствие понимания мотиваций создания гиперссылок является одним из главных препятствий формирующегося научного направления «вебометрика», и оно должно быть преодолено, несмотря на его очевидную сложность (см.: [6]).

На практике очень трудно (наверное, и невозможно) оценить и классифицировать веб-коммуникации в целом, что обусловлено как неоднородностью форм публикаций в Вебе, так и техническими проблемами, связанными с получением соответствующей информации, даже без учета размеров Веба.

Некоторые авторы предприняли попытку развить подход, предложенный в [6], в направлении исследования и понимания мотиваций создания гиперссылок применительно к университетам Нигерии. По данным Национальной университетской комиссии Нигерии в стране насчитывается 125 университетов [8]. Список доменных имен, указанных в [8], являлся неполным и неточным, он был принят лишь в качестве основы и многократно дополнялся и уточнялся в процессе исследования. Так, из рассмотрения были исключены неработающие официальные сайты университетов. Поскольку уточнение списка продолжается, в статье мы остановились на целевом множестве, содержащем 86 доменных имен официальных сайтов университетов Нигерии.

Нигерия состоит из 36 штатов и одной федеральной столичной территории, которые по географическим и этнокультурным признакам составляют пять регионов: Север, Юго-Запад, Юг, Юго-Восток и так называемый Центральный пояс. Из 86 исследуемых сайтов мы проанализировали 13 сайтов с Cевера страны, 16 – из Центрального пояса, 28 – с Юго-Запада, 14 – с Юго-Востока и 15 сайтов – с Юга страны.

В статье изложены результаты анализа более чем 6300 исходящих гиперссылок, сделанных с 86 официальных сайтов нигерийских университетов, в целях выяснения мотиваций их создания. Представляется, что авторам удалось обнаружить существенное различие в мотивациях создания внешних гиперссылок на официальных университетских сайтах в зависимости от регионов Нигерии. Это, в свою очередь, позволило сформулировать ряд рекомендаций для разработчиков веб-сайтов, направленных улучшение использования внешних гиперссылок как одного из основных инструментов коммуникации в Вебе.

Связанные исследования

Анализ гиперссылок в Вебе является новой областью исследований, возможно, лишь внешне напоминающей анализ научного цитирования [9; 10]. «Веб-ссылки являются радикально новым явлением, хотя частичные аналогии могут быть проведены с уже существующими подобными объектами, включая... цитирование в журналах» [6].

Остановимся несколько подробнее на цитируемой статье (см.: [6]), поскольку именно предложенные в ней подходы использованы авторами в качестве основы для исследований. Как инструмент сбора гиперссылок авторы названной статьи использовали краулер, с помощью которого были отсканированы сайты университетов Великобритании. Затем из этой коллекции был произведен случайный выбор гиперссылок при определенных ограничениях и условиях (например, были исключены неработающие гиперссылки и гиперссылки, отсылающие на «собственный» сайт). Кроме того, рассматривались только внешние гиперссылки на сайты, размещенные в домене второго уровня ac.uk (так называемый «академический» домен, от англ. «academic»), служащего доменом для сайтов учреждений высшего образования, колледжей, научно-исследовательских учреждений и научных сообществ Великобритании. В целях сосредоточения только на академических сайтах были также исключены гиперссылки на электронные журналы, сайты которых расположены в домене ac.uk.

После того как был окончательно составлен рассматриваемый набор гиперссылок (отобрано 414 ссылок, исходящих со 170 академических сайтов), исследователи независимо друг от друга проанализировали эти гиперссылки, оценили и классифицировали мотивации их создания. Оценка проводилась путем изучения исходных и целевых страниц исследуемых гиперссылок. В итоге исследователи совместно разработали схему классификации, где изначально были выделены 10 возможных мотиваций, по которым и были распределены 414 отобранных гиперссылок. Затем эти 10 мотиваций были обобщены до трех в целях уточнения классификации.

В результате авторы рассматриваемой статьи (см.: [6]) пришли к следующим выводам:

  • мотивации для создания ссылок на основе изучения только исходных и целевых страниц трудно классифицировать потому, что (а) существуют различные возможные мотивации, (б) сложно правильно угадать истинные намерения авторов в некоторых случаях и (в) потенциально существуют многократные мотивации; отсюда авторы делают вывод, что лучшая схема классификации могла бы привести к «более надежным результатам»;
  • мотивация создания большинства гиперссылок между сайтами британских университетов не является подобной мотивации цитирования журнальных статей в научных публикациях;
  • напрямую учебные материалы одного университета очень мало используются в других университетах, несмотря на «обширное финансирование объединенного межучережденческого обучения», и это, возможно, является показателем того, что финансирование подобных проектов объединенного межуниверситетского обучения неэффективно.

Задачи и методы исследования

Исследование мотиваций создания гиперссылок, сделанных с сайтов нигерийских университетов, подразумевает ответы на следующие два вопроса:

  • какие мотивации стоят за размещением гиперссылок на нигерийских университетских сайтах?
  • какие мотивации создания гиперссылок наиболее характерны для этногеографических регионов Нигерии?

Как уже было сказано, нами использовались подходы, предложенные в [6], однако есть существенные отличия:
  • исследуемое множество гиперссылок содержит все внешние гиперссылки, сделанные с сайтов нигерийских университетов, а не только гиперссылки, связывающие эти сайты;
  • предложена существенно иная схема классификации гиперссылок.

В качестве инструмента для сбора гиперссылок использовался краулер BeeBot [11], с помощью которого было отсканировано 86 сайтов университетов Нигерии, на которых было обнаружено более 6300 исходящих гиперссылок.

Из 86 исследованных сайтов наибольшее количество исходящих гиперссылок имеет сайт University of Agriculture, Abeokuta (www.unaab.edu.ng) – 1027. В то же время восемь сайтов исследуемых университетов имеют всего по одной исходящей гиперссылке (далее они были исключены из рассмотрения). Среднее количество исходящих гиперссылок, размещенных на сайтах 86 исследуемых университетов, равно 74.

Классификационная схема

Изначально были выделены 24 основные мотивации, приведенные в табл. 1.

ТАБЛИЦА 1 Основные мотивы для создания гиперссылок







Последнюю мотивацию правильнее назвать «псевдомотивацией», поскольку в этой группе фиксировалось количество неработающих гиперссылок. Из-за невозможности указать значения по всем 86 университетам приведены значения только по 5 из них (по 1 университету от каждого этнокультурного региона Нигерии).
Из 6358 исследованных ссылок авторы расходились во мнениях по их классификации в 699 случаях. Это несогласие зачастую было обусловлено существованием частичного совпадения между определенными мотивациями. Приведем несколько примеров:

  • ссылку (зачастую оформленную как баннер), отсылающую к товарам или услугам, предоставляемым компанией, можно интерпретировать как ссылку на информацию о товарах, услугах (мотивация «Рекламные ссылки»), либо как ссылку на информацию об отдыхе и туризме (мотивация «Информация об отдыхе и туризме»), либо даже как ссылку на веб-ресурс организации, для которой коммерческая деятельность является основной (мотивация «Коммерческая организация»);
  • ссылка со страницы сайта библиотеки одного университета на книгу, находящуюся на странице сайта библиотеки другого университета, может быть классифицирована как ссылка на подобную организацию (мотивация «Подобная по виду деятельности организация»), либо как ссылка на учебные материалы для обучающихся (мотивация «Учебные материалы для обучающихся») или как ссылка на ресурсы поддержки исследований (мотивация «Ресурсы поддержки научных исследований»);
  • ссылка с сайта одного университета на сайт другого университета, выступающего как один из спонсоров конференции, проходящей в первом университете, может быть рассмотрена как ссылка на веб-ресурсы спонсоров мероприятий (мотивация «Веб-ресурсы спонсоров мероприятий») или как ссылка на подобную организацию (мотивация «Подобная по деятельности организация»).
Вследствие этого классификационная схема была упрощена путем объединения строк табл. 1 с сокращением количества мотиваций с 24 до 9. То же самое было проделано и со столбцами классификационной схемы. При объединении столбцов все исследуемые университеты были собраны по регионам в пять указанных групп с соответствующим суммированием количества гиперссылок. Результаты указанных действий приведены в табл. 2.

Таблица 2. Обобщенная таблица мотивов и частот

В табл. 2 мотивы «Учебные материалы для обучающихся», «Информации для обучающихся и поступающих», «Неклассифицированный сайт» и «Неработающая ссылка» остаются такими же, как и в табл. 1.
Мотив «Поддержка научных исследований» в табл. 2 является объединением мотивов «Ресурсы поддержки научных исследований», «Публикации сотрудников», «Библиотеки и электронные журналы» и «Цитируемая статья» из табл. 1. Мотив «Вышестоящая организация» является объединением мотивов «Вышестоящая организация» и «Органы государственной власти». Далее, мотив «Подобная по деятельности организация и нижестоящая организация» является объединением следующих мотивов: «Подобная по виду деятельности организация», «Нижестоящая организация», «Организация-партнер» и «Альтернативный сайт». Мотив «Служебный сайт» является объединением мотивов «Служебный сайт», «Личные страницы», «Новостная лента», «Научное мероприятие». Наконец, мотив «Организации сферы бизнеса» объединяет мотивы «Доступ к программному обеспечению», «Веб-ресурсы спонсоров мероприятий», «Коммерческая организация», «Рекламные ссылки и баннеры», «Информацию об отдыхе и туризме», «Сайт разработчиков данного сайта».
И без статистической обработки данных табл. 2 можно заметить, что на Юго-Востоке почти не обращают внимания на ссылки на учебные материалы для обучающихся, на Севере большое внимание уделяется поддержке научных исследований, а на Юго-Западе много неклассифицированных гиперссылок. Отметим, однако, что мы анализируем неравные по количеству университетов регионы. В Юго-Западном регионе имеется наибольшее количество университетов, и, следовательно, потенциально значения величин в табл. 2 в столбце «Юго-Запад» должны быть большими. Отметим также, что ссылки, имеющие мотивацию «Поддержка научных исследований», занимают 37% от общего количество исследуемых ссылок, а ссылок с мотивацией «Вышестоящая организация» всего лишь 2%.
Для применения статистических методов вместо табл. 2 была использована табл. 3, в которой количество университетов по каждому региону равно 13 (минимальное значение у Северного региона). Университеты в каждой группе отбирались методом случайного отбора.

Таблица 3. Рандомизированная обобщенная таблица мотивов и частот

Проверка статистической гипотезы о независимости полученных данных с использованием критерия Пирсона [12] показала, что есть существенная разница между наборами данных (ожидаемыми и наблюдаемыми частотами), которая не объясняется только случайными причинами.

Обсуждение и выводы
Не вдаваясь в математические детали, можно сказать, что для каждого региона можно выделить доминирующую мотивацию создания внешних гиперссылок. В Северном и Юго-Западном регионах и Центральном поясе такой доминантой является поддержка научных исследований, а в Южном и Юго-Восточном регионах отсылка к служебным сайтам. Отсюда складывается впечатление, что сотрудники этих университетов пока еще не привыкли пользоваться почтовыми сервисами и информационными системами, поэтому их стимулируют к такой деятельности.
При этом обращает на себя внимание большое количество гиперссылок, размещаемых на сайтах университетов Юго-Востока и отсылающих к информации для студентов и абитуриентов, носящей бытовой, а не учебный характер.
Подводя итоги, можно сказать, что между университетами имеются немалые различия по регионам в создании гиперссылок. На сегодняшний день невозможно дать содержательное объяснение обнаруженным различиям. Может быть, на Юге вопрос с финансовой поддержкой научных исследований полностью решен, а на Севере наблюдается плохое финансирование, а может быть, наоборот, на Севере научные исследования ведутся очень интенсивно, а на Юге они полностью отсутствуют. Но при этом результаты исследования позволяют дать ряд рекомендаций разработчикам нигерийских университетских сайтов:

  • во всех регионах гораздо большее внимание должно быть уделено гиперссылкам на учебные материалы (может быть, проблема еще более глубокая, заключающаяся в малом количестве таких материалов, и, как следствие, – в отсутствии гиперссылок на них);
  • следует обратить более пристальное внимание на гиперссылки, сделанные на сайты других учебных организаций и их подразделений (слабая связность веб-пространства университетов Нигерии уже отмечалась в [13]);
  • неработающие ссылки (объединенные в специально введенную группу как псевдо-мотивация) не оказывают практически никакого влияния на общий характер поведения разработчиков сайтов, но все-таки с ними надо бороться.

Литература
1. Thelwall M. Results from a Web Impact Factor Crawler // Journal of Documentation. 2001. № 57(2). Pp. 177–191.
2. Thomas O., Willett P. Webometric analysis of departments of librarianship and information science // Journal of Information Science. 2000. № 26 (6). Pp. 421–428.
3. Chu H., He S., Thelwall M. Library and information science schools in Canada and USA: a Webometric perspective // Journal of Education for Library and Information Science. 2002. № 3(2). Pp. 110–125.
4. Smith A., Thelwall M. Web Impact Factors for Australasian Universities // Scientometrics. 2002. №54 (1–2). Pp. 363–380.
5. Tang R., Thelwall M. Exploring the pattern of links between Chinese university web sites // Proceedings of the ASIST Annual Meeting. 2002. Pp. 417–424.
6. Wilkinson D., Harries G., Thelwall M., Price L. Motivations for academic web site interlinking: evidence for the Web as a novel source of information on informal scholarly communication // Journal of Information Science. 2003. №29 (1). Pp. 49–56.
7. Печников А. А, Луговая Н. Б., Чуйко Ю. В., Косинец И. Э. Разработка инструментов для вебометрических исследований гиперссылок научных сайтов // Вычислительные технологии. 2009. Том 14. №5. С. 66−78.
8. National Universities Commission // URL: http://www.nuc.edu.ng/pages/universities.asp (дата обращения 10.01.2013).
9. White M. D., Wang P. A qualitative study of citing behavior: contributions, criteria, and
metalevel documentation concerns // Library Quarterly. 1997. № 67 (2). Pp. 122–154.
10. Oppenheim C., Renn S. P. Highly cited old papers and reasons why they continue to be cited // Journal of the American Society for Information Science. 1978. № 29 (5). Pp. 225–231.
11. Печников А. А., Чернобровкин Д. И. Адаптивный краулер для поиска и сбора внешних гиперссылок // Управление большими системами. 2012. Вып. 36. С.301−315.
12. Буре В. М. Методология статистического анализа опытных данных. СПб: Изд. СПбГУ, 2007. 141 с.
13. Pechnikov A., Nwohiri A. Webometric analysis of Nigerian university websites // Webology. 2012. № 9 (1) // URL: http://www.webology.org/2012/v9n1/a95.html.

____________________________________________

Антони Метумараибе НВОХИРИ

аспирант факультета прикладной математики − процессов управления

Санкт-Петербургского государственного университета

Андрей Анатольевич ПЕЧНИКОВ

ведущий научный сотрудник

Института прикладных математических исследований

Карельского научного центра РАН


&copy Информационное общество, 2012, вып. 6, с. 26-34 .