Скипор И.Л., Сбитнева Е.А.

КООРДИНАТНОЕ ИНДЕКСИРОВАНИЕ В ИНФОРМАЦИОННО-БИБЛИОТЕЧНЫХ СИСТЕМАХ И СЕТЯХ: РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ ИНСТРУКТИВНО-МЕТОДИЧЕСКОЙ ДОКУМЕНТАЦИИ

Активное внедрение информационно-коммуникационных технологий в деятельность библиотек, их тесное взаимодействие при производстве информационных продуктов и услуг, объединение информационных ресурсов библиотечно-информационных учреждений различных типов повлекло за собой расширение состава используемых лингвистических средств, что обусловлено, главным образом, стремлением разработчиков увеличить поисковые возможности электронных каталогов, а также необходимостью достижения совместимости лингвистического обеспечения (ЛО) информационно-библиотечных систем и сетей (ИБС) в условиях корпоративного взаимодействия.

Обеспечение надежности функционирования подсистемы ЛО в значительной мере зависит от состояния нормативно-справочной базы, одним из важнейших компонентов которой является инструктивно-методическая документация. Следует отметить, что формирование нормативно-справочной базы лингвистического обеспечения осуществляется за счет разработки документов как на государственном уровне, так и на уровне информационно-библиотечной корпорации, информационно-библиотечной системы либо отдельной библиотеки.

Целью настоящего исследования был сравнительный анализ подходов к реализации технологии координатного индексирования, отраженных в инструктивно-методических документах отдельных библиотек, информационно-библиотечных систем и сетей, в том числе корпоративных. При этом полученные данные соотносились с требованиями ГОСТ 7.66-92 СИБИД. Индексирование документов. Общие требования к координатному индексированию, а также с подходами, представленными в научных публикациях и методиках, разработанных ведущими информационно-библиотечными центрами страны. Кроме того, была предпринята попытка оценить существующие подходы к координатному индексированию с точки зрения возможностей проведения информационного поиска по ключевым словам в электронных каталогах библиотек, входящих в состав корпораций (на примере Открытой электронной библиотеки г. Томска, Омского библиотечного консорциума, Региональной корпоративной библиотечной системы г. Новосибирска).

В ходе исследования проанализированы документы: правила заполнения поля "Ключевые слова" (Корпоративная сеть библиотек Урала), инструкции по индексированию документов (Корпоративная сеть московских библиотек, Открытая электронная библиотека г. Томска, Муниципальная информационная библиотечная система г. Томска, МУК "Централизованная система муниципальных библиотек г. Омска"), методические рекомендации (Корпоративная библиотечная сеть г. Казани, НТБ Красноярской государственной технологической академии), нормативно-технические предписания (ВИНИТИ).

Исследование подходов к реализации технологии координатного индексирования в ИБС осуществлялось по следующим параметрам: анализ требований к составу и последовательности выполнения технологических операций; анализ требований к составу ПОД с точки зрения количественных и качественных характеристик; анализ требований к представлению лексических единиц в составе ПОД. Анализ документов по формальным признакам (структура, правила оформления) показал, что, несмотря на наличие традиционного набора компонентов (введение, общие положения, объект, предмет рассмотрения, правила формирования ключевых слов, список литературы), в большинстве случаев отсутствует четко заданная структура документа.

Требования к составу и последовательности выполнения технологических операций в ходе координатного индексирования в рассмотренных документах ограничиваются лишь указанием на два этапа, характерных для любого вида индексирования: анализ содержания документов; перевод результатов анализа содержания документа на ИПЯ (в анализируемых документах данный этап называется "Формирование ключевых слов", "составление ключевых слов" и т.п.). При этом правила сводятся к указанию подлежащих изучению частей документа (в соответствии с ГОСТ 7-66-92): заглавие, продолжение заглавия, аннотация или реферат, оглавление (содержание), введение (предисловие), заключение (послесловие), первые фразы глав или параграфов, слова или группы слов, подчеркнутые или выделенные особым шрифтом, иллюстрации, схемы, таблицы. В отдельных документах этот перечень расширяется за счет включения: алфавитно-предметного указателя.

Анализ требований к составу поискового образа документа с точки зрения количественных характеристик позволил установить, что попытка регламентировать количество отражаемых в ПОД ключевых слов представлена лишь в 4 документах. Так, например, в методических рекомендациях Казанской РКБИС оптимальным считается количество от 8 до 12 КС на каждое издание; в соответствии с нормативно-техническим предписанием ВИНИТИ в состав ПОД следует включать 3-5 КС; методическими рекомендациями НТБ КГТА определяется минимальное количество - не менее 3 КС на документ. Инструкцией, разработанной сотрудниками МИБС г. Томска указывается лишь максимально возможное число - 250 КС. Анализ реальных каталогов библиотек показывает, что число ключевых слов в составе ПОД в среднем составляет от 1 до 250.

Особого внимания заслуживает состав аспектов содержания, отражаемых в ПОД с помощью ключевых слов. Следует отметить, что качественные характеристики либо не вообще рассматриваются, либо ограничиваются фразами типа "список ключевых слов должен, в первую очередь, отражать те части документа, которые представляют наибольший читательский спрос", "следует стремиться к полноте отражения в ПОД всех наиболее важных понятий, рассматриваемых в документе" и т.п. Анализ ПОД электронных каталогов библиотек показывает, что отражаются, как правило, объекты (предметы) и аспекты исследования, область применения объекта, законы, уравнения, функции, географическая локализация объекта, временной период.

Наибольшее внимание во всех рассмотренных документах уделено требованиям к представлению лексических единиц в составе ПОД, в частности, правилам формулирования ключевых слов. В ходе проведенного исследования была предпринята попытка сгруппировать эти правила. В результате выделены 4 группы правил координатного индексирования: правила нормализации ключевых слов на морфологическом уровне; правила нормализации ключевых слов на семантическом уровне; правила представления специфических характеристик; правила оформления ключевых слов.

Группа правил нормализации ключевых слов на морфологическом уровне отражает подходы библиотек к установлению унифицированной формы записи КС (род, падеж, число), решению вопроса об использовании слов и словосочетаний, а также установлении порядка слов в словосочетании. Если по поводу падежа и рода в исследуемых документах используется одинаковый подход - именительный падеж и мужской род (для одиночных прилагательных и причастий), то в отношении числа такого единства нет. В большинстве документов предпочтение отдается множественному числу (для отражения исчисляемых понятий) и единственному числу (для отражения неисчисляемых понятий). Кроме того, во всех рассмотренных документах приводятся дополнительные рекомендации о выборе формы единственного и множественного числа в отдельных случаях, когда "не срабатывает" основное правило.

В соответствии с правилами, отраженными в инструктивно-методических документах, в качестве ключевых слов могут выступать как отдельные слова, так и словосочетания. При этом предпочтение отдается единичным словам, а варианты использования словосочетаний оговариваются специальными правилами. Анализ электронных каталогов библиотек позволил выявить следующее распределение единичных слов, словосочетаний в составе ПОД: 51% ключевых слов в составе ПОД представлен в виде словосочетаний, 47% - в виде единичных слов, 2% - в виде аббревиатур. При установлении порядка слов в словосочетании, как правило, рекомендуется использовать прямой порядок слов. Исключение составляют словосочетания, в которых одно из слов является личным именем (например, Ома закон, Ферма теорема, Доплера эффект и т.п.).

Правила нормализации ключевых слов на семантическом уровне, в частности, правила субстантивации прилагательных, причастий и глаголов являются идентичными во всех рассмотренных инструктивно-методических документах: глаголы записываются в виде отглагольного существительного или инфинитива, наречия заменяются на соответствующие прилагательные, а деепричастия преобразуются в соответствующие существительные. Рядом анализируемых документов предусмотрено устранение синонимии, полисемии и омонимии. Так, например, с целью устранения синонимии используются ссылки см. (МУК "Централизованная система муниципальных библиотек г. Омска"), все синонимы включаются в состав ПОД (МИБС г. Томска). В случае использования в составе ПОД аббревиатуры, она также дублируется полной формой наименования (МИБС г. Томска, Корпоративная сеть библиотек Урала). Для устранения полисемии и омонимии в ряде документов (Корпоративной библиотечной сети г. Казани, МИБС г. Томска, Корпоративная сеть библиотек Урала, НТБ КГТА) рекомендуется использовать два основных способа: развертывание слова до словосочетания и использование специальных помет, приводимых в скобках и уточняющих значение КС. К сожалению, на практике, как показали результаты поиска в реальных электронных каталогах, данные приемы используются применительно не ко всем документам.

Особую группу в структуре инструктивно-методических документов образуют правила представления специфических характеристик: географических названий, номенклатур (названий технических, программных средств, торговых марок, фирм и т.п.), дат и хронологических периодов, имен собственных и персоналий, видов изданий. Следует отметить, что отражение географических характеристик, как правило, осуществляется в соответствии с правилами, используемыми для представления аналогичных объектов в географических картах и справочниках. Для отражения в составе ПОД ключевых слов, выраженных именами собственными, номенклатурой, в принципе используются аналогичные подходы. Что же касается дат и хронологических периодов, то оказалось достаточно сложно установить какие-либо общие тенденции в их представлении, так как используются самые разнообразные подходы.

Последнюю группу выявленных в ходе исследования правил составляют правила оформления ключевых слов. Следует отметить, что данные правила обусловлены решениями, принятыми в конкретной корпорации или библиотеке, зачастую они диктуются особенностями используемых программных средств. Проведение поиска в электронных каталогах свидетельствует о том, что в принципе форма написания ключевых слов (прописные, строчные) не влияет на результаты поиска.

Полученные в ходе исследования результаты могут быть использованы при разработке инструкций, методических рекомендаций библиотечными корпорациями, информационно-библиотечными системами, отдельными библиотеками; при оптимизации действующих методик и инструкций координатного индексирования; при разработке документов по координатному индексированию на государственном и межкорпоративном уровнях.

Hosted by uCoz