Платонова Т.Е.

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КАК ОДНО ИЗ СРЕДСТВ ИНТЕЛЛЕКТУАЛИЗАЦИИ БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

В ХХІ в. человеческая цивилизация вступила в новую информационную эпоху. Значительные социально-политические и экономические изменения, происходящие в обществе сегодня, влияют на развитие библиотечного дела, требуют более высокого уровня оперативности и качества информационного обеспечения современного пользователя. В условиях информатизации в библиотеках начинается трансформация традиционных технологий на всех этапах и в процессах библиотечной деятельности. Возникают принципиально новый аспект развития системы документальных коммуникаций и новые формы организации документов, среди которых все большего распространения приобретают электронные библиотеки (ЭБ).

С возникновением первых автоматизированных библиотечных информационных систем (АБИС), электронных каталогов и библиографических баз данных (БД) возник вопрос обеспечения точек доступа к информации, которые обеспечивают традиционные библиотечные технологии, а также усовершенствования узкотематического информационного поиска (ИП) на основе новейших компьютерных и телекоммуникационных систем.

Одним из основных средств интеллектуализации информационных технологий является лингвистическое обеспечение ЭБ, которое определяется как незаменимый инструмент тематической систематизации массивов информации, аналитической обработки знаний, реализации удобного пользовательского интерфейса, поддержки издания информационных продуктов и услуг (тематические информационные справки, библиографические указатели, реферативные издания, аналитические обзоры, многоаспектный информационный поиск). Комплекс лингвистических средств определяется его назначением - необходимостью обеспечивать работу с информационной системой на уровне раскрытия содержания знаний, практически он является системой лингвистической поддержки интеллектуальной деятельности библиотечно-информационного сервиса.

Выполнение любого вида аналитико-синтетической обработки документов: аннотирование, реферирование, индексирование, контент-анализ, библиометрическое или наукометрическое исследование, а также создание прогнозно-аналитических или проблемно-ориентированных БД невозможно без соответствующей систематизации фонда документов. Так, индексирование литературы при обработке научно-технической информации предусматривает сжатие текста: аннотирование, реферирование, выбор из него ключевых понятий данной отрасли знаний с помощью соответствующего отраслевого тезауруса или классификатора.

Одним из основных средств тематической систематизации и представления знаний в библиотечном фонде (печатных или электронных документов и изданий) сегодня, как и раньше, остается библиотечная классификационная схема (тезаурус, рубрикатор, классификатор, язык предметных рубрик). Таким образом, классификационная схема как универсальный механизм группировки документов по определенной иерархической структуре предметных категорий полноценно исполняет свои функции и в новой технологии.

Для обеспечения совместимости электронных и карточных каталогов библиотеки вынуждены будут поддерживать различные классификационные схемы индексирования и в дальнейшем. Переход на единую для всех библиотек систему индексирования документов сегодня невозможен, так как это требует большой затраты времени, а также значительных финансовых и трудовых ресурсов.

Поэтому за основу разработки лингвистического обеспечения ЭБ необходимо взять принцип инвариантности системы индексирования документов в конкретной библиотеке. Один из подходов к практической реализации этого принципа - создание и включение в состав лингвистических средств системы комплекса БД с информацией о библиотечных классификационных схемах. Формат записей в этих БД должен иметь структуру “классификационный индекс - словесное определение - сопровождающие термины”, а поисковые средства поддерживать навигацию по иерархии индексов. Второе направление предусматривает использование развитых средств морфологического анализа и грамматической нормализации лексики, которые дают возможность формулировать поисковые запросы языком, приближенному к природному. В системе должны развиваться как первое, так и второе направления интеллектуализации средств компьютерной лингвистики.

Обязательным элементом лингвистического обеспечения ЭБ должны быть файлы авторитетных данных, которые будут выполнять роль справочного аппарата. Файлы авторитетных данных включают заголовки библиографических записей (имена авторов, наименования коллективов, названия сериальных изданий, унифицированные названия классических анонимных сочинений, предметные рубрики и т.д.). Список должен быть снабжен обширным ссылочно-справочным аппаратом, включающим общие ссылки (“см.”), связывающие ссылки (“см. также”) иерархического и ассоциативного характера, текстовые примечания и другую дополнительную информацию.

Таким образом, лингвистическое обеспечение ЭБ должно давать возможность формулировать поисковые запросы и в виде произвольных терминов, и в форме классификационных индексов. Комплекс лингвистических средств должен автоматически проводить трансформацию терминов в соответствующие им классификационные индексы с учетом имеющейся системы ссылок, унификацию заголовков библиографических записей на основе файлов авторитетных данных и морфологический анализ, а также грамматическую нормализацию лексики.

Недостаточная разработанность лингвистического обеспечения ЭБ негативно сказывается на информационно-библиотечном обслуживании пользователя. Поэтому, для выполнения изложенных требований необходимо тесное сотрудничество с ведущими специалистами в области библиотеко- и библиографоведения, информатики, языкознания.

Hosted by uCoz