Яшина Н.Г.

ОСНОВНЫЕ ЭТАПЫ ФОРМИРОВАНИЯ ГИПЕРТЕКСТОВОГО ЛИНГВИСТИЧЕСКОГО ПРОСТРАНСТВА ЭЛЕКТРОННОЙ БИБЛИОТЕКИ

Гипертекстовое лингвистическое пространство можно определить как форму существования и представления информации в электронной библиотеке (ЭБ), основанную на взаимодействии информационных блоков, включенных в структуру внутренних (в том числе ассоциативных) связей посредством системы ссылок, и позволяющую осуществлять информационный поиск с учетом этих связей. Гипертекстовое лингвистическое пространство должно представлять собой систему, объединяющую все уровни представления информации в ЭБ (метаинформационный и информационный).

Попытаемся наметить основные этапы формирования гипертекстового лингвистического пространства ЭБ.

Любая информационная система (а гипертекстовое лингвистическое пространство ЭБ является информационной системой) ориентирована на выполнение определенных задач и функций в соответствующей области функционирования организационной системы. Сфера функционирования организационной системы, о которой необходимо хранить информацию в информационной системе, носит название предметной области (ПО) данной информационной системы. С этой точки зрения, гипертекстовое лингвистическое пространство ЭБ представляет собой динамическую модель ПО, состояния которой адекватно отображают динамику изменений самой ПО. Для построения модели ПО, отображающей ее динамику, необходимы анализ и описание предметной области.

Анализ и описание предметной области включает: 1. Выявление объектов и их атрибутов (свойств); 2. Выявление связей между объектами и определения отношений; 3. Построение концептуальной модели ПО; 4. Формирование общей структуры метаданных.

Метаинформационная составляющая гипертекстового лингвистического пространства ЭБ должна включать модели представления библиографических данных для каталогизации различных объектов, классификации, используемые для многоаспектной характеристики документов, языки запросов и тезаурус.

Построение информационных систем в процессе разработки информационно-поисковых языков вызывает вопрос о статусе их единиц. При разработке принципов упорядочения и стандартизации отраслевых терминологий в центре внимания находится пара “понятие – термин” и соответственно “система понятий – система терминов”. Тезаурус как информационно-поисковый язык вербального типа представляет собой некоторую итоговую форму представления систематизированного материала. Отраслевой тезаурус – это дискретный парадигматический инструмент со своим метаязыком, который может служить лингвистической моделью целостного знания, выраженного в научных текстах. Это словарь с концептуальным входом и фиксированными семантическими связями между единицами. Функциональная значимость тезауруса для гипертекстового лингвистического пространства ЭБ определяется тем, что он, представляя собой терминосистему науки, одновременно является одним из наиболее оптимальных способов классификации, хранения и создания поискового образа документов в электронных библиотечных информационно-поисковых системах. Кроме того, на этапе создания гипертекстовой системы тезаурус будет выступать в качестве экспертной системы, призванной помочь грамотно сформировать гипертекстовый документ.

Разработка тезауруса является вторым этапом формирования гипертекстового лингвистического пространства ЭБ. Информационно-поисковый тезаурус (ИПТ) должен включать следующие составляющие:

1. Лексико-семантический список дескрипторов и их вариантов:

- словарь, задающий перевод ключевых слов естественного языка на дескрипторный информационно-поисковый язык;

- список классов условной эквивалентности;

- указатель парадигматических отношений между дескрипторами.

2. Указатель иерархических отношений между дескрипторами:

- дескриптор→иерархия видовых дескрипторов

3. Руководство по переводу ключевых слов естественного языка на дескрипторный информационно-поисковый язык:

- правила изменения ИПТ;

- правила пополнения ИПТ

Разработка тезауруса предполагает: 1. Построение словника ключевых слов (КС); 2. Дескрипторизация КС; 3. Установление парадигматических отношений между дескрипторами; 4. Оформление тезауруса.

К тезаурусу как составляющей гипертекстового лингвистического пространства ЭБ предъявляются следующие требования:

к глоссарию:

-системно-предметная ориентация глоссария;

-разделение на элементы и связи (отношения);

-представление элементов и связей гипертекстами;

-необходимая полнота;

к структуре тезауруса:

-иерархичность;

-изоморфизм для точек зрения (заказчик, разработчик, пользователь);

-сочетание сетевых и фреймовых структур;

к интерфейсу:

-удобство сопряжения с предметными тезаурусами;

-наглядность;

-последовательный (через меню системы) или непосредственный доступ.

Тезаурус, являясь основой модели семантической информации, позволит перейти к следующему этапу формирования гипертекстового лингвистического пространства ЭБ.

Третий этап – создание гипертекстовой системы с использованием тезауруса в качестве экспертной системы. Качество гипертекстового документа зависит от компетентности автора. Компетентности только в одной предметной области недостаточно, чтобы грамотно сформировать гипертекстовый документ. Автору необходимо быть специалистом в авторизируемой предметной области, специалистом в области гипертекстовых технологий (чтобы использовать все возможности гипертекстовой системы), а также психологом и педагогом (чтобы ориентировать гипертекстовый документ на конкретного пользователя). Однако практически невозможно быть в достаточной мере компетентным во всех перечисленных выше областях, а привлекать к работе экспертов по каждой области знаний экономически невыгодно. Для решения данной проблемы можно использовать экспертную систему, которая могла бы помочь грамотно сформировать гипертекстовый документ. Тезаурус отражает как понятия определенной области знаний, так и связи между ними, необходимые для создания гиперсвязей в гипертекстовой системе, и, следовательно, может выступать в качестве экспертной системы.

Таким образом, формирование гипертекстового лингвистического пространства ЭБ предполагает три этапа.

Hosted by uCoz