Яшина Н.Г.

ФОРМИРОВАНИЕ ГИПЕРТЕКСТОВОГО
ЛИНГВИСТИЧЕСКОГО ПРОСТРАНСТВА ЭЛЕКТРОННОЙ
БИБЛИОТЕКИ В ПРОЦЕССЕ ИНФОРМАЦИОННОГО ПОИСКА

Одной из основных форм существования электронных текстов является гипертекст. В течение последних десятилетий в рамках гуманитарно-философских исследований возникло новое направление, получившее название постструктурализма. Представители этого направления выступают с критикой замкнутого текста, жестко выстроенного в соответствии с замыслом автора. Они ищут способы прослеживать смысловые ряды, выходящие за пределы авторского текста. Их идеи легли в основу методологии нелинейного письма, позволяющего выйти за рамки одномерной последовательности слов звуковой речи, дать простор движению мысли, и послужили теоретическим обоснованием создания гипертекстовой технологии.

С позиций компьютерной семиотики гипертекст привлекателен, прежде всего, в связи с возможностью использования образных механизмов мышления человека при работе с компьютерной системой, а также тем, что процесс установления семантической связи между узлами гипертекстового информационного массива максимально соответствует природе мышления человека.

Гипертекстовые системы близки другому виду программных систем, базам данных: некоторые информационные задачи можно реализовать как в форме базы данных, так и в форме гипертекста. При этом одни информационные задачи предпочтительнее реализовывать как гипертексты (если они обладают относительно менее регулярной внутренней структурой, обилием текстовой информации, сложной системой перекрестных ссылок), другие – в виде базы данных (если основная информация представлена в виде большого объема регулярных данных, важен быстрый поиск данных, необходимость постоянного изменения данных, возможно в параллельном режиме и из разных мест). Есть также задачи, требующие синтеза этих технологий. К таким задачам следует отнести формирование лингвистического пространства электронной библиотеки.

Проведенный анализ отечественных и зарубежных публикаций, посвященных проблемам гипертекста, позволил нам выделить следующие черты, характеризующие гипертекст и фигурирующие в большей части определений данного понятия: взаимосвязанные информационные блоки; система ссылок; структура внутренних связей; нелинейность; особая форма организации – сетевая структура; техническая среда.

С развитием концепции электронных библиотек перед гипертекстовыми технологиями открываются новые сферы применения. Выходя за рамки отдельного электронного документа в условиях электронной библиотеки гипертекст предоставляет возможность интегрировать (и дифференцировать) информацию по разным аспектам.

Логика развития представлений о лингвистическом обеспечении информационных систем и опыт разработки и использования лингвистических средств в условиях электронных библиотек позволяют сделать вывод о существовании тенденции к интеграции в условиях ЭБ лингвистического, программного обеспечения и информационных ресурсов, составляющих ЭБ, что свидетельствует о формировании единого лингвистического пространства.

Исходя из анализа сущности понятий “гипертекст”, “пространство”, “информация”, гипертекстовое лингвистическое пространство можно определить как форму существования и представления информации в ЭБ, основанную на взаимодействии информационных блоков, включенных в структуру внутренних связей посредством системы ссылок и позволяющую осуществлять информационный поиск с учетом этих связей.

Электронная библиотека в нашем понимании представляет собой двухуровневую систему, состоящую из библиографической базы данных с рефератами и / или аннотациями и связанной с ней базы цифровых объектов документов. Соответственно формирование гипертекстового лингвистического пространства электронной библиотеки должно осуществляться на двух уровнях: метаинформационном и информационном. Рассмотрим технологию формирования гипертекстового лингвистического пространства в процессе поиска информации на примере электронной библиотеки ИНФО-АРТ: Прикладная информатика в социально-культурной сфере.

ИНФО-АРТ представляет собой информационную систему, позволяющую надежно сохранять и эффективно использовать разнообразные коллекции электронных документов (текстовых, изобразительных, звуковых, видео и др.), локализованных в самой системе, а также доступных ей через телекоммуникационные сети. Система ИНФО-АРТ является современным механизмом распространения научных, учебных, учебно-методических и других материалов в вузовской среде и профессиональном сообществе специалистов социально-культурной сферы.

К особенностям системы ИНФО-АРТ также относится:

1. Интеграция локальной информационной активности пользователей в единое информационное пространство.

2. Интернет-технологии системы ИНФО-АРТ превращают интегральную базу данных в информационное пространство 2-го поколения, которое отличается от традиционных систем навигации (Яндекс, Рамблер и т.п.) специализацией на комплексном обслуживании потребностей членов профессионального сообщества.

3. Возможность внедрения технологий ИНФО-АРТ в работу исследовательских и образовательных организаций.

4. Интерактивность, взаимодействия на уровне сообщества в целом, инструменты которых используют эффект регулярности просматривания членами сообщества одних и тех же веб-страниц системы.

Реализация перечисленных функций системы обеспечивается средствами ввода, поиска и представления информации, бъединенными технологией гипертекстового лингвистического пространства системы.

Блок поиска информации ЭБ ИНФО-АРТ состоит из компонентов: атрибутивный поиск; поиск по тезаурусу; интеллектуальный поиск; все документы.

Атрибутивный поиск. Универсальный атрибутивный поиск рекомендуется применять в следующих случаях: 1) когда более или менее точно известно, какие документы или материалы нужны, т.е. известны значения их атрибутов или достаточно определенно можно воспроизвести контекст; 2) когда осуществляется поиск по комбинации различных признаков. Главная особенность универсального поиска – возможность гибко комбинировать признаки поиска. Поддержка аппарата гипертекстовых и гипермедийных связей, создающихся непосредственно в процессе поиска, обеспечивает пользователю оперативный переход от объекта или некоторого его элемента к другому взаимосвязанному с ним объекту или его элементу. При этом допускается существование связей типа “один-к-одному” и “один-ко-многим”.

Поиск по тезаурусу. Тезаурус позволяет решить проблему установления соответствия между: 1) авторской терминологией (понятиями и словами естественного языка, которые автор использует для обозначения этих понятий); 2) терминологией системы (понятиями и терминами, которые используются для выражения этих понятий при вводе документов в ИПС); 3) терминологией потребителя (понятиями и терминами, которые потребитель использует для представления этих понятий при формировании запросов). К достоинствам использования тезауруса при поиске документов относятся возможности уточнения запроса пользователем и расширения поиска на основе тезаурусных связей. Тезаурус системы ИНФО-АРТ представлен в виде упорядоченного по алфавиту списка дескрипторов. При активизации одного из дескрипторов отображается дескрипторная статья. Кроме терминов, дескрипторная статья включает гиперссылки, активизация которых вызывает программу поиска документов содержащих выбранный термин. Поиск возможен по всем терминам тезауруса, включая синонимы. Результат поиска отображается в текущем окне в виде списка заглавий документов, каждый из которых снабжен гиперссылкой, позволяющей перейти к первичному документу.

Интеллектуальный контекстный поиск может быть рекомендован в следующих случаях: 1) трудно точно сформулировать запрос; 2) не известны термины, которыми характеризуется проблема; 3) в результате поиска необходимо получить максимум документов, пусть даже отдаленно относящихся к проблеме; 4) проблема не достаточно конкретна. По результатам поиска система выстраивает найденные документы по степени их близости к контексту заданного запроса. Каждому документу присваивается вес. Документы с наибольшим весом имеют большую вероятность содержать полезную информацию и будут располагаться вверху списка.

Кроме рассмотренных видов поиска система ИНФО-АРТ предоставляет возможность просмотра всех документов.

Формирующееся в процессе поиска гипертекстовое лингвистическое пространство ЭБ ИНФО-АРТ представляет собой динамическую систему, реализующую альтернативные сценарии поиска в зависимости от вида, тематики запросов, уровня подготовленности пользователя.

Hosted by uCoz