Вершинин М.И.

ПРЕДСТАВЛЕНИЕ БИБЛИОГРАФИЧЕСКИХ БАЗ ДАННЫХ В ИНТЕРНЕТ

Для представления баз данных (БД) на веб-страницах используются следующие основные способы: статическая публикация веб-страниц, содержащих информацию из БД; динамическая публикация веб-страниц, содержащих информацию из БД.

При статической публикации БД веб-страницы создаются и хранятся на веб-сервере до поступления запроса на их получение. Этот способ используется при публикации информации, содержащейся в достаточно редко актуализируемой БД. Такая организация публикации БД имеет ряд преимуществ: более быстрый доступ к информации; уменьшение нагрузки на сервер при обработке запроса.

Динамическая публикация используется тогда, когда необходимо публиковать информацию из БД в реальном масштабе времени, например, систем электронной коммерции, систем бизнес-информации. В этом случае веб-страницы создаются после поступления запроса на веб-сервер, который передает запрос на генерацию этих страниц программе, формирующей требуемый документ. Затем готовый документ отсылается обратно браузеру.

Библиографические БД (ББД) можно отнести к статическим, поскольку период их актуализации измеряется днями, неделями, а то и месяцами. При их преобразовании в веб-страницы следует решить несколько задач: минимизировать ручной труд при преобразовании ББД; выбрать структуру веб-представления ББД; сократить время отклика за счет минимизации трафика. Очевидно, что эти задачи следует решать программными средствами.

В Библиотеке РАН накоплен значительный массив записей в ББД в формате ППП CDS/ISIS. Для представления в Интернет этих ББД разработан программный комплекс VerWeb. Он позволяет автоматически сформировать веб-страницы в виде сложной структуры, имеющей от одного до трех ссылочных уровней и нижний, информационный, уровень. Таким образом ББД преобразуется в систему многоуровневых указателей различного вида, например: алфавитÞ авторыÞ библиографические записи; учрежденияÞ алфавитÞ авторыÞ библиографические описания; алфавитÞ термины из заглавийÞ заглавияÞ библиографические записи и т.п.

Указатели на каждом уровне могут быть одного из 4-х типов: текст (любая текстовая информация из полей ББД); алфавит (точки входа в виде цифр от 0 до 9 и букв латинского и русского алфавитов); алфавит-2 (точки входа в виде двухсимвольных сочетаний), который должен присутствовать только после алфавита; дата (точки входа в виде цифр и/или диапазонов дат).

На информационном уровне описание изданий присутствует в одном из четырех видов: библиографическое описание; библиографическая запись; аналитическое описание (для сборников); спецификации (для периодики).

Выбор той или иной системы указателей определяется составом и размером ББД, а также прогнозируемыми потребностями поиска. На физическом уровне веб-представление ББД может быть в одном из 3-х видов: отдельные файлы (для каждой ссылки свой отдельный файл); якоря в файлах (семейство ссылок последнего уровня имеет общий файл с якорем для каждой ссылки); якоря в одном файле (один файл для всей ББД с якорями в нем для каждой ссылки) – для небольших ББД.

Структура ссылок веб-представления ББД визуализируется системой фреймов (кадров), как горизонтальных (алфавит), так и вертикальных (текст, дата, алфавит-2), которая выбирается программой автоматически. В диалоговом режиме настраиваются основные элементы веб-страницы (шрифт и цвет).

Не составляет труда оценить примерный размер ББД, которую можно представить подобным образом. Отталкиваясь от числа символов в алфавитах, примем среднее число ссылок на каждом уровне равным 60. Тогда можно определить допустимый объем ББД:

N=60n ´ m,

где n - число уровней в веб-представлении ББД,

m - число описаний на информационном уровне.

В зависимости от m выбирается та или иная модель физического представления ББД. Видно, что при n=3 и m=20 можно эффективно представить в Инетернет ББД размером до 4 млн. записей.

В настоящее время в БАН ведется работа по представлению в Интернет ББД “Издания Российской Академии наук”, “Иностранные монографии” и других.

Hosted by uCoz