Пименов Е.Н., Вершинин М.И.,
Ильин А.Н., Багажков А.К.

СОВЕРШЕНСТВОВАНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
ПРОБЛЕМНО-ОРИЕНТИРОВАННЫХ БАЗ ДАННЫХ БАН

Основой программного обеспечения АС БАН России является ППП/CDS/ISIS/M с большим числом доработок в виде программ пользователя на языке ISIS PASCAL. Разработана также программа-конвертер формата ISO 2709 (CLIPPER), реализующая функции преобразования формата с использованием таблицы конверсии. В таблице может быть задано выполнение 51 операции, таких, как: удалить поле, удалить поле-константу, добавить индикатор перед полем, удалить индикаторы, изменить значение поля или подполя, переименовать поле или подполе, сформировать поле КС из текстов заглавий и др. С помощью этой программы в 1995­97 гг. было переконвертировано из разных форматов в формат UNIMARC в версии БАН и в версии ИРЛИ около 200 тыс. библиографических записей в локальных системах БАН и ИРЛИ. Работа с программой-конвертером БАН, как правило, начинается с вывода статистических данных, а именно списка полей и подполей, имеющихся в конвертируемой базе данных, сведений о частоте их использования и примеров заполнения полей. Представляется, что такая статистика дает более объективное представление о форматах ”внешних" БД, чем их многие документированные описания. Данные о частотности форматных полей полезны для выявления устаревших и более не используемых полей, а также для исправления опечаток в идентификаторах (метках) полей.

В стадии отладки находится более дружественная, чем в ППП/CDS/ISIS, подсистема подготовки данных. Интерфейс представляет собой новое программное средство доступа к файлам данных в формате ППП ISIS, позволяющее автоматизировать некоторые виды рутинных технических, а также аналитических работ, плохо поддающихся алгоритмизации при работе с ЭК, и особенно эффективное в применении к узкоспециализированным проблемно-ориентированным БД (ПОБД). Особенностью интерфейса являются использование парадигмы реляционных баз данных (таблица [поля]*[записи]) для визуализации БД, обеспечение ввода и поиска данных развитым сервисом. Для сохранения возможности использования ранее созданных средств (рабочие листы подготовки данных, таблицы определения полей) новое средство полностью совместимо с ППП/CDS/ISIS/M на уровне форматов файлов данных, причем оно может работать без использования конфигурационных файлов ISIS. Сервисные функции разнообразны:

  1. свободный выбор и корректировка данных с изменением формата (рабочего листа подготовки данных) во время сеанса путем загрузки нового формата или добавления (удаления) полей в текущем формате;

  2. выбор способа представления поля (строка ­ окно ­ развертка по подполям) и повторяющихся подполей (по одному или все вместе);

  3. средства автоматизации ввода (создание шаблонов ввода в ходе сеанса, групповой ввод данных из ”кармана", ввод данных из файла типовых значений полей);

  4. контекстный поиск и замена (в текущем поле, во всех полях, в выбранных полях и подполях);

  5. получение инкрементального сечения БД с помощью средств контекстного поиска либо с помощью прямого доступа к инвертированному файлу БД;

  6. поиск и устранение в автоматическом режиме типовых ошибок (русские-латинские символы, разделители подполей и т.п.);

  7. процедуры обработки данных, создаваемые пользователем (копирование в разных форматах, сортировка по многим ключам и т.п.);

  8. средства поиска и устранения ошибок в файлах данных на основе анализа представления внутренней структуры данных.

Опишем одну только функцию интерфейса, новую для программного обеспечения АС БАН, которая может иметь очень широкое применение в технологии ПОБД. Это функция контекстной замены (перезаписи из одного поля в другое или в это же поле) при наличии известных условий ­ наличии или отсутствия поля, подполя, термов и списков термов. Функция контекстной замены работает следующим образом. Если в поле или подполе ХХХ имеется терм ”TTT", то в поле или подполе YYY ввести терм ”SSS‡. Эта функции может использоваться для:

  1. исправления наиболее частых, типовых ошибок при вводе данных в онлайновом или групповом режиме работы,

  2. алгоритмического формирования новых, не использовавшихся ранее полей и подполей в MARC-описаниях библиографических записей,

  3. редактирования поля поисковых образов документов (ключевых слов) в групповом режиме обработки,

  4. автоматизированной (”черновой") расстановки, по крайней мере, некоторых предметных рубрик, используемых в ПОБД.

Описанные выше приемы работы представляются наиболее эффективными в технологии специализированных ПОБД.

Hosted by uCoz