Аветисов М.А., Крамчанинов Е.В.,
Стеллецкий В.И., Стеллецкий В.В.

ЭЛЕКТРОННАЯ ДОСТАВКА ДОКУМЕНТОВ:
СОЗДАНИЕ АРХИВА СКАНИРОВАННЫХ МАТЕРИАЛОВ
С ПОИСКОВЫМ АППАРАТОМ; РАЗРАБОТКА СИСТЕМЫ
ОТЧЕТНОСТИ И СТАТИСТИКИ

Общие положения

В 2003 г. отделом автоматизации ЦНСХБ была спроектирована, разработана и реализована программно-техническая система, обеспечивающая решение задачи “Менеджер службы электронной доставки документов”.

В данной статье освещены два аспекта работы программы “Менеджера ЭДД” и ее взаимодействия с внешними источниками и приемниками информационных потоков.

При создании архива сканированных материалов с поисковым аппаратом использовались следующие постулаты:

– Полнотекстовая информация используется пользователями (читателями) библиотеки через интранет ЦНСХБ.

– Полнотекстовая информация генерируется в основном службой Электронной доставки документов ЦНСХБ.

– Информация в архиве не должна дублироваться.

– В качестве формата хранения и предоставления полнотекстовой информации принимается формат PDF.

– В качестве поисковой системы в базе документов, снабженных полными текстами, принимается поисковая система интранета ЦНСХБ (ИПС Артефакт).

– В качестве БД, описывающей полнотекстовую информацию, используется БД системы Электронной доставки документов ЦНСХБ (основанная на MS SQL).

– В случае необходимости добавления в Архивную систему текста не прошедшего через “Службу ЭДД” следует описать его фиктивным заказом в ЭДД и поместить полный текст в файловом пространстве ЭДД. Для этой цели в программе “Менеджер ЭДД” создан специальный, так называемый “фиктивный” пользователь.

Полнотекстовая информация хранится в файловой системе на сервере. Далее полнотекстовая информация размещается в соответствии с номером заказа в ЭДД. Все заказы группируются в директории по 1000 (тысячные директории). Такие директории называются по числу полных тысяч в номере заказа ЭДД (с ведущими нулями до 4 знаков). В тысячных директориях каждый полный текст находится в своей директории с именем – номер заказа (с ведущими нулями до 3 знаков) и называется тоже номером заказа (расширение – .pdf).

Для примера приведем путь полного текста, полученного при выполнении заказа с номером 57: \0000\057\57.PDF.

Место хранения полных текстов имеет права доступа: читателям библиотеки – на чтение; сотрудникам службы ЭДД – для корректировки (с созданием и удалением).

На HTML-страничках с библиографической информацией, к которой в Архивной системе имеется полный текст для читателей, зарегистрировавшихся при входе в интранет ЦНСХБ (указавших номер своего читательского билета, номер защищен контрольным разрядом) формируется ссылка на полный текст вида: <a href=”file:///*/057/57.PDF”>.

Это обеспечивает читателю возможность просмотра полнотекстовой информации при помощи предустановленного на ПК (в читальном зале или компьютерном классе) программного продукта бесплатного использования Adobe Acrobat Reader. Такая же ссылка генерируется для читателей подключившихся к локальным ресурсам ЦНСХБ по защищенному каналу (VPN–соединение).

Для решения проблемы повторного заказа текста (дублирования информации) в БД ЭДД введено поле “Номер предыдущего заказа” и механизм поиска по шифру хранения ЦНСХБ. В случае, когда менеджер ЭДД обнаруживает, что во вновь принятом заказе требуется документ, уже снабженный полным текстом, он должен заполнить это поле номером заказа, которым этот полный текст идентифицируется.Не пустота этого поля сообщает системе формирования БД в интранет, что рассматриваемый заказ ссылается на дубль полного текста.

Формирование ссылок на полный текст в предоставляемых в интранет БД

Этот процесс выполняется при полном обновлении БД в Интранет.

Алгоритм формирования ссылок прост: Из БД ЭДД выделяются элементы идентификации документов с полными текстами (сейчас это шифр хранения и начальный номер страницы), и их нормализованное представление записывается во временную БД, по которой проверяется каждый подготавливаемый для загрузки в интранет документ. При совпадении такого идентификатора к документу приписывается соответствующая ссылка. Можно также выделить такие документы в отдельную БД. Если останутся полные тексты, для которых не нашлись библиографии, то из них можно создать БД, основываясь на библиографии, записанной при заказе в БД ЭДД.

Предоставление читателю полных текстов документов

Полные тексты предоставляются читателю в локальной сети или подключившимся по защищенному каналу связи к локальным ресурсам ЦНСХБ только при указании номера читательского билета при входе в интранет ЦНСХБ.

Места предоставления полных текстов:

– Электронный каталог статей

– Аналитическая роспись 1985–1989,1990–1995,1996–1999, c 2000 – только у части документов

– Документы с полными текстами - у всех 1845 документов

– Документы из других библиотек

– Документы с полными текстами, не найденные в АГРОС – у всех 958 документов

– Нажатие на кнопку “Требование”. Данная кнопка отображается при просмотре документов в “ИПС Артефакт”, а также просмотре указателей новых поступлений журналов и списка оглавлений журналов. При нажатии на кнопку “Требование” открывается новая страница, на которой под изображением требования для заказа литературы предлагается список полных текстов статей из этого источника. При формировании этого списка осуществляется отбор записей из БД ЭДД по шифру хранения. При этом выбираются заказы только с внутренним статусом “Службы ЭДД”: отсканированные, готовые к отправке или выполненные. Дублирующиеся заказы не учитываются. В случае имеющегося подтверждения на WEB-сервере наличия полного текста (обновление ежедневное) описание статьи оформляется в виде ссылки.

При нажатии на ссылку на полный текст вызывается Adobe Acrobat Reader для просмотра полного текста.

Дополнительная работа с БД ЭДД

Для обеспечения взаимной идентификации записей БД ЭДД и других библиографических БД ЦНСХБ необходимо правильное заполнение полей “шифр хранения” и “страницы” в БД ЭДД. Поэтому необходимо чтобы менеджер ЭДД в случае отсутствия заполнения заказчиком полей “шифр хранения” и/или “страницы” вносил в эти поля необходимую информацию и/или проводил их корректировку в случае замеченных ошибок.

Поле “страницы” может подправить и другой сотрудник службы ЭДД, так как номера страниц присутствуют в отсканированном образе, шифр хранения же в отсканированном образе наверняка отсутствует.

Решение проблемы нескольких статей на одной странице

В случае, когда на одной странице начинается несколько статей (короткие статьи) возникает проблема автома-тического подключения результатов ЭДД к базе данных, так как пара элементов “шифр хранения” и “начальный номер страницы статьи” перестают быть идентификатором статьи. Для решения этой проблемы следует при сканировании оставлять все полностью поместившиеся на первой странице статьи. В этом случае программа автоматического подключения полных текстов к документам библиографической базы данных может всем документам, оказавшимся в одном файле (в начале) со статьей, начинающейся на этой странице, поставить в соответствие любой заказ ЭДД, начинающийся с этой страницы (правда, документу продолжающемуся на следующие страницы может соответствовать только такой продолжающийся заказ статьи, а значит описанной этим документом). Это также позволяет избежать повторного подбора и сканирования литературы при заказе одностраничных статей, находящихся на странице, с которой начинается уже выполненный заказ (такие заказы можно сразу отметить как “дубли”, заполнив поле “Номер предыдущего заказа”).

Разработка системы бухгалтерской отчетности и статистики

Так как внешний вид и оформление финансовых документов постоянно меняются, было принято решение, что “Счет” и “Счет-фактура” генерируемые программой “Менеджера ЭДД” будут применяться исключительно для внутреннего использования в ЦНСХБ Россельхозакадемии. Поэтому эти документы содержат дополнительную информацию о заказе, такую как: размер скидки; наценки; налоги.

Статистика работы Службы ЭДД

Программа Менеджер ЭДД позволяет выводить статистические данные со следующими параметрами и ограничениями.

Есть возможность выводить статистику применяя следующие фильтры:

По дате: статистика за любой диапазон дат;

По типам пользователей:

– По всем пользователям

– По одному или нескольким выбранным пользователям.

– По типу оплаты для пользователей.

– По физическим или юридическим лицам.

При составлении статистики на данном этапе (предполагается возможность расширения и увеличения пунктов, по которым собирается статистика) выводится следующая информация:

– Количество новых заказчиков.

– Количество новых заказов.

– Количество выполненных заказов.

– Количество заказов со скидкой 100%.

– Количество заказов с другой скидкой.

– На какую сумму выполнено заказов.

– Количество заказов в обработке.

– Количество заказов со статусом “Отказано”.

– Количество заказов со статусом “Снят”.

– Количество поступивших денег в бухгалтерию.

– Размер суммарного “Обещанного платежа”.

– Размер нового обещанного платежа.

– Количество: Физических; Юридических лиц; Неактивных заказчиков; Зарегистрировавшихся заказчиков (за период).

Дополнительно составляется подробная статистика

– По должникам (заказчикам, которым не разрешено кредитование и у которых отрицательная сумма на счету).

– По обещанному платежу (копии платежек поступили в ЦНСХБ, но факт прихода денег на счет бухгалтерией не зарегистрирован).

– По заказам с данным шифром хранения литературы в ЦНСХБ.

– Краткая статистика по заказчику.

Форматы для печати

Для печати применяется текстовый редактор Microsoft Word 97/2000.

Это позволяет:

– Редактировать информацию перед печатью.

– Предоставить пользователю привычный интерфейс.

– Возможность сохранения информации без печати.

Заключение

Безбумажная технология входит в нашу жизнь. Электронная доставка документов интенсивно развивающаяся услуга, предлагаемая не только библиотеками, но и другими организациями. Поэтому естественно возникает необходимость создания системы управления этой службой. Один из возможных вариантов создания такой системы был описан в данной статье. Выполнено много тысяч заказов и отсканировано еще больше страниц статей из журналов и разделов из книг. Эксплуатация системы показала ее высокую дружественность по отношению к персоналу. Возможность регистрации всех технологических шагов при подготовке электронной копии документа и отправки ее пользователям позволяет организовать массовое производство электронных копий и выполнения большого числа заказов. Заказать документы можно, проведя поиск в наших информационных ресурсах (http://www.cnshb.ru/cnshb/resurs.htm) и обратившись к службе ЭДД (http://www.cnshb.ru/edd/).

Hosted by uCoz