Аветисов М.А., Крамчанинов Е.В.,
Косикова Н.В., Стеллецкий В.И., Стеллецкий В.В.
ИССЛЕДОВАНИЕ И РАЗРАБОТКА ПРОГРАММНО-ТЕХНОЛОГИЧЕСКИХ СРЕДСТВ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ ДОКУМЕНТОВ ЦНСХБ
(на примере наиболее спрашиваемой литературы)
Актуальность проблемы сочетания двух основных задач любой Библиотеки – сохранности и доступности фондов – несомненна.
Благодаря непрерывному росту обращаемости библиотечные фонды испытывают большую физико-механическую нагрузку, вследствие чего заметно возрастает количество физически изношенной литературы. Этому процессу способствует низкое полиграфическое исполнение отечественной книги. По последним данным, в мягкой обложке выпускается около 70% всех отечественных изданий, а по разделу отраслевой книги – 78%.Разрушение таких книг наступает после трёх-четырёх выдач пользователям.
Для физического восстановления документ изымают из обращения, тем самым лишая пользователя информации. Ремонт документа осуществляется на уровне службы быта (т.е. обрезка полей книги, шитьё на прокол, переплёт без укрепления блока и т.д.). Срок жизни такого документа 10–12 выдач, после чего требуется повторный ремонт.
Одним из направлений по обеспечению сохранности библиотечных фондов является ограничение использования оригиналов и замена их электронными копиями. При этом во много раз увеличивается доступность пользователя к интересующей его информации, так как электронной копией источника могут пользоваться несколько пользователей (читателей) одновременно. Использование копий предотвращает физический износ оригиналов, исключает возможность их порчи пользователями и т.п.
При принятии решения об изготовлении электронных копий источников, прежде всего, необходимо определить категории документов, которые необходимо сохранить в первую очередь, и определить способы такого сохранения.
К приоритетной категории можно и нужно отнести документы, пользующиеся активным читательским спросом, что свидетельствует об их образовательной и научной ценности. Неизбежным результатом активного использования фонда является преждевременный износ документов, поэтому главным способом сохранения наиболее спрашиваемой литературы будет замена оригинала электронной копией.
Критерием оценки интенсивности использования документов является книговыдача, зафиксированная на формуляре документа, поэтому отбор документов для создания электронных копий осуществляется на основе результатов её изучения.
Частота использования документов одного названия подсчитывается по формуле ИН = ВД / Н, где ВД – количество выдач всех экземпляров одного документа, Н – общее количество экземпляров документа.
К сожалению, отсутствуют общие нормативные показатели, характеризующие интенсивность спроса. Библиотеки самостоятельно определяют его путём изучения использования фондов.
Для определения нормативов в ЦНСХБ руководствовались собственным опытом работы с фондом, знанием частоты спроса различных документов, времени использования документа и степени его доступности.
В ЦНСХБ применяются следующие показатели: средняя интенсивность спроса – 3–5 выдач в год, повышенная – 6–8 выдач, высокая – более 8 выдач. При этом данные цифры составляют среднее число запросов всех экземпляров документа одного названия за год.
Библиотека уже имеет опыт создания полнотекстовых материалов, на примере работы по созданию Электронной библиотеки знаний (http://www.cnshb.ru/akdil).Однако используемые там методики и технологии не совсем адекватны созданию электронных копий книг или отдельных статей из сборников или журналов, которые затем будут размещаться для использования читателями библиотеки в локальной сети ЦНСХБ (Интранет).
Наиболее подходящей для этого процесса является технология, которая используется при создании электронных копий статей в службе ЭДД, но дополненная и адаптированная для этого вида деятельности библиотеки.
Исходя, из первичных предпосылок нами были определены следующие направления работ: формат предоставления публикаций, технология и рабочий инструментарий, методика предоставления такого вида информации читателям.
Формат электронных копий
Все создаваемые электронные копии будут представлены в формате PDF. Формат PDF разработан фирмой ADOBE для предоставления копий документов в электронном виде (в графическом формате) с сохранением первоначального вида. На сегодняшний день является стандартом, как говорится де-факто, при изготовлении и распространении копий публикаций в графическом виде. Для изготовления копий используется специализированный пакет программного обеспечения – Adobe Acrobat Professional.
Для чтения готовых публикаций в формате PDF используется специализированный программный пакет Adobe Acrobat Reader, который распространятся на условиях freeware (бесплатном лицензировании).
Особенности изготовления электронной копии
По договоренности с отделом хранения ЦНСХБ, отделу автоматизации для пробного изготовления и отлаживания технологии изготовления электронных копий были предоставлены несколько наиболее спрашиваемых книг, издания которых находятся в плохом состоянии. По результатом этого пробного изготовления были выделены следующие этапы и особенности их реализации.
Сканирование материала
На этом этапе если есть возможность, то выбирается наиболее хорошо сохранившийся экземпляр. Если такой возможности нет, то сканируется тот источник, который имеется в наличии. При наличии нескольких источников, каждый из которых является плохим, сканируются те страницы, которые находятся в оптимальном состоянии. Лучшие страницы выбираются просмотром всех имеющихся экземпляров.
Обработка графических изображений
На этом этапе удаляются различные артефакты, которые возникают при сканировании. Удаляются пометки читателей, загибы и трещины страниц, все данные появившиеся в результате использования книги и не соответствующие выпущенной оригинальной копии. При необходимости пересканируются страницы с цветными иллюстрациями или требующие повышенного (фотографического) качества.
Составление файлов в формате PDF
Файлы формируются аналогично расположению страниц в книге. Каждый файл содержит страницы, которые входят в раздел или главу. Если это сборник трудов, то файл содержит, только страницы, относящиеся к конкретной статье. Если на страницах попадают начало или конец предыдущих или последующих статей, то все сведения, не относящиеся к конкретной статье удаляются. Исключением является случай, когда на одной странице начинается несколько статей (короткие статьи). Все полностью поместившиеся на странице статьи оказываются в одном файле (в начале) со статьей начинающейся на этой странице и продолжающейся на следующих страницах. В этом случае все элементы содержания будут указывать на этот файл. Это облегчает идентификацию файлов. Получается простое правило для определения файла в котором содержится искомая статья: в названии файла присутствует номер страницы с которого эта статья начинается. Это правило оказыватся особенно удобным при наличии библиографической базы данных с постатейной росписью, потому что обеспечивает алгоритмическую возможность автоматического подключения полных текстов статей к документам базы данных.
Составление содержания
Для составления содержания, происходит распознавание страницы с отсканированным содержанием или оглавлением книги. Распознавание осуществляется в программном пакете Abbyy FineReader. После процедуры распознавания, весь материал экспортируется в текстовой редактор MS Word, входящий в состав MS Office. Далее еще раз проверенный на наличие ошибок текст сохраняется в формате HTML. Используя методику создания гипертекстовых ссылок, к каждой главе или разделу книги присоединяется соответствующая глава или раздел в формате PDF. Созданное содержание или оглавление сопровождается таблицей стилей, которая написана для этого раздела интранета.
Сохранение изготовленной копии
Весь материал по работе с каждой конкретной копией первоисточника, записывается на CD-ROM и хранится в отделе автоматизации (CD библиотека). Готовые для пользования данные (только файлы в формате PDF и HTML-файл оглавления) загружаются на сервер в специально выделенное для этого место, к которому обеспечивается доступ для чтения сотрудников и читателей ЦНСХБ.
Доступ к полнотекстовой информации может осуществляться несколькими способами или содержать несколько параметров: свободный доступ, доступ по паролю, доступ только на чтение, доступ с правом печати или выгрузки данных на носитель читателя. Все эти параметры осуществимы различными путями, а именно:
a. Доступ осуществляется с определенных рабочих станций;
b. Осуществление доступа к полнотекстовой информации по дополнительной авторизации;
c. Также по паролю осуществляется доступ через шлюз библиотеки для организаций, которые имеют удаленные рабочие места читателей ЦНСХБ (по VPN соединению).
Заключение
Мы полагаем, что основные вопросы, связанные с созданием в ЦНСХБ электронной библиотеки решены. Следует переходить к практическим шагам. Однако, здесь возникает много проблем организационного характера: какие источники должны подвергаться переводу в электронный вид в первую очередь, каким силами выполнять эту работу в условиях жесткого бюджетного дефицита, возможно ли привлечение инвестиций или же можно организовать продажу готовых копий, какие документы выставлять в доступ и сеть Интернет, а какие только во внутренней сети библиотеки и т.д. Все эти проблемы разрешимы и мы надеемся, что в скором времени электронная библиотека ЦНСХБ начнет пополняться необходимыми интересными документами и найдет своего читателя.