Нохрин Ю.В.

ЭЛЕКТРОННАЯ БИБЛИОТЕКА: КАК СОХРАНИТЬ ДАННЫЕ?

При организации электронной библиотеки необходимо не только определить, как заполнять ее информацией, но и как эту информацию хранить.

Хранение данных можно разделить на два этапа: постоянные данные, т.е. данные доступные все время; резервные данные, позволяющие восстановить систему после сбоя, как аппаратного, так и программного.

Организация надежной и эффективной системы резервного копирования является одной из важнейших задач по обеспечению сохранности информации.

Согласно данным корпорации Intel простой серверов в 55% случаев происходит из-за выхода из строя систем хранения информации.

Основные типы носителей для резервного копирования: дискеты, подходят для кратковременного хранения небольшого объема информации или переноса ее на небольшое расстояние; CD-ROM диски, подходят для хранения полной БД или ее части, являются также оптимальным средством переноса информации, в силу распространения стандарта; CD-RAM диски, тоже что CD-ROM, только позволяют производить многократную (порядка 1000 раз) запись информации; Магнитооптические диски, большая емкость хранения, но ненадежные устройства чтения/записи; магнитные ленты, промышленный стандарт резервирования данных

В наши дни существует огромное множество всевозможных средств создания резервных копий на магнитных лентах – от дешевых устройств умеренной емкости и быстродействия до массивов лентопротяжных механизмов, характеризующихся чудовищной емкостью, почти невероятными скоростями передачи данных.

В настоящий момент на рынке устройств резервного копирования доминируют пять основных видов устройств, работающих с магнитными лентами: 4mm (DAT/DDS), 8mm (Exabyte/Mamonth), QIC, AIT и DLT. Их можно разделить на три класса, в зависимости от используемых форматов записи: устройства, использующие технологию helican scan (4mm, 8mm, AIT); устройства, использующие технологию Linear (QIC/SLR/MLR); устройства, использующие технологию Linear-Serpentine или Parallel tracking(DLT).

Практически все устройства могут использовать аппаратную компрессию при записи на ленту (за исключением QIC). При этом в зависимости от данных скорость работы с лентой и объем хранимой информации могут вырасти в несколько раз.

Другим не менее важным моментом является возможность устройств быстро останавливать и/или начинать запись на диск. Данный процесс требует довольно большое количество времени. Накопители DLT и MLR используют два основных приема для ликвидации описанной выше проблемы: устройство понижает скорость движения ленты, если данные перестают поступать в буфер; устройство записывает на ленту блоки, не содержащие данных для сохранения скорости движения ленты.

Практически все из перечисленных ниже устройств поставляются с кешем, используемым для изоляции проблем, возникающих при старте/останове ленты от работы системы.

Все устройства резервного копирования, за исключением QIC, SLR и MLR, требуют периодической чистки с использованием специальных чистящих лент.

Рассмотрим более подробно описанные выше технологии на реальных устройствах.

Производство и продажа накопителей QIC практически прекращены. В настоящий момент на смену QIC пришли накопителя SLR и MLR, представляющие собой дальнейшее развитие начальной технологии.

Технология SLR (Single-Channel Linear Recording) имеет следующие характеристики: скорость записи на ленту – 380 KB/сек и 760 KB/сек при использовании компрессии; вместимость – 4GB данных на ленте длиной в 366 метров; время загрузки кассеты – 30 сек, емкость буфера данных – 256KB; среднее время поиска записи на носителе – 45 сек; регламентируется 300000 часов работы устройства без отказов.

Технология MLR (Multi-Channel Linear Recording) имеет следующие характеристики: скорость записи на ленту – 2 MB/сек и 4 MB/сек при компрессии 2:1; вместимость – 25GB данных (50 GB при компрессии 2:1) на ленте длиной 462 метра; емкость буфера данных – 2MB; регламентируется 300000 часов работы устройства без отказов.

Технология DDS (Digital Data Storage) имеет следующие характеристики: скорость записи на ленту: 3MB/сec (до 6MB/sec при компрессии 2:1); вместимость – 20GB; средняя скорость поиска файла на ленте – 40 сeк; емкость буфера данных – 1MB; регламентируется 200000 часов работы устройства без отказов.

Технология Exabyte имеет следующие характеристики: скорость записи на ленту: 12 MB/сeк (до 30MB/сeк, если данные хорошо поддаются компрессии); вместимость – 60GB; средняя скорость поиска файла на ленте – 40 сек; емкость буфера данных – 32 MB; буфер компрессии данных –1MB; регламентируется 200000 часов работы устройства без отказов.

Технология DLT имеет следующие характеристики: скорость записи на ленту – 5MB/сек (до 10 MB/sec, если данные хорошо поддаются компрессии); вместимость – 35GB; средняя скорость поиска файла на ленте – 40 сек; емкость буфера данных – 8 MB; регламентируется 200000 часов работы устройства без отказов.

Технология LTO (Linear Tape - Open Technology) имен следующие характеристики: скорость записи на ленту: 180-160 MB/сек; вместимость – 200 GB; средняя скорость поиска файла на ленте – <7 сек; емкость буфера данных – 8 MB; регламентируется 200000 часов работы устройства без отказов.

Устройства для работы с несколькими носителями повышают надежность работы накопителей на магнитных лентах вследствие высокой унифицированности взаимодействия с устройствами (по сравнению с работой оператора). Основное требование к автоматизированным устройствам работы с лентами заключается в их надежности. Это требует тщательного дизайна электронных, механических и программных компонент.

Как и в случае с ленточными накопителями роботизированные устройства чтения/записи лент делятся на два основных класса: автоматические загрузчики имеют одно устройство чтения/записи и робот для загрузки небольшого количества носителей. Как правило, они используются только для резервного копирования небольшого объема данных в силу невысокой скорости работы устройства для смены носителей и отсутствия дополнительных средств поиска необходимой данных; Библиотеки всегда имеют два или более устройств чтения/записи. Носители, находящиеся в библиотеке, доступны любому из накопителей, что позволяет осуществлять параллельные операции чтения/записи. Как правило, библиотеки обслуживают значительное количество носителей (от 20 до нескольких тысяч). Кроме того, библиотеки обеспечивают дополнительную защиту от сбоев во время резервного копирования, так как во время выхода из строя одного из устройств чтения/записи его функции будут автоматически выполняться оставшимся устройством.

Перед выбором устройства резервного копирования и программного обеспечения необходимо не забыть и еще об одном не маловажном факторе в системе резервного копирования – конфигурации системы целиком.

Операции резервного копирования можно разделить на физические и логические.

Под физическим резервным копированием понимается копирование на носитель содержимого устройства на физическом уровне. В этом случае достигается значительная скорость чтения данных в силу последовательного доступа к устройству (на современных дисках эта скорость около 6-7 мегабайт в сек). В случае использования дисковых массивов эта скорость значительно выше.

Логическое копирование означает копирование данных на более высоком – файловом уровне. В этом случае производится анализ атрибутов данных, что приводит к значительному количеству операций поиска и чтения.

При планировании системы резервного копирования необходимо оценить такие требования системы, как: целостность сохраняемых данных против доступности системы во время процесса резервного копирования. Как правило, целостность данных может быть легко достигнута остановкой системы и проведением резервного копирования.

Применение описанных технологий в электронной библиотеке позволит сохранить созданные данные и реализовать полноценное обслуживание.

 

Hosted by uCoz