Пирумова Л.Н.

ПРОБЛЕМЫ ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ
В БД "АГРОС" ДОКУМЕНТАЛЬНОГО ПОТОКА
ПО ПИЩЕВОЙ ПРОМЫШЛЕННОСТИ

С 1997 г. Центральная научная сельскохозяйственная библиотека (ЦНСХБ) комплектует свой фонд и по всем отраслям пищевой промышленности, что связано с присоединением к ней Центральной научной технической библиотеки пищевой промышленности (ЦНТБ ПП). Принято решение о ее отражении во всех информационных продуктах ЦНСХБ.

Информационные продукты ЦНСХБ существуют как в традиционной, так и электронной формах. С 1935 г. Библиотека ведет карточный комплексно-системный каталог (КСК), где отражаются все виды документов за все годы. С 1992 г. ведется электронный каталог (ЭК), отражающий документы, изданные после 1990 г. Текущий документальный поток отражается в систематических указателях: иностранной литературы ­ "Сельское хозяйство", отечественной ­ "Сельскохозяйственная литература" и в "Бюллетене новых поступлений". Таким образом, ретроспективные (до 1990 г.) документы по пищевой промышленности отражаются в карточном КСК, а документы, изданные после 1990 г. ­ в ЭК, БД "Агрос", а также в текущих изданиях. В каждом из этих информационных продуктов используется свой информационно-поисковый язык (ИПЯ), который ранее ограничивался тематикой сельского хозяйства. В ЦНСХБ используется классификационные и дескрипторный ИПЯ. К классификационным ИПЯ относятся: Универсальная десятичная классификация (УДК), Отраслевой рубрикатор, разработанный на основе ГРНТИ, схема КСК. К дескрипторным ИПЯ относится информационно-поисковый тезаурус по сельскому хозяйству. В КСК используется схема классификации, в ЭК и БД "Агрос" ­ УДК, Отраслевой рубрикатор, тезаурус.

В текущих указателях используются свои схемы, разработанные на основе Отраслевого рубрикатора, в Бюллетене новых поступлений также собственная схема.

Для того, чтобы документы по пищевой промышленности нашли отражение в этих информационных продуктах, необходимо было разработать и создать такие же ИПЯ по этой тематике, как и по тематике сельского хозяйства. Трудности состоят в том, что ранее документы этой тематики в библиотеке не комплектовались, т.е. не проходили аналитико-синтетическую обработку и по тому не было создано массива терминологической лексики. Главная проблема разработки лингвистического обеспечения по новой тематике состоит в том, что требуются знания не только правил построения отдельных ИПЯ, но и специальной терминологии, т.е. знания специальности. Поэтому разработчикам ИПЯ необходимо было, прежде всего, изучить предмет. Пищевая промышленность включает в себя 21 отрасль, каждая из которых имеет свою специфику построения и терминологии. Присоединенный фонд на 80% состоит из ретроспективных (до 1990 г.) документов, которые будут отражаться в КСК. Поэтому там прежде всего был открыт новый раздел и для него разработана схема, отражающая все отрасли пищевой промышленности, взаимосвязи с другими разделами КСК. Даны ссылки и отсылки, разрабатывается алфавитно-предметный указатель к этому разделу. В схеме действуют принципы и правила КСК.

Текущий поток по пищевой промышленности проходит аналитико-синтетическую обработку, и на каждый документ создается поисковый образ документа (ПОД): составляется аннотация и/или реферат, присваиваются индексы УДК, Отраслевого рубрикатора или ГРНТИ, приписываются дескрипторы тезауруса и ключевые слова.

Разработана схема раздела 65 "Пищевая промышленность" Отраслевого рубрикатора на основе ГРНТИ, который включен в машинный рубрикатор БД "Агрос". Проведена лингвистическая обработка новой схемы, создан ссылочно-справочный аппарат, приписаны комментарии, примечания. Проведена работа по устранению дублирования этой тематики с рубриками разного уровня в разделах 68 "Сельское хозяйство". Работа с рубрикатором проводится постоянно, так как он должен полно и точно отражать тематический поток документов по пищевой промышленности, поступающий на ввод в БД, обеспечивать точность информационного поиска, удовлетворять требованиям сортировок массивов документов при создании различных информационных продуктов и выполнять формально-логический контроль рубрик на вводимых документах. Для этого выверяется ссылочно-справочный аппарат, вводятся новые понятия. Разработаны новые разделы в схемах текущих изданий, в "Бюллетене новых поступлений", которые включают документы по новой тематике с июля 1997 г.

Эта тематика разрабатывается в Тезаурусе. Осуществляется сбор массива лексических единиц по всем отраслям, формируется словник отраслевого тезауруса, строятся словарные статьи. Продолжается накопление представительного массива терминов с целью выявления их основных категорий. Документы по этой тематике в течение некоторого времени индексировались только ключевыми словами, в отличие от других тематических областей, описываемых терминами тезауруса. Работа с лексикой проводилась по разработанной и проверенной ранее схеме:
а) отбор лексики в процессе аналитико-синтетической обработки документов;
б) формирование картотеки терминов для ввода в тезаурус;
в) нормализация терминов;
г) разработка словарных статей, ввод их в структуру тезауруса;
д) машинные операции по вводу, корректуре, актуализации.

В тезаурус уже введены основные категорийные термины:
1) виды промышленности и производств, охватываемых понятием "Пищевая промышленность";
2) виды сырья и продукты питания, создаваемые пищевой промышленностью;
3) основные технические процессы.
С 1998 г. тезаурус стал называться ”Отраслевой тезаурус по сельскому хозяйству и продовольствию”.

По мере отбора терминов и обработки их для ввода в тезаурус разрабатываются и принимаются рабочие решения по методике индексирования документов. Разрабатывается отраслевая рабочая схема по УДК, которая будет включать также алфавитно-предметный указатель и будет полезна систематизаторам.

Формируются пакеты методических и инструктивных материалов по теме. Создается методика индексирования документов по тематике пищевой промышленности для карточных и электронных каталогов. Индексирование требует знания терминологии и существа предмета. Методика нужна, чтобы свести к минимуму субъективный фактор в процессе аналитико-синтетической обработки, и является пособием в помощь индексатору. Она нормализует процесс индексирования, способствует единообразному индексированию документов, освещает наполнение, детализацию всех разделов и их взаимосвязи с разделами сельского хозяйства.

Объем входного документального потока по пищевой промышленности растет, что обусловлено и увеличением количества иностранных журналов по этой тематике в фонде ЦНСХБ. Поэтому важно, как можно скорее, разработать и сформировать ее лингвистическое обеспечение.

Hosted by uCoz