Кряжева М.Ф.

СРЕДСТВА ИНФОРМАЦИОННОГО ПОИСКА

Документированная информация поступает в информационный поток, а с ним в информационный массив. Поиск информации в этом массиве возможен посредством использования информационно-поисковых систем (ИПС).

К средствам поиска относится структура ИПС, в которой можно выделить “горизонтальный” уровень, некий инвариант, критерий объединения информации в один массив (это может быть четко ограниченная предметная область, вид или время создания документов, пространство хранения этих документов, вид материального носителя и т.д.). “Вертикальный” уровень системы – это способ интерпретации информации, способ придания ей единообразия для обеспечения возможности поиска. По-другому этот процесс можно назвать преобразованием-созданием нового образа для каждого информационного элемента. Причем преобразование должно происходить по единым, общим для всей системы правилам. Новые образы документированной информации относятся к средству и результату поиска, именно от них возможен переход к непреобразованной информации информационного массива.

Данный процесс преобразования называется индексированием, созданные в результате его образы – поисковыми образами документов (ПОД), которые создаются с помощью искусственно созданных языков – информационно-поисковых (ИПЯ).

ИПЯ формируются на базе естественного языка. При построении и эксплуатации ИПЯ с естественным языком поступают так, как в любой отрасли техники обращаются с материалом: полезные для дела явления и свойства используются, усиливаются; нейтральные – игнорируются; вредные – либо нейтрализуются, либо совсем подавляются.

В состав ИПЯ входят: 1) смысловыражающие единицы – лексические единицы (ЛЕ) или лексемы, образующие фонетический и лексический уровни ИПЯ, и выполняющие функции выделения элемента ПОД, его обозначения, наименования (номинативная функция) и закрепления, представления результатов преобразования документированного знания в ПОД (репрезентативная функция); 2) синтагматические отношения как порядок следования элементов на двух вышеперечисленных уровнях. Средством выражения таких отношений является грамматика – морфология как построение и изменение лексем, и синтаксис как способы и средства их соединения.

К основным требованиям, предъявляемым к ИПЯ, относятся: 1) однозначность; 2) открытость – возможность корректирования, дополнения; 3) удобство пользования – компактность, мнемоничность (запоминаемость).

Основную познавательно-поисковую нагрузку в большинстве ИПЯ несёт терминологическая (тематическая) лексика. Ей присуща, по словам А.В. Соколова, “семантическая сила” – возможность полного и точного выражения результатов мышления. В состав терминологической лексики входят “на верхних уровнях” неопределяемые термины (исходные понятия данной предметной области, к которым, в конечном счете, сводятся все остальные), а “на нижних уровнях” – терминоэлементы типа “-ведение”, “-вед”, “-логия”, “-лог” и т.п. На “средних уровнях” располагаются термины от базовых, широко распространенных понятий области знания до узкоспециальных понятий, а также вновь появившиеся термины, отображающие новые понятия и ещё не успевшие занять какое-либо точно определённое место в терминосистеме.

При формировании ИПЯ на базе терминологической лексики приходится учитывать не только семантические характеристики лексем, но и прагматические (принадлежность к активному словарю субъектов информационного поиска, что определяет вероятность употребления лексемы, и принадлежность к пассивному словарю, т.е. вероятность владения ее значением, степень понятности – вероятность понимания значения лексемы).

Ещё одну, особую группу лексических единиц ИПЯ составляют локализаторы или идентификаторы (собственные имена, географические наименования, численные характеристики и параметры).

Все вышеперечисленные лексемы ИПЯ образуют систему за счёт наличия между ними связей и отношений различных типов.

Для преобразования документированного знания в ПОД используются несколько разновидностей ИПЯ, в том числе классификационные и дескрипторные.

Таким образом, документированная информация, зафиксированная на материальных носителях с помощью естественного языка, поступая в информационный массив ИПС, преобразуется в поисковые образы документов, т.е. образы, зафиксированные с помощью специальных знаковых систем (ИПЯ). Информационный поиск осуществляется как процесс поиска и познания-отражения образов, выполняющих в данном случае функцию “промежуточной” информации для субъекта, от которой возможен доступ к информации непосредственной.

Hosted by uCoz