Булдакова Е.В.

СРАВНИТЕЛЬНЫЙ АНАЛИЗ ТРАДИЦИОННОЙ И ЭЛЕКТРОННОЙ ИНФОРМАЦИОННОЙ СРЕДЫ
(На примере предметной области “лингвистика”)

Рассмотрена проблема систематизации информационных ресурсов науки на примере предметной области “Лингвистика”.

С этой целью проанализированы и сведены в единую классификационную схему фасетного типа точки зрения известных специалистов (Ю.В. Рождественский, Ю.С. Маслов, В.И. Кодухов, А.А. Реформатский, И.М. Кобозева и др.) на структуру данной научной дисциплины.

Представим фасеты и элементы их деления, входящие в данную схему.

Фасет 1. По степени общности рассмотрения языковых систем:
1.1 Общее языкознание;
1.2 Языки народов мира (Далее классификация языков мира, например, в соответствии с рубрикой 811 УДК).

Фасет 2. Структура vs.эволюция:
2.1. Синхрония;
2.2. Диахрония.

Фасет 3. По уровню описания:
3.1. Фонетический уровень;
3.2. Морфологический уровень;
3.3. Синтаксический уровень;
3.4. Семантический уровень.

Фасет 4. По ориентации на практические приложения:
4.1 Теоретическое языкознание, рассматривающее языковые явления независимо от практических задач лингвистики;
4.2 Прикладное языкознание, рассматривающее методы решения практических задач лингвистики.

Фасет 5. По методам исследования и моделирования языковых явлений:
5.1 Традиционная лингвистика, рассматривающая вопросы лингвистики, решаемые без использования компьютеров и современных информационных технологий;
5.2 Компьютерная лингвистика, рассматривающая вопросы лингвистики, решаемые с использованием компьютеров и современных информационных технологий.

Два наиболее важных фасета в этой схеме - это выделение разделов лингвистики по степени общности рассмотрения языковых систем и по уровням описания языка. В первом случае получаем противопоставление общей лингвистики изучению конкретных языков и групп языков, во втором - деление на фонетику, морфологию, синтаксис и семантику.

Еще один важный аспект - противопоставление структурного (диахрония) и исторического (синхрония) подходов к языку. Менее отчетливыми, менее логически отработанными в современной лингвистике представляются два последних деления: на теоретическое и прикладное языкознание, а также на общую (традиционную) и компьютерную лингвистику.

Таким образом, показано, что реально используемая классификация основных направлений и разделов лингвистики, как она понимается ведущими специалистами, является многоаспектной и отражает концептуальную структуру лингвистики в целом.

Эта структура сопоставлена нами с традиционными системами классификации, используемыми в библиотечных и информационных технологиях. В качестве таковых взяты 4 источника: Универсальная Десятичная классификация (УДК), Библиотечно-библиографическая классификация (ББК), Государственный рубрикатор научно-технической информации (ГРНТИ), Рубрикатор Автоматизированной информационной системы по общественным наукам (АИСОН).

Цель такого сопоставления двоякая: с одной стороны, проконтролировать результат, полученный путем изучения и использования профессиональных источников, материалом авторитетных классификационных систем, с другой стороны, - оценить традиционные классификационные системы с точки зрения логической последовательности описания структуры лингвистики как научной дисциплины.

Изучение способов представления структуры научной дисциплины “Лингвистика” в указанных классификациях показало, что деление предметной области “Языкознание” (а) по уровням языка, (б) на общее языкознание и частные науки о языке, (в) на теоретическую и прикладную лингвистику, (г) на традиционную и компьютерную лингвистику находит свое отражение во всех рассмотренных системах. Системы УДК и ББК содержат подробную, научно обоснованную классификацию языков. За счет использования системы специальных определителей в ряде случаев достигается эффект фасетизации (например, отражение уровневого описания языка в УДК). Однако вопросы компьютерной лингвистики, развивающейся быстрыми темпами, классификационные системы отражать не успевают.

В качестве примера достаточно узкого научного направления, которое может определять и ограничивать научные интересы работающего специалиста, выбрана область компьютерной семантики. Эта область рассматривается в более широком контексте таких достаточно устоявшихся научных направлений как компьютерная лингвистика, с одной стороны, и семантика, с другой.

Для оценки качества систематизации сетевых информационных ресурсов по лингвистике нами был проведен полный просмотр классификационных систем наиболее широко используемых универсальных ИПС Интернета, в том числе в трех русскоязычных “Апорт”, “Rambler”, “Яndex” и в двух мультиязычных, позволяющих использовать русский язык: “Google”, “Alta Vista”.

В ходе просмотра фиксировались следующие элементы:

  1. Наличие рубрики верхнего уровня (Лингвистика в целом).
  2. Наличие и логическая последовательность рубрик, отражающих уровневое деление языковых явлений.
  3. Наличие и логическая последовательность рубрик, отражающих классификацию языков мира.
  4. Наличие рубрик, представляющих компьютерную лингвистику в целом и компьютерную семантику в частности.
  5. Объем представленных материалов.

Результаты проведенного анализа показали, что классификационные системы, используемые в рассмотренных ИПС, не отражают содержания предметной области “Лингвистика” и подобласти “Компьютерная лингвистика” и значительно уступают известным библиотечным системам классификации документов.

В ИПС “Rambler” среди многочисленных рубрик для поиска информации по компьютерной лингвистике и компьютерной семантике могут использоваться только рубрики “Наука” и “Образование”, но далее эти рубрики не детализируются и содержат неструктурированный набор ссылок на самые разные по содержанию ресурсы. Таким образом, доступ к материалам по лингвистике может быть получен с помощью данной ИПС только случайно. Для поиска сайтов в этой предметной области, распределенных по рубрикам “Наука” и “Образование”, нужны большие затраты времени, известные навыки и удача.

В ИПС “Апорт” имеется рубрика “Наука и образование”, включающая в себя ряд рубрик различного уровня (Наука и образование/Науки/Филологические науки/Языкознание/). Рубрика “Языкознание” имеет следующую структуру:

В ИПС “Яndex” имеются рубрики: Наука и образование/ Науки/ Гуманитарные науки/Филология/ Языкознание. Далее рубрика “Языкознание” не детализируется, и содержит неструктурированный набор ссылок на самые разные ресурсы.

ИПС “Alta Vista” не содержит русскоязычных рубрик. В ИПС “Google” русскоязычные рубрики имеют следующий вид: Наука/Общественные науки/ Языкознание и лингвистика, однако материалов по компьютерной лингвистике и компьютерной семантике указанные рубрики не содержат.

Анализ рассмотренных классификационных систем сетевых ИПС показывает, что взятая нами в качестве модельного примера дисциплина ("Лингвистика") в большинстве из них представлена совершенно неудовлетворительно как с точки зрения глубины и системности используемых классификационных схем, так и с точки зрения наполнения имеющихся рубрик. Качество систематизации в них значительно ниже, чем в традиционной библиотечной технологии, опирающейся на детально разработанный аппарат библиотечных классификаций. Поэтому имело бы смысл воспользоваться хотя бы теми инструментами, которые уже существуют и попытаться приспособить их к условиям работы в новой коммуникационной и технологической среде.

Основная причина такого положения, на наш взгляд, состоит в отсутствии институционализированной технологии описания информационных материалов, помещаемых в Интернет. В настоящее время в организационно-технологической структуре большинства Интернет-серверов, осуществляющих подготовку и хранение информационных материалов, отсутствуют аналоги тех подразделений и служб, которые в обязательном порядке осуществляют описание документов перед включением их в фонд, например, в издательствах и библиотеках. Необходим регламент, устанавливающий порядок представления документов в системе электронных коммуникаций в соответствии с принятыми способами систематизации информационных ресурсов. Разрабатываемый W3C-консорциумом в настоящее время стандарт RDF рассматривает в основном формально-библиографические, но не содержательные аспекты описания Интернет-ресурсов. Нужно иметь в виду также, что при создании такого стандарта неизбежно возникает вопрос о создании и принятии специального языка многоаспектной классификации, адекватного возможностям современных информационных технологий.

На сегодняшний день наиболее эффективным средством тематического поиска информации при проведении научных исследований, по-видимому, следует считать организацию в Интернете специализированных Web-порталов по различным областям знания, использующих международные стандарты и системы тематической классификации.

Hosted by uCoz