Ощепков М.В.
|
С ПОМОЩЬЮ ИНТЕРНЕТ |
Парадоксом развития информационных технологий является тот факт, что методы обработки сверхбольших массивов информации все больше ориентируются не на формальные компьютерные методы, а на человека, образ его мышления, творческие способности, интуицию, цели и задачи, стоящие перед ним. Доминирующий сегодня подход в решении задач по извлечению знаний является по сути обобщением реальной практики информационно-аналитической работы в сочетании с современными разработками в области вычислительной техники и искусственного интеллекта. В зависимости от поставленной задачи (ситуации) сотрудник может использовать тот или иной «инструментарий», а ситуационный метод решения проблем является методологической основой технологии поиска и анализа информации, полученной из Интернет. Процесс информационно-аналитической работы в силу своей двойственной природы включает в себя формальные и неформальные процессы. Человек, как главное действующее лицо процесса анализа, в своей работе проходит путь от сомнений, неуверенности и неопределенности к ощущению оптимизма, чувству правильности сделанного выбора и, наконец, полной удовлетворенности решением поставленной проблемы. Все это происходит на фоне интеллектуальной обработки информации от неопределенного представления проблемы к постепенному пониманию ее структуры и разрешению проблемы в том виде, как ее понимает аналитик. Интернет изменил вектор направленности работы аналитика: от дефицита информационных ресурсов к их избыточному потоку. Практически по любой проблеме исследователь может получить из Интернет сотни тысяч публикаций. В этих условиях поиск информации в Интернет приобретает черты интеллектуального процесса, получившего название data mining. Большинство современных исследователей процесса аналитической обработки информации склоняются к тому, что традиционный на сегодня библиографический подход к анализу информации, основанный на принципе «определенность и порядок», будет постепенно заменяться на технологию работы, где аналитик в интерактивном режиме имеет возможность использовать свой интуитивный и формальный опыт работы. Процесс извлечения динамически меняющихся данных и знаний является интерактивным и итеративным. Он включает в себя целый ряд этапов и предполагает возможность многократного принятия решения аналитиком на каждом из них. Работа по поиску необходимой информации может быть разделена на 9 основных этапов: 1) определение, к какой области знаний относится требуемая информация; 2) выбор типа и источников данных; 3) сбор материалов, необходимых для наполнения информационной модели; 4) отбор наиболее полезной информации; 5) выбор метода обработки информации: классификация, кластеризация, регрессионный анализ и т.д.; 6) выбор алгоритма поиска закономерностей; 7) поиск закономерностей, формальных правил и структурных связей в собранной информации; 8) творческая интерпретация полученных результатов; 9) интеграция извлеченных «знаний» . Последний этап работы подразумевает консолидацию данных с ранее полученной информацией. Иными словами, «старые» и «новые» знания должны быть согласованы между собой, а возможные противоречия устранены или иметь соответствующие объяснения. |