Структурирование информации: простой и эффективный метод анализа. "Техника развития памяти: методы структурирования информации"

Макарова Н.В., Волков В.Б. Информатика: учебник для вузов.- СПб.: Питер, 2011. 576 с.

Тема 1. ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ

Понятие информации

Термин «информация» происходит от латинского «informatio», что означает «разъяснение», «осведомление», «изложение».

Существует множество определений информации. Так, один из основоположников современной теории информации, Ноберт Винер, определял информацию так: «Информация есть информация, а не материя или энергия».

Такое определение через отрицание кажется достаточно полным и универсальным, но применить его в качестве инструмента для построения научной методологии практически невозможно.

В то же время в современной технике получили широкое распространение методологические подходы, позволяющие применять понятие информации и предложенные инструменты для исследования процессов, происходящих в технических системах, экономике, социуме, в живой и неживой природе.

Наиболее известный среди таких подходов – математическая теория Клода Шеннона, позволяющая вероятностно обосновать надежность передачи сигналов по линии связи. В подходе Шеннона информация – это мера снижения неопределенности системы.

Существует также термодинамический (энергетический) подход, рассматривающий информацию как способ уменьшения энтропии системы.

Советским математиком Колмогоровым был предложен алгоритмический подход, позволяющий оценить информацию по сложности алгоритма, необходимого для ее обработки. Все эти подходы тесно связывали понятие информации со сферой применения.

С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). Сообщение – это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т. п. В широком смысле информация – это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.

Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают степень неопределенности и неполноты имеющихся знаний.

Информатика рассматривает информацию как концептуально связанные между собой сведения, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данных. Покажем, в чем их различие.

Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности знаний о чем-либо, данные превращаются в информацию.

Данные – это информация, закодированная определенным образом с целью передачи, обработки, поиска или извлечения.

Пример. Напишите на листе бумаги десять номеров телефонов в виде последовательности десяти чисел и покажите их вашему другу. Он воспримет эти цифры как данные, так как они не предоставляют ему никаких сведений. Затем против каждого номера укажите название фирмы и род деятельности. Для вашего друга непонятные цифры обретут определенность и превратятся из данных в информацию, которую он в дальнейшем мог бы использовать.

При работе с информацией всегда имеются ее источник и потребитель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее потребителю, называются информационными коммуникациями.

Для потребителя информации очень важной характеристикой является ее адекватность.

Адекватность информации – это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.

В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.

Меры информации (с. 20-25)

Качество информации

Качество информации – это совокупность свойств, которые обусловливают способность информации удовлетворять определенные потребности людей.

Основными потребительскими показателями качества информации являются: репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют правильность концепции, на базе которой сформулировано исходное понятие; обоснованность отбора существенных признаков и связей отображаемого явления.

Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.

Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных. С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.

Достаточность (полнота) информации означает, что ее состав (набор показателей) минимален, но достаточен для принятия правильного решения. Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, то есть недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразуется к доступной и удобной для восприятия пользователем форме.

Актуальность информации определяется степенью сохранения ценности информации для управления на момент использования и зависит от динамики изменения ее характеристик, а также от интервала времени, прошедшего с момента возникновения данной информации.

Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т. п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:

– формальная точность измеряется значением единицы младшего разряда числа;

– реальная точность определяется значением единицы последнего разряда числа, верность которого гарантируется;

– максимальная точность представляет собой точность, которую можно получить в конкретных условиях функционирования системы;

– необходимая точность определяется функциональным назначением показателя.

Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, то есть вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

Репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности также в большей степени обусловливаются на методическом уровне, однако на их величину существенно влияет еще и характер функционирования системы, в первую очередь ее надежность. При этом параметры актуальности и точности жестко связаны, соответственно, с параметрами своевременности и достоверности.

Информационные процессы

Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации, называются информационными.

Поиск информации – это процесс извлечения хранимой информации.

Сбор информации – это деятельность субъекта, в ходе которой он получает информацию об интересующем его объекте.

Хранение информации – это процесс поддержания исходной информации в виде, обеспечивающем выдачу данных по запросам конечных пользователей в установленные сроки.

Способ хранения информации зависит от ее носителя (книга – библиотека, картина – музей, фотография – альбом). ЭВМ может рассматриваться как устройство для компактного хранения информации с возможностью быстрого доступа к ней.

Передача (обмен) информацией – это процесс, в ходе которого передатчик (источник) передает информацию, а получатель (приемник) ее принимает.

В процессе передачи информации обязательно участвуют источник и приемник информации. Между источником и приемником действует канал передачи информации – канал связи.

Канал связи – это совокупность технических устройств, обеспечивающих передачу сигнала от источника к получателю.

Кодирующее устройство – это устройство, предназначенное для преобразования исходного сообщения источника к виду, удобному для передачи.

Декодирующее устройство – это устройство для преобразования кодированного сообщения в исходное (рис. 1.1).

Деятельность людей всегда связана с передачей информации. В процессе передачи информация может теряться и искажаться, в качестве примеров можно привести искажение звука в телефоне, атмосферные помехи в радио, искажение или затемнение изображения в телевидении, ошибки при передачи в телеграфе.

Рис. 1.1. Передача информации по каналу связи

Каналы передачи сообщений характеризуются пропускной способностью и помехозащищенностью. Каналы передачи данных делятся на симплексные (с передачей информации в одну сторону, например телевидение) и дуплексные (по которым можно передавать информацию в оба направления, например телефон, телеграф). По каналу могут одновременно передаваться несколько сообщений. Каждое из этих сообщений выделяется (отделяется от других) с помощью специальных фильтров. Например, возможна фильтрация по частоте передаваемых сообщений, как это делается в радиоканалах. Пропускная способность канала определяется максимальным количеством символов, передаваемых по нему в отсутствие помех. Эта характеристика зависит от физических свойств канала. Для повышения помехозащищенности канала используются специальные методы передачи сообщений, уменьшающие влияние шумов. Например, вводят лишние символы. Эти символы не имеют реального содержания, но используются для контроля правильности сообщения при получении. С точки зрения теории информации избыточно все то, что делает литературный язык красочным, гибким, богатым оттенками, многоплановым, многозначным.

Обработка информации – это упорядоченный процесс ее преобразование в соответствии с алгоритмом решения задачи или с другими формальными правилами.

После решения задачи обработки информации результат должен быть выдан конечным пользователям в требуемом виде. Эта операция реализуется в ходе решения задачи выдачи информации. Выдача информации, как правило, производится с помощью внешних устройств ЭВМ в виде текстов, таблиц.

Защита информации в более узком смысле понимается как предотвращение доступа к информации лицам, не имеющим соответствующего разрешения (несанкционированный, нелегальный доступ), непредумышленного или недозволенного использования, изменения или разрушения информации.

Защита информации (в широком смысле) – это комплекс организационных, правовых и технических мер по предотвращению угроз информационной безопасности и устранению их последствий.

Наиболее эффективным средством организации информационных процессов является информационная система, оснащенная средствами ввода, поиска, размещения, обработки и выдачи информации. Наличие таких средств – главная особенность информационных систем, отличающих их от простых скоплений информационных материалов. Например, личная библиотека, в которой может ориентироваться только ее владелец, информационной системой не является. В публичных же библиотеках порядок размещения книг всегда строго определен. Благодаря ему, поиск и выдача книг, а также размещение новых поступлений реализованы в виде стандартных, формализованных процедур.

Классификация и структурирование информации

Классификация – это система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Пример. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:

– информация о студентах – в виде информационного объекта «Студент»;

– информация о преподавателях – в виде информационного объекта «Преподаватель»;

– информация о факультетах– в виде информационного объекта «Факультет» и т. п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными (например, вес, стоимость, год), либо признаками (например, цвет, марка машины, фамилия).

Реквизит – это логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления.

Пример. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:

– фамилия, имя, отчество;

– год рождения;

– место рождения;

– адрес проживания;

– факультет, где проходит обучение студент, и т. д.

Все перечисленные реквизиты характеризуют свойства информационного объекта «Студент».

Кроме выявления общих свойств информационного объекта, классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.

Пример. Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию обо всех книгах по определенной тематике, об авторах, абонентах и т. д.

Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, прибыли, заказчиках, видах производимой продукции и т. д.

Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.

В любой стране разработаны и применяются государственные, отраслевые и региональные классификаторы. Например, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т. д.

Классификатор – это систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятия «классификационный признак» и «значение классификационного признака», которые позволяют установить степень сходства или различия объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное признаком классификации. Синонимом признака классификации является основание деления.

Пример. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет. Можно в качестве признаков классификации использовать возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков.

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

В табл. 1.1 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

Таблица 1.1. Классификация информации, циркулирующей в организации

По признаку места возникновения информацию можно разделить на входную, выходную, внутреннюю, внешнюю.

Входная информация – это информация, поступающая в фирму или ее подразделения. Выходная информация – это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) может быть определена информация как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя – за пределами объекта.

Пример. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой – входной. Сведения фирмы, подаваемые в налоговую инспекцию о размере отчислений в госбюджет, являются, с одной стороны, выходной информацией, с другой – внешней по отношению к налоговой инспекции.

По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация – это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии. Вторичная информация – это информация, которая получается в результате обработки первичной информации; она может быть промежуточной и результатной. Промежуточная информация используется в качестве исходных данных для последующих расчетов. Результатная информация получается в процессе обработки первичной и промежуточной информации и служит для выработки управленческих решений.

Пример . В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество каждым работником расписанных чашек. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это, с одной стороны, вторичная промежуточная информация, а с другой – результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные – результатная информация.

По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация – это совокупность алфавитных, цифровых и специальных символов, с помощью которых информация представляется на физическом носителе (бумага, изображение на экране дисплея). Графическая информация – это различного рода графики, диаграммы, схемы, рисунки и т. д.

По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п. Постоянная (условно-постоянная) информация – это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:

– постоянная справочная информация включает в себя описание постоянных свойств объекта в виде устойчивых длительное время признаков (например: табельный номер служащего, профессия работника, номер цеха и т. п.);

– постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы (например: размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим);

– постоянная плановая информация содержит многократно используемые в фирме плановые показатели (например: план выпуска телевизоров, план подготовки специалистов определенной квалификации).

По функциям управления обычно классифицируют экономическую информацию, при этом выделяют следующие группы: плановая, нормативно-справочная, учетная и оперативная (текущая).

Плановая информация – информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Пример. К плановой информации фирмы могут быть отнесены такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т. д.

Нормативно-справочная информация представляет собой различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Пример. Нормативно-справочной информацией на предприятии являются:

– время, предназначенное для изготовления типовой детали (нормы трудоемкости);

– среднедневная оплата рабочего по разряду;

– оклад служащего;

– адрес поставщика или покупателя и т. д.

Учетная информация – это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации могут выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.

Пример. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т. п.

Оперативная (текущая) информация – это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

Пример. К оперативной информации относят:

– количество изготовленных деталей за час, смену, день;

– количество проданной продукции за день или определенный час;

– объем сырья от поставщика на начало рабочего дня и т. д.

©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16

Структурирование информации

Нежданов Игорь

Еще одним довольно простым способом анализа получаемой информации является ее структурирование. Структурирование есть ни что иное, как расположение в определенном порядке, или по определенной схеме. Такой порядок может быть определен по разному. Наиболее яркий пример это расположение информации в хронологическом порядке. Например информацию из разных источников о неком событии располагают в последовательно от более раннего к более позднему (или наоборот), т.е. в соответствии с временем которое описывается данным блоком информации.

Другой способ структурирования информации это расположение каждого блока информации в разных разделах в зависимости от того элемента, который описывает данный информационный блок. Далее предлагаю более подробно ознакомиться с разными способами структурирования информации. Отличаются они в основном тем, по какому принципу происходит структурирование.

Расположение в хронологическом порядке или построение последовательности событий.

Данный метод еще называют историческим. Все поступающие данные выстраиваются по времени описываемых событий. После чего определяется:
- что за чем следует,
- какой факт какое событие предопределяет,
- что чему сопутствует и т.п.
Иначе говоря восстанавливается хронология событий. Это один из наиболее простых способов и в то же время достаточно эффективных. Он используется в самых разных исследованиях.

Самый простой пример использования исторического метода (хронологии) это изучение кандидата при его приеме на работу. У вас есть ряд источников: резюме кандидата, его трудовая книжка, заполненная им анкета. Кроме того вы можете использовать Интернет для выявления его мест работы (по оставленным им-же объявлениям и заявкам) или базы данных. Собрав всю эту информацию вы составляете несколько последовательностей (хронологий):

1 - как кандидат хочет выглядеть (по его резюме и анкете);
2 - как было на самом деле (по его трудовой книжке);
3 - вспомогательный вариант (по всем остальным источникам).

Еще один вариант использования хронологии это построение цепочки событий. Например для восстановления полной картины некоего события - что за чем следовало, что причиной чего являлось…. При этом особенно ценно если аналогично рассматриваются и параллельные происшествия, или события рассматриваются с учетом известного происшествия, тогда многое становиться понятно в силу «совпадений» и разного рода корреляций.

Кроме того данный метод можно использовать для выявления обмана (подтасовки фактов) в изложении версий конфликта разными сторонами этого конфликта. Строятся параллельные последовательности событий по версиям всех источников информации. А далее происходит «сравнение показаний». Если о наличии некоего действия в определенное время говорят все участники, то скорее всего так и было….

Привязку событий к определенному происшествию используют для выявления поведенческих реакций объекта, правда это уже моделирование, но для регистрации и анализа используется все тот же исторический метод (хронология событий). В определенной среде это называется провоцированием. Например объекту дают некую «горящюю» информацию, информацию требующую немедленных действий (присылают по почте, передают как слух, сообщают официально и т.п.), а затем внимательно наблюдают:

Что и в какой последовательности он предпримет;
- к кому обратится в первую очередь;
- как в принципе отреагирует на сообщение и т.д.

Можно данное мероприятие обставить соответствующим образом. Например ограничить объект в перемещении или в связи, создать впечатление, что у него практически нет времени на обдумывание и т.п.. Все зависит от того, что вы хотите понять (выявить). Для упрощения восприятия ситуации, результат можно изобразить схематически. Если несколько последовательностей изобразить в одном масштабе и одним стилем, то при их совмещении можно выявлять закономерности, корреляцию и т.п..

Составление перечня источников.

Это структурирование данных об источниках информации по какому то вопросу. Составляя такой перечень нужно давать краткую характеристику каждому источнику в зависимости от целей составления списка и от общей задачи:

Название;
- автор;
- кто опубликовал;
- когда опубликовано;
- канал поступления;
- основная тематика;
- основная аудитория;
- компетентность (качество информации);
- тенденциозность в изложении;
- аффилированность (ангажированность);
- позиция по отношению к теме ваших исследований.

В результате такой систематизации вы получаете общую картину информационного поля, на котором работаете. И как следствие быстро и правильно ориентируетесь в случае появления чего то нового, необычного, неожиданного. Или сможете понять какой источник более важен для вас в свете изучаемой проблемы.

Анализ тенденций.

Еще одна разновидность исторического метода (хронологии) это анализ тенденций. Фактически это структурирование информации по одной из характеристик (показателю). Данный метод предусматривает фиксацию изменений во времени некоторого выбранного вами показателя. Таким показателем может быть нечто выражаемое числовым способом (объем продаж, численность населения, скорость перемещения и т.п.). В таком случае анализ достаточно прост - сопоставление этого показателя на разных временных участках дает основание для заключения о тенденции роста, спада или стагнации. Сложнее обстоит дело с не числовыми показателями такими как настроения поклонников спортклуба или отношение граждан к проблеме. В подобных случаях необходимо вначале «оцифровывать» выбранный показатель. Такую оцифровку можно осуществить посредством:

Экспертных оценок;
- попарного сравнения;
- выбора некоего элемента за единицу измерения.

А затем вновь наблюдение за изменениями во времени.

Построение диаграммы связей.

Это ни что иное как определение всего, что так или иначе связано с изучаемым объектом или событием и графическом отображением данной информации. Построение диаграммы связей есть ни что иное как структурирование информации по такой характеристике как связи объектов. Какие типы связей изучаются зависит от поставленной цели. Такие связи могут быть явными и неявными. К явным относятся прямо установленные - имеющие фактическое подтверждение (доказательства), то как учредитель - учрежденный, продавец - покупатель, родственники и т.п. К неявным относятся те связи, которые нельзя доказать фактами, но которые могут существовать. Например один юридический адрес у нескольких организаций может указывать на то, что они созданы одной юридической конторой, а на основе этого можно предположить и более значимую связь, которая безусловно требует дополнительной проверки. Неявные связи не являются фактами, но они указывают на то, в каком направлении нужно вести поиск. А это уже задание оперативникам.

В результате получится схема, на которой разными фигурами обозначены разные объекты (например люди - овалами; организации - прямоугольниками; связи линиями или стрелками, а толщина этих линий - сила связи). Схемы хороши тем, что одним взглядом охватываешь всю ситуацию. Это позволяет не только ускорить восприятие ситуации, но и выявить аномалии (то что выделяется на общем фоне). Например объект с наибольшим количеством связей или явный аутсайдер. Надо отметить, что конечный результат данного способа анализа информации является как структурированием так и визуализацией информации. Но о визуализации чуть ниже.

Выявление силы связей.

Данный прием хорошо иллюстрируется анализом телефонных контактов. Все контакты (связи) между объектами сортируются в зависимости от того между кем они возникают. Затем оцениваются по частоте возникновения либо по продолжительности разговоров. На основе данных о силе связей строятся гипотезы и вырабатываются рекомендации для дальнейшего поиска.

Возьмем все ту же детализацию телефонных переговоров. Если у вас есть такая детализация за определенный период вы можете определить:

С каким абонентом у исследуемого наиболее тесные контакты,
- с кем контакты в нерабочее время, с кем в рабочее,
- с кем стабильные контакты, а с кем эпизодические.
- если сопоставить с параллельной хронологией, то можно выявить зависимости направления и силы контактов с иными событиями.
Если такую статистику сравнить со статистикой одного из контактеров исследуемого лица, то можно выявить еще и их общие контакты, и их плотность.

Например:

Иванов за исследуемый период общался:

С Петровым 4 раза
- с Сидоровым 2 раза
- с Сергеевым 7 раз

Напрашивается вывод о том, что у Иванова с Сергеевым наиболее плотные контакты. Далее можно строить гипотезы и собирать дополнительную информацию.

Описание объекта

В данном случае информация разносится по блокам, которые характеризуют разные стороны исследуемого объекта. А сама технология является структурированием информации по такому признаку как освещение той или иной характеристики изучаемого объекта. Проще это разобрать на примере. Предположим, что необходимо систематизировать информацию о некой компании ХХХ. Для этого составляем что то вроде списка свойств, элементами которого являются нужные нам характеристики объекта:

Идентификационные данные;
- руководство;
- имущество;
- клиенты;
- проблемы.

Далее всю поступающую информацию разносим в эти разделы в зависимости от содержимого информации. После разнесения, а иногда и в процессе, производим «вычищение» информации. Это ни что иное как приведение к формальному виду, более удобного для восприятия.

Последовательное решение более простых проблем (декомпозиция).

Еще один вариант структурирования информации это декомпозиция или последовательное решение более простых проблем. В данном варианте вы структурируете свою проблему и путь решения этой проблемы. Начиная работу по анализу, с самого первого шага, необходимо четко представлять цель, к которой идете. Эта цель формулируется в виде вопроса, ответ на который и есть то что вы хотите получить. Заведите себе правило - с началом любого проекта в первую очередь формулируйте цель, которую хотите достигнуть. Фиксируете эту цель в плане проекта следующим пунктом после названия.
Например «как поведет себя господин А в такой-то ситуации?» или «какого уровня может достичь в своем развитии предприятие Б?» или более приземленное «какие силы могут противодействовать при покупке бизнеса Л и как их нейтрализовать?». И чем четче сформулирован вопрос, тем точнее и дешевле будет ответ.

Иногда бывает непросто сформулировать цель. Но это необходимо делать по тому, что невозможно достигнуть цели не зная ее.

Сначало рассматривается конечная цель проекта - при необходимости переформулируется таким образом, чтобы было точно понятно что является вашей целью. После того как сформулирована основная цель нужно определить ее подцели, без которых нельзя ответить на основной вопрос. Другими словами отвечаете на вопрос «что вам нужно что бы достичь основной цели (или ответить на основной вопрос)». Определив подцели спускайтесь на следующий уровень по тому же принципу и так пока не дойдете до элементарных вопросов, ответы на которые можно получить простыми действиями. Таким образом формируются группы вопросов со своим главным вопросом, а из групп главных вопросов формируется основной вопрос, ответ на который нам и нужен.
Возьмем уже озвученный вопрос — «какого уровня может достичь в своем развитии предприятие Ч?». Для ответа на него нужно выяснить следующее:

Каково текущее состояние предприятия?
- каковы возможности и преимущества предприятия?
- каковы угрозы и слабости предприятия?
- каковы намерения сил влияющих на предприятие?

Каково текущее состояние предприятия
(описание состояния объекта в настоящий момент)

Руководство (ТОП менеджмент)
- Владельцы (учредители, акционеры)
- Создаваемый продукт (продукция или услуга)
- Краткая история объекта
- Имущество (земля, здания и сооружения, станки и оборудование, не реализованная продукция, незаконченное производство, сырье и материалы, ценные бумаги и обязательства и т.д. и т.п.)
- Партнеры (поставщики, клиенты и т.п.)
- Показатели (финансовые, производственные и т.п.)

Каковы возможности и преимущества
(описание всех ресурсов предприятия и его преимуществ)

Возможности:
- Административные возможности (лобби, связь со властью, зависимость власти от предприятия, возможность влиять на решения властных структур и т.п.)
- Экономические возможности (возможности по наращиванию объемов производства, по переориентации производства, по повышению качества, по снижению цены, по привлечению инвестиций и получению кредитов и т.п.)
- Криминальные возможности (возможность использовать криминал, зависимость от криминала, заинтересованность криминала в предприятии, планы криминала по отношению к предприятию и т.п.)
- Научно-технические возможности (взаимодействие с НИИ, модернизация технологий, вложения в науку, иное участие в научной деятельности)
- Рыночные возможности (сильная конкурентная позиция, рост спроса, рыночная власть производителя, отсутствие товаров-заменителей)

Преимущества:
- Продукция (высокое качество, низкая себестоимость)
- Ценообразование (четко выработанная цена)
- Продвижение (сильная реклама, лобби в среде основных потребителей)
- Сервис/персонал (высокий профессионализм персонала, развитие сотрудников, социальные программы, сервисная поддержка, торговые марки и позиционирование)
- Инжиниринг и разработка новых продуктов (модернизация оборудования, совершенствование технологий, повышение качества)
- Сбыт и маркетинг (непрерывный мониторинг рынка, стимулирование сбыта)
- Менеджмент (низкие расходы на управление, мобильная структура, единая координация, быстрое прохождение управляющих сигналов)

Каковы угрозы и слабости
(описание слабых сторон бизнеса и существующих угроз)

Угрозы:
- Административные (лобби конкурентов, недовольство власти, зависимость предприятия от власти, конфликты с властью)
- Экономические (перегруженность оборудования, невозможность переориентации производства, невозможность повышения качества и снижения цены, трудности привлечения инвестиций и получения кредитов)
- Криминальные (давление криминала, зависимость от криминала, заинтересованность криминала в предприятии, планы криминала по отношению к предприятию, конфликты с криминалом)
- Научно-технические (отсутствие взаимодействия с НИИ, нет модернизации технологий)
- Рыночные (интенсивность конкуренции, угроза появления новых конкурентов, потребности покупателей на рынке, рыночная власть покупателей, дистрибьюторов, поставщиков, давление со стороны товаров-заменителей)

Слабости:
- Продукция (низкое качество, высокая себестоимость, моральное устаревание, невостребованность)
- Ценообразование (необоснованная цена)
- Продвижение (слабая реклама, отсутствие лобби)
- Сервис/персонал (низкий профессионализм, притеснение сотрудников, отсутствие социальных программ, нет программы сервисной поддержки)
- Торговые марки и позиционирование
- Инжиниринг и разработка новых продуктов
- Сбыт и маркетинг (рынок не изучается, сбыт не стимулируется)
- Менеджмент (высокие расходы на управление, неповоротливость структуры, отсутствие единой координации, долгое прохождение управляющих сигналов)

Каковы намерения сил влияющих на предприятие

Какие силы влияют или могут влиять на предприятие
- Ресурсы этих сил
- Деловая репутация этих сил (история взаимоотношений с партнерами, клиентами, конкурентами)
- Кредитная история этих сил (история возврата своих долгов и работы с должниками)
- Поведение в критических ситуациях этих сил (какие шаги предпринимались в кризисных ситуациях, к кому обращались за помощью, кто как проявлялся)
- Планы этих сил (краткосрочные, долгосрочные, стратегические, в том числе частные планы владельцев и руководства)

Вопросы стали более определенными. Теперь по каждому пункту нужно сказать где информацию можно взять и как. Если источники определены, а затраты приемлемы - можно приступать к сбору данных и описательной стадии работы. При необходимости разложение на составляющие идет дальше. После того, как вы дошли до элементарных вопросов, можно оценить какие ресурсы нужны для получения ответов на них (время, люди, финансы и т.п.). На основе этих данных можно составить и бюджет проекта.

Синтез данных по пирамиде с низу вверх — обратная составлению дерева целей. Теперь, начиная с элементарных (конечных) вопросов, последовательно нужно ответить на все вопросы дерева. После получения всех ответов на подвопросы одной группы можно приступать к формулированию ответа на главный вопрос этой группы. На этой стадии начинается творчество. Хорошо если есть группа людей, которых можно использовать в качестве экспертов. В таком случае можно, основываясь на экспертных оценках, свести к минимуму вероятность ошибки. Но увы - чаще всего приходится работать одному. А раз так - приступаем к присвоению весовых коэффициентов каждому ответу на подвопрос в рамках его группы. Иначе говоря определяем в цифрах (баллах) силу влияния данного ответа на главный вопрос его подгруппы. И в зависимости от результатов выявляем наиболее вероятный ответ. И так пока не дойдем до исходного вопроса.

Реферирование информации.

Реферирование это еще один вариант структурирования информации. В этом случае вы упрощаете восприятие информации посредством ее сжатия и структурирования. Реферирование особенно полезно в случае большого объема информации из разных источников (СМИ, БД, опер установки и т.п.) и при необходимости дальнейшего цитирования. Но реферирование всегда ориентировано на объект интереса, т.е. тот кто реферирует — определенным образом сам искажает информацию.

Реферирование заключается в выборке из всего массива информации ключевых моментов и их фиксировании. Умение быстро составить качественный реферат достаточно непростое свойство. В настоящее время появились программы берущие на себя данную функцию. Из простых можно привести в качестве примера TextAnalitics.

Вот простая методика реферирования текста.

Исследуемый текст читается три раза. При первом прочтении выделяются слова, несущие основную смысловую нагрузку - ключевые слова - они выделяются (маркером, подчеркиваются, обводятся - как вам удобнее). Это могут быть имена, названия, даты, профессиональные выражения и т.п..
При втором прочтении внимание концентрируется на ключевых словах, при этом выделяются короткие, не содержащие ничего лишнего словообразования (словосочетания), отражающие основные мысли исследуемого текста и характеризующие ключевые слова - также выделяются.

На третьем прочтении внимание обращается только на выделенные словообразования и на их основе строятся простые, краткие предложения, описывающие смысл сообщения. После чего делается вывод об основном смысле изучаемого текста.

Есть иной способ резюмирования - текст делится на законченные блоки (например абзац) и содержание этих блоков пересказывается в одном предложении.

Более сложный вариант реферирования заключается в выборке из текста значимых утверждений и их изложение. Но этот метод ориентирован на потребителя информации, а точнее на его интересы. Ведь выбираются не все утверждения, а лишь значимые для потребителя. Иначе реферат получиться больше исходного текста.

Предварительная типология проблемы.

Это ни что иное как предварительное изучение проблемы и определение ее основных характеристик, что позволяет выявить особенности и понять к какому типу данная проблема относится. Такой подход дает возможность всесторонне оценить сложные проблемы, выработать разные варианты их решения, в т.ч. используя альтернативные сценарии и накопленный опыт.

Планирование поиска решения.

Данная методология представляет собой ни что иное как выявление аналогий в иных областях для решения поставленной проблемы. Например в смежных или в принципиально не связанных. Например, при планировании создания крупного объединения можно взять за аналогию этапы развития живого организма. Или поиск решения технических задач в живой природе.

Контент-анализ

Еще один способ структурирования текстовой информации это контент-анализ. В самом простом виде контент-анализ это подсчет частоты упоминания какого то фрагмента текста (от слова до страниц и глав). И дальнейшая интерпретация этих частот. А это ни что иное как структурирование.

Самый простой способ применения контент-анализа для нужд конкурентной разведки это выявление частоты употребления не общеупотребительных слов. Суть в том, чтобы удалить из области анализа общеупотребительные слова и оставить только специфические. И по ним можно сделать выводы о предпочтениях, профессии, правдивости … да еще много о чем.

В сети достаточно подобных сервисов от шуточных до вполне профессиональных. Например вот этот

www.сайт

"Техника развития памяти:
методы структурирования информации"

Структурирование информации - это организация изучаемого материала в группы, связанные между собой в логическую цепочку. Особенно умение структурировать информацию ценно при изучении и запоминании большого объема данных.

Ведь его главная задача - упростить понимание отдельных элементов массива данных и упростить понимание их взаимосвязи друг с другом. При этом структурировать можно не только учебный (цифры, текст), но и развлекательный материал как в процессе получения данных, так и после.

Итак, каковы же методы и принципы структурирования знаний?

Первый - вся информация делится на группы в соответствии со значимыми критериями. Существует определенная закономерность («7+-2»), сколько память человека способна в среднем запоминать.

В соответствие с ней не рекомендуется создавать больше 7 групп или подгрупп. Создаваемые группы не должны быть похожи одна на другую, так как чем больше выделяется группа на общем фоне, тем лучше усваивается ее информация. В качестве примера можно привести рекламный бизнес, когда для концентрации внимания на рекламируемом товаре используются яркие и неоднозначные объекты.

Второй - группы логично связываются между собой и выстраиваются в определенном порядке. При этом лучше запоминаются группы, стоящие в начале или конце ряда.

Наиболее эффективными методами структурирования информации признаны метод тезисов, метод Корнели, цепочка Цицерона и метод ментальных карт. Метод тезисов - это тезисное изложение материала, разделенного на главные темы, подтемы и детали в форме отступов. Каждый новый пункт и расшифровку желательно выделять разным цветом.

При использовании метода тезисов легко определить содержание и основные моменты любого объема данных и проследить взаимосвязь между ними. Кроме того, благодаря своей простоте, данный метод позволяет структурировать данные наиболее понятным для каждого способом и не требует много времени. Метод Корнели чем-то напоминает привычные для нас поля в тетрадях, когда на самом листе записывается основная тема, а сбоку дополнения и примечания.

Вы делите листок на три части, в правой части (она занимает 2/3 страницы) конспектируются основные моменты каждой темы. Левая часть листа (около 1/3 страницы) служит для записи ключевых слов, вопросов или рисунков, относящихся ко всем сделанным справа пометкам.

Их назначение - выделить приоритетные понятия, установить прочную взаимосвязь тех моментов, которые нужно запомнить, с возникающими у нас ассоциациями, быстро проследить взаимосвязь законспектированного материала, создать целостность восприятия и прочно зафиксировать материал в памяти. Нижнее поле служит для подведения итогов
Цепочка Цицерона. Название метода связано с интересной подготовкой древнеримского оратора к своим выступлениям. Он прогуливался по дому и мысленно расставлял в нем ключевые моменты своего выступления. Примерно также поступаете и вы. Мысленно расставляете запоминаемые объекты в знакомой вам комнате в строго определенном порядке. Чтобы воспроизвести нужную информацию, вам надо просто вспомнить эту комнату.

Метод карт памяти (метальные карты или майнмэппинг). Метод составления карты памяти позволяет представить всю проблему целиком на одном листе, что является несомненным преимуществом. Он способствует лучшему пониманию материала, облегчает запоминание, развивает творческие способности. Чтобы его построить:

В центре листа нарисуйте и подпишите картинку, которая отображала бы ключевую тему или предмет карты памяти.
Нарисуйте расходящиеся от центральной картинки линии, используя ручки разного цвета. Эти линии обозначают основные признаки обсуждаемого предмета.
Охарактеризуйте эти признаки с помощью ключевых слов или рисунков. Ключевые слова тренируют память, а рисунки концентрируют и развивают внимание. Оставьте место для добавления деталей.
Нарисуйте следующие более тонкие линии, выходящие из основных. Подпишите каждую из них, чтобы описать содержание признаков.
Продолжайте процесс, переходя к все более мелким подтемам.
С помощью разных цветов и рисунков дополните карту памяти для легкого запоминания и тренировки памяти.
Используйте стрелки и линии для объединения различных идей.

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация - это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

Получение качественно нового знания о системе/процессе;

Установление факта и локализация неполноты и/или противоречивости совокупности знаний;

Систематизация, упорядочение некоторой совокупности знаний;

Акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

Сокращение избыточности представления информации;

Согласование представления информации с некоторой системой обработки и интерпретации;

Повышение наглядности отображения информации;

Смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель - это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.

Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

Информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

Информация о функциях системы/процесса;

Информация о структуре системы/процесса;

Информация о динамике системы/процесса;

Информация о состоянии системы/процесса;

Информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

- отношение информации к объекту:

Информация, относящаяся к объекту;

Информация, относящаяся к классу объектов;

Информация, относящаяся к среде;

- отношение информации к некоторому моменту времени:

Информация, относящаяся к прошлому;

Информация, относящаяся к настоящему;

Информация, относящаяся к будущему;

- отношение информации к классу структурной организации:

Информация неструктурированная;

Информация структурированная;

Информация упорядоченная;

Информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации .

Можно ли сказать, что структуризация информации/данных - это нечто новое или незнакомое нам? - Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний - мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, - это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян - русский мат - по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами - запальчиво возразит «патриот»... что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» - то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили - пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация - это иерархически организованная система информационных элементов, обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов . Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

Искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

Натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко - натуральная классификация, красное/зеленое яблоко - искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов :

При выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

Совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

Понятия, полученные в результате деления должны взаимно исключать друг друга;

Деление должно быть последовательным.

Классификации делятся на следующие виды:

Простые (одноуровневые), например - дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

Сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например - периодическая таблица химических элементов Д.И. Менделеева;

Иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний . Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе - и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной - что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности :

Деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

Деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта . Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе ):

1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня) . В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным .

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

Осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

Интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего - экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило, эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта ).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства» . Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности - тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича, написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных - это тоже модели , описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации - от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе - проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

Выделения «дискретных» состояний (для текстовых описаний - это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

Упорядочивания их во времени (построение сценариев типа «раньше - позже»);

Причинно-следственного связывания (построение сценариев типа «причина - следствие»);

Пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии - воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов. В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.