А.В.Бочаров

Модель изучения региональных электронных архивов СМИ
в контексте соотношения микро- и макроистории

Статья опубликована: Модель изучения региональных электронных архивов СМИ в контексте соотношения макро- и микроистории // Вестник Томского государственного университета. История. 2009. №2(6). С. 131-135.

Статья посвящена отображению взаимодействий микро- и макроисторических процессов при изучении региональных электронных архивов СМИ в контексте методов типологизации и системного анализа при обработке неструктурированной текстовой информации.

Региональная журналистика – это постоянный поиск казусов на микрособытийном уровне и спорадическое осмысление этих казусов на макрособытийном уровне. Как можно догадаться, в процессе творчества эти поиски проходят отчасти стихийно, и ориентированы на текущую изменчивую актуальность. Но вот прошла очередная неделя с её новостями, и всё ушло в архив, теперь уже электронный. Изучение огромного архива должно быть уже не стихийным, а упорядоченным и систематизированным.

Поводом для начала исследования или аналитической экспертизы может стать казус или их группа из текущих событий, современных началу исследовательской работы. При этом исследователь может руководствоваться своей интуицией, эрудицией и предварительными научными интересами. Но при углублении и расширении исследования, может понадобиться поиск аналогий и тенденций для исходного события, то есть нужно будет обращаться к архиву.

Какие из множества казусов и микро-событий регионального уровня за предшествующие годы достойны внимания для исторического исследования? Например, в Томске за день выходит более 150 инвариантных сообщений в разных СМИ, за месяц их накапливается более 4500 тыс., за год ­– более 50 тыс. Чем руководствоваться для такого огромного массива данных при выборе, сужающем поле исследования и конкретизирующим объект исследования? Какими методами, и с какими целями можно упорядочить и систематизировать массив информации об огромном количестве отдельных казусов, случаев и мнений в разных сообщениях СМИ, не связанных в один нарратив? Какими могут быть принципы изучения взаимодействия микро- и макроисторических уровней для источниковой базы в виде региональных электронных архивов СМИ? Какими принципами стоит руководствоваться при структурировании огромных массивов неструктурированной информации. Насколько эти принципы применимы к более широкому полю исторических исследований, для разнообразных исторических текстов?

Полноценная и полная обработка огромного архива возможна только при использовании компьютерной экспертной системы анализа текстов, которая позволяет частично автоматизировать выявление событийных тенденций и информационных контекстов. К сожалению, тезисный формат статьи не позволяет здесь презентировать такую компьютерную экспертную систему, разработанную автором, и продемонстрировать конкретные эмпирические результаты её использования (см. Рис. 1.). Предлагаемые тезисы посвящены только одному возможному аспекту применения экспертной системы, а именно: отображению взаимодействий микро-  и макроисторических процессов в контексте методов типологизации и системного анализа.

Рис. 1. Фрагмент представления матрицы тематического анализа сообщений Томских СМИ за март 2006г. Увеличить в отдельном окне >>

Внутренняя среда любой системы может взаимодействовать с внешней средой по некоторым видам направлений этих взаимодействий. Если мы в системном анализе отражения исторической действительности в текстах будем рассматривать внутреннюю среду системы как уровень микроисторических событий, а внешнюю среду как уровень макроисторических процессов, то получится уже модель взаимодействия микро- и макроистории. Модель анализа связей системы с внешней средой показана на Рис. 2.

По конкретному содержанию взаимодействия воплощаются в перемещениях 4-х типов: перемещения людей, материальных ресурсов, информации, финансов.

Граница для системы «Томская область» воплощается в нескольких смыслах: В пространственно-территориальном смысле – это граница области на географической карте. В административно-организационном смысле – это таможенные  и представительные органы Томской области. В социально-психологическом смысле – это сознания и организмы томичей. В финансовом смысле – это юридическая принадлежность к финансовым агентам томской области.

Модель анализа связей системы с внешней средой. Схема Алексея Бочарова

Взаимодействия системы и  внешней среды, в зависимости от направления, подразделяются на 15 типов (каждый тип соответствует стрелке на Рис. 2.):
1) Всегда остаются в пределах границы;
2) Исходят из внешней среды внутрь системы, а затем систему;
3) Исходят изнутри системы, соприкасаются с внешней средой, затем возвращаются во внутреннюю среду системы;
4) Исходят с границы системы внутрь системы, не соприкасаясь затем с её границей;
5) Исходят с границы системы внутрь системы, а затем покидают систему;
6) Исходят изнутри системы, соприкасаются с внешней средой, а затем остаются на границе системы;
7) Исходят из внешней среды внутрь системы, а затем остаются на её границе;
8) Исходят из внешней среды, соприкасаются с границей системы, не попадая внутрь системы, а затем возвращаются во внешнюю среду;
9) Исходят с границы системы во внешнюю среду;
10) Исходят из внешней среды, а затем остаются на границе системы, не попадая во внутреннюю среду системы;
11) Исходят изнутри системы и остаются на её границе;
12) Исходят с границы системы во внутреннюю среду системы;
13) Исходят из внешней среды, а затем остаются во внутренней среде системы;
14) Исходят изнутри системы во внешнюю среду;
15) Исходят с границы системы во внешнюю среду, затем возвращаются на границу системы, не попадая в её внутреннюю среду.

Первичная типология вышеприведенных 15-ти процессов может выглядеть следующим образом:

1) Темпоральное разделение макропроцессов:
1.1. Режим долгого времени в историческом прошлом в контексте исторических аналогий и ретроспекций;
1.2 Режим короткого времени в актуальной современности в контексте «новость дня или недели».

 2) Пространственное разделение макропроцессов в контексте «тенденции современности»:
2.1. Общерегиональные (в нашем случае сибирские) процессы;
2.2. Общероссийские процессы;
2.3. Зарубежные процессы в отдельных странах или регионах;
2.4. Общемировые процессы .

3) Тематическое разделение сообщений о событиях:
3.1. По сферам жизни общества;
3.2. По установкам авторов сообщений о событиях (эмоциональным, идеологическим, логико-риторическим).

4) Отношение с реальностью как критерий разделения сообщений о событиях:
4.1. Объективно произошедшие в действительности процессы;
4.2. Мнимые, вымышленные, возможные процессы (которые должны, могут или могли бы произойти, по мнению авторов сообщений или респондентов).

 Первичными вышеперечисленные типы будут потому, что их можно разделять на подтипы и подвиды сколь угодно глубоким и подробным образом. Например, тематическое разделение сообщений о событиях можно вначале отобразить в виде нескольких основных сфер жизни: политической, социальной, культурной, экономической. То, какой факт или случай, к какой сфере отнести, зависит исключительно от формальных аналитических установок исследователя, обусловленных его предметом и задачами исследования. Затем каждую из этих сфер можно разделить ещё на субсферы. Например, можно условиться, что в контексте сообщений региональных СМИ социальная тематика включает в себя следующие субсферы: «ЖКХ», «Детство, материнство, семья», «Пенсионеры», «Транспорт», «Здоровье и медицина» (Рис. 3.).

Рис. 3. Представление выборки фрагментов сообщений Томских СМИ за март 2006г. по теме международных взаимодействий. Увеличить в отдельном окне >>

Далее тематику тематики можно было бы при необходимости разделить на подтемы (гипонимические ряды). Например тематуку «ЖКХ» можно разделить на подтемы, связанные с водоснабжением, электроснабжением, квартплатой, ремонтом, уборкой мусора или снега, озеленением города и так далее. В принципе для любого текста количество возможных тематик и их интерпретаций многократно превышает количество слов в тексте, так как одно и то же слово или выражение может относиться ко многим тематикам и по-разному интерпретироваться.

На основе статистических таблиц можно выявлять исторические казусы методом сравнительно-исторической индивидуализации. Это метод, направленный на выявление неповторимого и уникального на основе внешних признаков событий и объектов. Например: С какими странами или регионами меньше всего связей за определённый период? Какого типа связей меньше всего (по направлениям взаимодействий, по сферам жизни)? Какие сферы и тематики меньше всего сопряжены? По каким тематикам меньше всего сообщений с конфликтно-негативной эмоциональной тональностью (или, напротив, с позитивной тональностью)? Метод универсализирующего сравнения, напротив, позволит искать проявления макроисторических тенденции, если в матрице базы данных архива СМИ мы будем искать не минимальные, а максимальные частоты встречаемости (Рис. 4.).

Рис. 4. Пример статистической сводки: Рейтинг сфер международных связей Томска за 10-ю неделю 2006 г. (6-12 марта). Увеличить в отдельном окне >>

Под микроисторическим уровнем в данном случае подразумеваются конкретные случаи и события, произошедшие в Томске или Томской области с конкретными людьми или их группами и описанные в сообщении томских СМИ. Пристальность анализа к отдельным контекстным и семантическим деталям текста сообщения СМИ является при этом главным аргументом в пользу того, что мы имеем дело с микроисторическим анализом. Этот анализ, в том числе, может распространяться и на упоминания макропроцессов в России и мире, в контекст которых вписаны случаи и казусы томской жизни.

Для контекстов сообщений о данных разноуровневых соотношений можно использовать следующую типологию:
1) Специфика микроисторического уровня по отношению к макропроцессам (специфика Томска внутри России или в мире);
2) Типичность по отношению к макропроцессам (типичность Томска внутри России или по отношению к другим странам);
3) Микроисторический уровень как выражение специфики России по отношен к внешней макропроцессам (Томск как типичный представитель России);
4) Микроисторический уровень как выражение специфики Томска по отношению к внешним макропроцессам (Томск как нетипичный представитель России).

Целостной контекстной единицей анализа для СМИ выступает весь текст конкретного сообщения, так как эти тексты, как правило, небольшие по объёму. Тем не менее, предлагаемая модель применима к любым текстам любого объёма, поскольку исследователь сам может определять, что для него будет контекстной единицей. Например, в качестве такой единицы можно взять один абзац крупного текста (например, исторического трактата, или мемуаров, или дневников). В этом случае в базе данных, составленной для крупного текста, в строках таблицы будут содержаться уже не отдельные целостные поименованные тексты разных авторов (как в случае с архивом СМИ), а отдельные пронумерованные абзацы или разделы одного и того же текста.

В целом при вложении всех вышеперечисленных типологий друг в друга исследователь может разработать практически бесконечную по своему потенциалу матрицу критериев для анализа социальной действительности. Если эти критерии выражать в виде тематических словарей-тезаурусов лексических единиц и контекстных взаимозависимостей этих единиц, то у представителей разных социальных наук появится модель для разработки эффективных компьютерных авторубрикаторов текстов и экстракторов фактов и тенденций.