Модель изучения региональных электронных архивов СМИ Статья опубликована: Модель изучения региональных электронных архивов СМИ в контексте соотношения макро- и микроистории // Вестник Томского государственного университета. История. 2009. №2(6). С. 131-135. Статья посвящена отображению взаимодействий микро- и макроисторических процессов при изучении региональных электронных архивов СМИ в контексте методов типологизации и системного анализа при обработке неструктурированной текстовой информации. Региональная журналистика – это постоянный поиск казусов на микрособытийном уровне и спорадическое осмысление этих казусов на макрособытийном уровне. Как можно догадаться, в процессе творчества эти поиски проходят отчасти стихийно, и ориентированы на текущую изменчивую актуальность. Но вот прошла очередная неделя с её новостями, и всё ушло в архив, теперь уже электронный. Изучение огромного архива должно быть уже не стихийным, а упорядоченным и систематизированным. Поводом для начала исследования или аналитической экспертизы может стать казус или их группа из текущих событий, современных началу исследовательской работы. При этом исследователь может руководствоваться своей интуицией, эрудицией и предварительными научными интересами. Но при углублении и расширении исследования, может понадобиться поиск аналогий и тенденций для исходного события, то есть нужно будет обращаться к архиву. Какие из множества казусов и микро-событий регионального уровня за предшествующие годы достойны внимания для исторического исследования? Например, в Томске за день выходит более 150 инвариантных сообщений в разных СМИ, за месяц их накапливается более 4500 тыс., за год – более 50 тыс. Чем руководствоваться для такого огромного массива данных при выборе, сужающем поле исследования и конкретизирующим объект исследования? Какими методами, и с какими целями можно упорядочить и систематизировать массив информации об огромном количестве отдельных казусов, случаев и мнений в разных сообщениях СМИ, не связанных в один нарратив? Какими могут быть принципы изучения взаимодействия микро- и макроисторических уровней для источниковой базы в виде региональных электронных архивов СМИ? Какими принципами стоит руководствоваться при структурировании огромных массивов неструктурированной информации. Насколько эти принципы применимы к более широкому полю исторических исследований, для разнообразных исторических текстов? Полноценная и полная обработка огромного архива возможна только при использовании компьютерной экспертной системы анализа текстов, которая позволяет частично автоматизировать выявление событийных тенденций и информационных контекстов. К сожалению, тезисный формат статьи не позволяет здесь презентировать такую компьютерную экспертную систему, разработанную автором, и продемонстрировать конкретные эмпирические результаты её использования (см. Рис. 1.). Предлагаемые тезисы посвящены только одному возможному аспекту применения экспертной системы, а именно: отображению взаимодействий микро- и макроисторических процессов в контексте методов типологизации и системного анализа.
Внутренняя среда любой системы может взаимодействовать с внешней средой по некоторым видам направлений этих взаимодействий. Если мы в системном анализе отражения исторической действительности в текстах будем рассматривать внутреннюю среду системы как уровень микроисторических событий, а внешнюю среду как уровень макроисторических процессов, то получится уже модель взаимодействия микро- и макроистории. Модель анализа связей системы с внешней средой показана на Рис. 2. По конкретному содержанию взаимодействия воплощаются в перемещениях 4-х типов: перемещения людей, материальных ресурсов, информации, финансов. Граница для системы «Томская область» воплощается в нескольких смыслах: В пространственно-территориальном смысле – это граница области на географической карте. В административно-организационном смысле – это таможенные и представительные органы Томской области. В социально-психологическом смысле – это сознания и организмы томичей. В финансовом смысле – это юридическая принадлежность к финансовым агентам томской области.
Взаимодействия системы и внешней среды, в зависимости от направления,
подразделяются на 15 типов (каждый тип соответствует стрелке на Рис.
2.): Первичная типология вышеприведенных 15-ти процессов может выглядеть следующим образом: 1) Темпоральное разделение макропроцессов: 2) Пространственное разделение
макропроцессов в контексте «тенденции современности»: 3) Тематическое разделение сообщений о событиях: 4) Отношение с реальностью как критерий разделения сообщений о событиях: Первичными вышеперечисленные типы будут потому, что их можно разделять на подтипы и подвиды сколь угодно глубоким и подробным образом. Например, тематическое разделение сообщений о событиях можно вначале отобразить в виде нескольких основных сфер жизни: политической, социальной, культурной, экономической. То, какой факт или случай, к какой сфере отнести, зависит исключительно от формальных аналитических установок исследователя, обусловленных его предметом и задачами исследования. Затем каждую из этих сфер можно разделить ещё на субсферы. Например, можно условиться, что в контексте сообщений региональных СМИ социальная тематика включает в себя следующие субсферы: «ЖКХ», «Детство, материнство, семья», «Пенсионеры», «Транспорт», «Здоровье и медицина» (Рис. 3.).
Далее тематику тематики можно было бы при необходимости разделить на подтемы (гипонимические ряды). Например тематуку «ЖКХ» можно разделить на подтемы, связанные с водоснабжением, электроснабжением, квартплатой, ремонтом, уборкой мусора или снега, озеленением города и так далее. В принципе для любого текста количество возможных тематик и их интерпретаций многократно превышает количество слов в тексте, так как одно и то же слово или выражение может относиться ко многим тематикам и по-разному интерпретироваться. На основе статистических таблиц можно выявлять исторические казусы методом сравнительно-исторической индивидуализации. Это метод, направленный на выявление неповторимого и уникального на основе внешних признаков событий и объектов. Например: С какими странами или регионами меньше всего связей за определённый период? Какого типа связей меньше всего (по направлениям взаимодействий, по сферам жизни)? Какие сферы и тематики меньше всего сопряжены? По каким тематикам меньше всего сообщений с конфликтно-негативной эмоциональной тональностью (или, напротив, с позитивной тональностью)? Метод универсализирующего сравнения, напротив, позволит искать проявления макроисторических тенденции, если в матрице базы данных архива СМИ мы будем искать не минимальные, а максимальные частоты встречаемости (Рис. 4.).
Под микроисторическим уровнем в данном случае подразумеваются конкретные случаи и события, произошедшие в Томске или Томской области с конкретными людьми или их группами и описанные в сообщении томских СМИ. Пристальность анализа к отдельным контекстным и семантическим деталям текста сообщения СМИ является при этом главным аргументом в пользу того, что мы имеем дело с микроисторическим анализом. Этот анализ, в том числе, может распространяться и на упоминания макропроцессов в России и мире, в контекст которых вписаны случаи и казусы томской жизни.
Для контекстов сообщений о данных разноуровневых соотношений можно
использовать следующую типологию: Целостной контекстной единицей анализа для СМИ выступает весь текст конкретного сообщения, так как эти тексты, как правило, небольшие по объёму. Тем не менее, предлагаемая модель применима к любым текстам любого объёма, поскольку исследователь сам может определять, что для него будет контекстной единицей. Например, в качестве такой единицы можно взять один абзац крупного текста (например, исторического трактата, или мемуаров, или дневников). В этом случае в базе данных, составленной для крупного текста, в строках таблицы будут содержаться уже не отдельные целостные поименованные тексты разных авторов (как в случае с архивом СМИ), а отдельные пронумерованные абзацы или разделы одного и того же текста. В целом при вложении всех вышеперечисленных типологий друг в друга исследователь может разработать практически бесконечную по своему потенциалу матрицу критериев для анализа социальной действительности. Если эти критерии выражать в виде тематических словарей-тезаурусов лексических единиц и контекстных взаимозависимостей этих единиц, то у представителей разных социальных наук появится модель для разработки эффективных компьютерных авторубрикаторов текстов и экстракторов фактов и тенденций. |