Контент-анализ текстовой информации

Этот вид анализа документов в наибольшей степени соответствует количественному подходу в социологическом ис­следовании с его ориентацией на достоверное объективное зна­ние: собственно говоря, из потребности преодолеть субъективизм неформализованного анализа он и вышел. Не случайно один из первых его исследователей, американский социолог Б.Берель-сон' определил контент-анализ как «объективное, систематиче­ское количественное описание явного содержания коммуникации»1.

1 Berelson B. Content Analysis in Communication Research. Glencoe: Free Press, 1952. P. 15.

2 Сегодня в рамках контент-анализа изучается не только яв­ное, манифестное содержание текста, но и скрытое, латент­ное. Такой подвид контент-анализа менее надежен, хотя здесь также используются технические процедуры, свой­ственные в целом этому виду анализа документов. Подроб­но см.: Возможности использования качественной методо­логии в тендерных исследованиях. М.: МЦГИ, 1997.

Контент-анализ родился в* сфере американской журналисти­ки в конце XIX века. В этот период резко возрастает количество печатных изданий, объемы содержащейся в них информации, да и читательская аудитория стремительно увеличиваются. Начина­ется борьба за читателя, что в конечном счете означает экономи­ческое выживание газет, журналов. В поисках «рецептов» про­цветания хозяева вынуждены были обращаться к аналитикам, которым надо было, с одной стороны, «справиться» с большими объемами информации, а с другой стороны — описать ситуацию максимально достоверно. Так рождается потребность в количе­ственном анализе текстовой информации, который был бы мак­симально унифицирован и объективен. Пройдет еще несколько десятилетий, прежде чем здесь же, в сфере анализа печати, аме­риканским исследователем Д.Уилли будут осмыслены и сформу­лированы основные базовые положения контент-анализа1:

1 — система категорий — группировка материала по тем или иным признакам) должна быть применима ко всем газетам об­щего характера, а не ориентироваться на специальные издания;

2 — система категорий должна строиться таким образом, чтобы обладать универсальной сравнимостью. Это означает высокую стандартизацию категорий;

3 — система категорий должна давать максимум точности и сводить элемент субъективности к минимуму.

Сегодня контент-анализом называется строго формализо­ванный вид анализа документальной информации, суть которого состоит в переводе ее в количественные показатели с последу­ющей статистической обработкой.

Чаще всего контент-анализ используется в традиционном ключе — для анализа текстовой2 информации. В то же время область его применения становится гораздо шире, и «захваты­вает» и другие документальные источники: фотоматериалы, радиопрограммы, инструменты повседневной деятельности, одежду и т.д.

1 См.: Коробейников B.C. Методы формализованного анализа документальных источников // Методы сбора информации в социологических исследованиях. М.: Наука, 1990. С. 69.

2 Термин текст здесь используется в узком значении как со­вокупность буквенных символов.

Процедура контент-анализа включает:

— выделение смысловых единиц анализа (категорий анализа);

— определение единиц счета, соответствующих выделенным смысловым единицам;

— определение способа количественной фиксации единиц счета. Следует сказать, что процедура контент-анализа в полном

соответствии с методологическими основаниями количествен­ного подхода воспроизводит дедуктивную нисходящую логику получения знания.

Смысловые единицы (категории анализа) здесь — это направ­ления анализ ickcra, некие теоретические конструкты, задава­емые исследовательскими задачами, гипотезами, теоретиче­ским видением предмета в целом.

Единицы счета — это элементы текста, выступающие «представителями», индикаторами той или иной смысловой единицы. Единицы счета весьма разнообразны. Это могут быть как отдельные слова: термины, имена исторических или поли­тических деятелей, названия городов и т.д., так и более сложные элементы текста: словосочетания, отдельные суждения, целые абзацы, темы.

Существует целый ряд способов количественной фиксации единиц счета, которые зависят от того, какие именно фрагмен­ты текста исследователь выбрал в качестве единиц счета. Это может быть и их количество в тексте (частота употребления), ес­ли единица счета — понятие, имя собственное или определен­ные словосочетания. Это может быть и физическая протяжен­ность: объем площади или количество строк, столбцов, колонок, если единица счета, например, —- тема материала.

Как выбираются единицы счета, эти эмпирические «заме­нители» теоретических конструктов в тексте? Для этой цели со­циолог разрабатывает классификатор — документ, в котором смысловым единицам анализа приводятся в соответствие их эмпирические «аналоги» (табл. 1).

Главная задача такого классификатора — обеспечить макси­мальную полноту представленности смысловых единиц анализа через элементы конкретного текста. Для этого социолог из всего массива анализируемых текстов случайным (вероятностным) спо­собом (можно использовать механический отбор) отбирает те из них, которые надлежит рассмотреть «сквозь» выделенные смысловые единицы анализа.При этом он «набирает» элементы — индикаторы из первого текста, затем дополняет их элементами из второго текста, и так до тех пор, пока не будет попадаться ни одна новая единица счета: новые словосочетания или отдельные слова.

Таблица 1