Сорока М.Б. Використання методу контент-аналізу при створенні автоматизованих інформаційних систем / М.Б. Сорока, Н.В. Танатар // Бібліотека. Наука. Культура. Інформація: Наукові праці НБУВ. Вип. 1. — 1998. — С. 318-322.
Сорока Марина Борисівна,
Танатар Ніла Володимирівна
Національна бібліотека України імені В.І. Вернадського, КиївВикористання методу контент-аналізу при створенні
автоматизованих інформаційних системНайважливіший стратегічний ресурс сучасного світового розвитку — інформація. Як свідчить багатий досвід, виграє той, хто має найширший, найповніший, необмежений доступ до джерел інформації. Управління без інформації — безглуздя, бо всім і завжди потрібна найповніша, своєчасна та цілеспрямована інформація для прийняття термінових рішень по конкретній, а не по будь-якій проблемі. Коли ж ці та інші вимоги не виконуються, рішення приймаються не найефективніші, з більшим ступенем ризику, що часто призводить до великих збитків.
Сучасний рівень складності завдань, що вирішуються з допомогою інформаційних систем, постійно росте. Саме тому цілком логічно чекати подальшої оптимізації вже існуючих інформаційних систем соціально-політичного характеру, спрямованих на функціональне забезпечення вирішення різнобічних питань: від автоматизованого збору і інтерпретації інформації до управління, проектування, моделювання і прогнозування різноманітних суспільних процесів.
На сьогодні вже накопичений досвід побудови багаторівневих інформаційних систем для вирішення тих чи інших вузькоспецифічних чи, навпаки, багатоцільових завдань. Частина з них добре досліджена на теоретичному рівні, інша частина з тією чи іншою долею досягнутого ефекту реалізована на практиці.
Конкретна практика (особливо останніх років) підтверджує необхідність пошуків нетрадиційних парадигм використання інформаційних технологій в процесах підготовки й прийняття рішень в органах держуправління.
Вивчення інформаційних потреб органів законодавчої та виконавчої влади свідчить, що в процесі прийняття рішень поряд із використанням фактографічних матеріалів, важливим стає залучення інформації про відображення взаємовідношень поміж різними фактами, подіями, особами тощо в засобах масової інформації.
Саме преса дає найбільш повний масив інформації про події в країні. По оперативності подачі матеріалів та масштабності впливу на населення газетним виданням немає рівних серед документальних засобів комунікації. Але осягнути оком весь різнобарвний та швидкоплинний потік сучасних подій, які відображаються в пресі, не під силу творчим колективам аналітичних служб державних органів, що займаються аналізом та прогнозуванням суспільно-політичного життя. При цьому, обмежитися тільки анотаціями або рефератами статей з преси працівники цих служб вважають за недоцільне, бо при складанні повноцінного аналітичного огляду або прогнозу розвитку суспільно-політичної ситуації на їх думку краще мати справу з повнотекстовою інформацією. При аналізі змісту комунікації важливо знати не тільки кількісні показники згадування на сторінках преси тієї чи іншої події, особи, важливо й те, в якому контексті йде про це мова, як інформація пресою інтерпретується. В зв'язку з вище зазначеним, постало питання удосконалення засобів обробки та відображення такої інформації, підвищення її наочності і доступності. Для задоволення цих вимог при створенні інформаційно-аналітичних систем була запропонована технологія, яка передбачає екстракцію інформації з публікацій у вигляді ключових цитат з подальшим її занесенням до баз даних. Найбільш сприйнятним для проведення даної процедури виявилось застосування елементів методу контент-аналізу, оскільки об'єктом дослідження даного методу виступає саме текст.
В західних країнах контент-аналіз розвивається вже на протязі майже ста років і вважається провідним методом вивчення засобів масової комунікації. На жаль, в Україні контент-аналітичні дослідження обмежуються вузьким колом фахівців. Саме тому вважаєм за доцільне більш детально зупинитись на його описі і характеристиці.
Контент-аналіз являється одним із методів якісно-кількісного вивчення змісту текстів. Суть методу полягає у зведенні всіх текстів досліджуваної проблеми до набору певних елементів, які в подальшому підлягають підрахунку та аналізу. Тексти в таких дослідженнях виступають в якості об'єкта аналізу тому, що на підставі змін, які відображені в них, можна робити висновки про тенденції розвитку суспільства, або функціонування відповідних соціальних інститутів.
Російський вчений О.М.Алексєєв виділив такі складові контент-аналітичного дослідження:
- КА має справу з масовою сукупністю текстів, використовуючи при цьому типові соціологічні процедури суцільного чи вибіркового обстеження, з дотриманням вимог репрезентативності.
- КА припускає структурування, сегментацію, розчленування текстів чи вичленення із них змістовних інваріантів, що повторюються в усіх чи у ряді текстів, які належать до досліджуваної масової сукупності.
- Для забезпечення такої однотипності сегментації і вичленення інваріантів КА припускає високу ступінь формалізації, застосування суворих операціональних правил і формальних алгоритмів у здійсненні процедур КА.
- КА — аналітико-синтетична процедура, оскільки передбачається формалізований "розділ" цілісних текстів чи вичленення окремих елементів їх для наступного "збирання" цих інваріантних елементів у великі "однорідні маси", обсяг і тип яких характеризуються як певна цілісність уже усієї сукупності текстів.
- КА передбачає використання якісних, статистичних методів, причому вказані інваріантні елементи з їх ознаками виступають одиницями спостереження і підрахунку.
- Взагалі, у КА має місце перекодування соціальної інформації" (1).
На думку українського дослідника В.Іванова, контент-аналіз являє собою "якісно-кількісний метод вивчення документів, який характеризується об`єктивністю висновків і строгістю процедури й полягає у квантифікаційній обробці тексту з подальшою інтерпретацією результатів. Предметом контент-аналізу можуть бути як проблеми соціальної дійсності, які висловлюються чи, навпаки, приховуються у документах, так і внутрішні закономірності самого об`єкта дослідження" (2, С. 35).
За час свого існування контент-аналіз виборов гідне місце в низці сучасних методів дослідження засобів масової інформації. Він закріпився як науковий метод дослідження документів, який характеризується принципами об'єктивності, детального й повного розгляду об'єкта дослідження, суворого дотримання процедури. Його надзвичайно великі можливості пояснюються органічною пов'язаністю якісної і кількісної сторони дослідження. Високі вимоги до контент-аналізу роблять висновки таких досліджень надійнішими і достовірнішими, ніж при користуванні якісними методами.
Контент-аналіз знайшов використання у багатьох галузях науки. Цей метод виявляє багатство міждисциплінарних зв`язків. В ряді галузей можно знайти аналоги КА, які відрізняються від нього перш за все цілями. Так наприклад, в історії низка методів джерелознавства такі як, заходи формалізованого спостереження і статистичні процедури, структурне розчленування текстів та інші дуже схожі з методом КА. В документознавстві для оптимальної організації діловодства застосовуються такі засоби, як вичленення одиниць спостереження, надання формальних ознак при описі документів та інші, що близькі багатьом процедурам КА. Наукознавство, що досить інтенсивно розвивається в останні десятиліття, з успіхом використовує аналоги КА в цілях дослідження внутрішніх, а також соціальних тенденцій розвитку науки. Але особливе багатство і різноманітність аналогів КА спостерігається в інформатиці, яка вивчає закономірності збору, обробки, зберігання і розповсюдження документальної наукової інформації, хоча завдання цієї науки — оптимізація інформаційного пошуку — принципово відрізняються від завдань контент-аналізу.
Деякі принципи контент-аналізу запозичені при створенні інформаційно-аналітичних систем в Лабораторії прогнозно-аналітичної бібліометрії НБУ ім. В.І.Вернадського. Серед них:
- опрацювання великих масивів документальної інформації;
- вичленення із них змістовних фрагментів;
- сортування цих фрагментів і збирання їх у однотипні за змістом підгрупи.
Одні з них використовуються на етапі відбору інформації у вигляді ключових цитат, інші — на етапах автоматизованої обробки баз даних.
Застосування елементів методу контент-аналізу при створенні інформаційно-аналітичних систем викликано перш за все необхідністю отримання об`єктивних результатів відбору матеріалів, незалежних від вражень чи почуттів людини. Об`єктивність при цьому досягається тим, що особисті враження дослідника заміняє об`єктивна процедура формалізації і квантифікації тексту. Зміст розчленовується на окремі фрагменти, присвячені різним аспектам висвітлення певної проблеми, які в системі сортуються і при необхідності підраховуються. При виконанні цієї процедури велике значення має наявність детально розробленого класифікатора. Класифікатор — це схема, за якою бібліограф збирає матеріал до бази даних. Тематичні рубрики та підрубрики класифікатора обираються так, щоб з одного боку вони показували напрямок відбору матеріалів, а з іншого, щоб у результаті аналітичного опрацювання висновки являли собою повний зріз змісту на дану тему. Оскільки від правильного підбору рубрик багато в чому залежить таматична спрямованість масиву інформації, при їх обранні слід остерігатись помилок. Зупинимося на найхарактерніших із них. Якщо обмежитись занадто вузькими тематичними рамками, то можна втратити частину змісту, яка в них не увійде. Якщо ж використовувати дуже узагальнені рубрики, то багато в чому втрачається оригінальність досліджуваних документів, ускладнюється робота з великими масивами відібраної інформації.
У загальному вигляді основні етапи формування інформаційно-аналітичних систем на базі контент-аналізу матеріалів преси такі. Спочатку визначається тематика дослідження, мета та об`єкт аналізу, його хронологічні та географічні рамки, принципи відбору. Потім розробляється класифікатор, згідно з яким виконується відбір ключових цитат, складається інструкція для кодувальника. Після кодування фрагменти публікацій заносяться до баз даних і обробляються в автоматизованому режимі.
Виконання перерахованих процедур призводить до формування тематично підібраних масивів інформації, в яких акумулюється інформація про висвітлення в пресі всіх аспектів досліджуваної проблеми, враховуючи розголос думок і поглядів. Слід також відмітити, що побудова інформаційно-аналітичних систем в значній мірі залежить від наявності та дотримання правил проведення вище зазначених процедур, тому вкажемо основні з них:
- Процедура контент-аналітичного відбору повинна складатися із точно визначених дій, котрим без будь-яких змін повинні підлягати усі об`єкти опрацювання.
- Розділи класифікатора, за якими кодуються фрагменти публікацій, мають бути ясними і недвозначними з тим, щоб не допускати двозначності тлумачення і звести до мінімуму вплив суб`єктивних думок кодувальників на процес обробки.
- Інтерпретація результатів дослідження повинна охоплювати всі здобуті дані, висновки мають спиратися не на якусь частину результатів, а враховувати їх всі без винятку.
Для автоматизованого опрацювання матеріалів має велике значення не тільки те, яка частота появи тієї чи іншої категорії, а взагалі присутня вона в досліджуваному тексті, чи ні. Кількісний підрахунок дозволяє зробити об`єктивні висновки щодо спрямованості матеріалів за кількістю уживань одиниць аналізу (ключових цитат) в досліджуваних текстах, якісний аналіз робить те саме, але внаслідок вивчення того, чи зустрічається і в якому контексті якась важлива, оригінальна категорія взагалі.
Підводячи підсумки, слід зазначити, що використання контент-аналізу для створення інформаційно-аналітичних систем дозволяє вловити поширеність тієї чи іншої ознаки досліджуваної сукупності текстів. При цьому важливо не стільки абсолютне, скільки відносне значення ознаки, тобто характеристика її місця (частки) серед інших ознак. Вимір співвідношення між ознаками в текстах дає емпіричний матеріал для розуміння функціональних зв`язків між елементами відображеної в текстах дійсності. При наявності текстів, що мають хронологічну послідовність, можно мати низку фіксованих у часі "портретів" досліджуваної дійсності, що дає змогу висувати гіпотези прогностичного хірактеру про фунціонування елементів системи.
Л І Т Е Р А Т У Р А
- Алексеев А.Н. Контент-анализ в социологии и точки соприкосновения с другими отраслями знания // Проблемы контент-анализа в социологии: М-лы Сибирского социологического семинара / Отв. ред. А.Н.Алексеев.- Новосибирск, 1970. — С.11-12.
- Іванов В.Ф. Контент-аналіз: Методологія і методика дослідження ЗМК: Навч. посібник / Наук. ред. А.З. Москаленко. — К.,1994. — 112 с.
© Сорока Марина Борисівна, 1998
© Танатар Ніла Володимирівна, 1998
Національна бібліотека України імені В.І. Вернадського
www.nbuv.gov.ua