Основные виды комбинированных шкал измерения.
Первыми в социологической практике стали применяться так называемые оценочные шкалы . Простейшей оценочной шкалой является обычная школьная система баллов — для каждого ученика учитель определяет оценку как один из пяти возможных баллов, и ученики ранжируются по этим баллам. Вне школьных стен эта методика впервые стала применяться в середине XIX в. на английском флоте для оценки условий погоды. В начале XX в. известный статистик К. Пирсон применил эту шкалу для изучения способностей, после чего оценочные шкалы получили широкое распространение в практике оценки ситуаций.
Оценочная шкала включает в себя три компонента: того, кто оценивает, то, что оценивается, и то, по отношению к чему оценивается. Были развиты два вида оценочных шкал — графические и дескриптивные. При графическом способе каждый эксперт должен оценить явление на графике. График представляет линию, разделенную на 5, 7, 9 или 11 интервалов. Нечетное число интервалов выбрано для того, чтобы можно было найти нейтральную позицию. Желательно, конечно, иметь как можно больше градаций для большей точности и детализации оценки, но оказывается, что психологические возможности человека не позволяют ему производить классификацию больше чем по 11—13 позициям.
Это как бы разрешающая способность его психологических возможностей. Левая сторона графика — положительная оценка, правая — отрицательная. Эксперт ставит штрих на том интервале, который соответствует его оценке данного явления или объекта. Затем все оценки экспертом складываются и делятся на их число. Полученное среднее дает оценку данного явления, объекта. При дескриптивном способе в зависимости от содержания проблемы даются словесные характеристики одиннадцати подразделений между крайними отношениями. Оценочным шкалам присущи два вида ошибок — так называемый гало-эффект и ошибка щедрости. Если индивид оценивается по нескольким чертам, то, с одной стороны, под влиянием его наиболее сильной черты эксперт оценивает более высоко и другие его черты, и, с другой — черты индивида получают более высокую оценку, если он обладает какой-либо чертой, которая особенно нравится эксперту. Впервые оценочная шкала была применена для собственно-социологического исследования в 1925 г. Богардусом .
Наибольшее развитие оценочные шкалы получили при использовании метода парных сравнений, который основывается на законе сравнительного суждения Терстона.
Терстон предложил метод, который получил широкое распространение в социологической практике и в настоящее время не потерял своего значения. По исследуемой установке отбираются суждения — из литературы, предыдущих исследований, а также придумываются новые. Эти отобранные суждения оцениваются экспертами, которые каждому суждению присваивают балл. Затем с этими суждениями знакомят лиц, чьи установки предполагается изучить. По тому, какие суждения выбрал каждый индивид, ему присваивается балл, соответствующий баллу выбранных суждений.
Все трудности — в технике процедур каждого шага. Терстон предложил следующую методику. Прежде всего отбираются вопросы (суждения). Они должны быть по возможности краткими; их следует сформулировать так, чтобы они могли быть приняты или отвергнуты в соответствии с их предпочтением в отношении исследуемой установки. Желательно избегать двусмысленных суждений. Всего отбирается для экспертной оценки примерно 200—300 суждений, относящихся к данной установке. Затем отбираются эксперты 100—150 человек.
Желательно, чтобы и экспертов, и оцениваемых суждений было как можно больше, чтобы больше была бы гарантия от систематических ошибок. Практически трудно придумать больше 300 неповторяющихся суждений по какому-то вполне конкретному явлению, и потому ограничиваются именно этим числом . Эксперты же в идеале должны представлять собой некоторую модель исследуемых лиц, т.е. и числом, и своими установками они должны представлять некоторое подобие исследуемой совокупности. Практически уже 100 экспертов дают довольно устойчивую картину оценки, но все же вопрос об их числе не столь прост. Проблема статистической оценки этого числа еще не решена в социологическом шкалировании.
Каждый эксперт дает оценку по одиннадцати градациям (группам). Градация, или группа, 1 означает сильное предпочтение, градация 2 — не очень сильное предпочтение, 3 — умеренное предпочтение, 4 — слабое предпочтение, 5 — очень слабое предпочтение, 6 — нейтральное отношение, 7 — очень слабое противодействие, 8 — слабое, 9 — умеренное, 10 — сильное, 11 — очень сильное противодействие. Считается, что интервалы предпочтения между градациями примерно равны. В силу этого метод называется методом кажущихся равными интервалов.
Технически процедура оценки следующая. Отобранные суждения записываются на карточки с указанием номера суждения. Каждому эксперту дается полный набор этих карточек в случайном порядке. Эксперт записывает номер градации, в которую он помещает данное суждение. Теперь для каждого суждения по экспертным оценкам можно построить кривую накопленных частот — кумуляту. Все отобранные суждения будут характеризоваться своими собственными кумулятами (у самого Терстона используются огивы).
Возьмем произвольное суждение. Каждое суждение имеет определенное эмпирическое частотное статистическое распределение. Как всякое распределение, оно характеризуется мерой центральной тенденции (мерой положения) и мерой рассеивания. В качестве меры положения принимается медиана, поскольку, строго говоря, нельзя использовать номера градаций как числа, следовательно, их складывать нельзя и потому нельзя найти среднюю арифметическую. По этой же причине в качестве меры рассеивания берут не дисперсию, а квартильное отклонение.
Таблица частот
Градации 1 2 3 4 5 6 7 8 9 10 11
Частота 0,16 0,41 0,28 0,10 0,04 0,0 0 0 0 0 0
Таблица накопленных частот
Градации 1 2 3 4 5 6 7 8 9 10
Частота 16 57 85 95 99 99 99 99 99 99
Кумулята строится обычным способом. По оси x откладываются значения признака (в данном случае 11 точек по числу градаций), по оси y — накопленные частоты. Поскольку определяются медиана и квартильное отклонение, постольку строится именно кумулята, а не полигон распределения. Дело в том, что на кумуляте очень просто определяются указанные величины. Медиана — такое значение признака М, что половина генеральной совокупности имеет значения меньше М, а половина — больше М. На графике кумуляты берем ординату, равную 0,5, и находим соответствующую ей абсциссу. Через точку 0,5 на оси ординат проводим прямую параллельно оси абсцисс до пересечения с графиком. Из точки пересечения опускаем перпендикуляр на ось абсцисс. Основание этого перпендикуляра и будет искомая медиана. Если основание попадает между точками, то проводим обычную интерполяцию. В этом случае, конечно, обнаруживается некоторая некорректность, поскольку имеются порядковые величины, а при интерполировании приходится обращаться с ними, как с обычными числами. Полученное значение медианы и является баллом данного суждения по экспертной оценке.
Квартильное отклонение задается формулой
Q = ,
где Q3 — верхний квартиль, Q1 — нижний квартиль. Квартили — обобщения понятия медианы. Если медиана — это такое значение признака, когда половина популяции имеет значения большие, половина — меньшие, то нижний квартиль — это такое значение признака, когда 1/4 популяции имеет значения, мень-
шие этого квартиля. Верхний квартиль — такое значение признака, когда 1/4 популяции имеет значения признака, большие его. По графику кумуляты квартили определяются аналогично вычислению медианы. По формуле находится квартильное отклонение.
В результате всего этого процесса каждое суждение будет характеризоваться двумя числовыми мерами. По этим мерам следует из всех 200—300 суждений отобрать наиболее подходящие для анализа.
Можно рассуждать следующим образом. С одной стороны, нужно отбросить суждения, имеющие большие квартильные отклонения, и оставить те квартильные отклонения, которые сравнительно малы. Последние будут соответствовать более единодушному мнению экспертов в отношении этого суждения. С другой стороны, оставляют и те суждения, медианы которых образуют наиболее компактную и однородную совокупность. В результате такого «двойного прочесывания» обычно остается 20—25 суждений. Ими и измеряется установка.
Полный набор отобранных суждений предлагается каждому исследуемому лицу: оно должно выбрать те, которые, по его мнению, наиболее полно и точно характеризуют исследуемую установку. Причем число выбираемых каждым лицом суждений не ограничивается. После того как отобрано определенное число наиболее важных суждений, выводится их средний балл (средняя арифметическая), который и является баллом данного лица по данной установке. Затем лица ранжируются по этим баллам.
Шкала Терстона весьма трудоемка. Главная ее трудность в том, что приходится использовать экспертов, которые могут внести и вносят существенное искажение в окончательный результат измерения установки исследуемых лиц.
В 1932 г. Лайкерт предложил метод измерения установки без использования экспертной оценки, который получил название шкалы Лайкерта. Ее идея довольно проста. Даны вопросы (суждения), которых следует оценить по пятибалльной системе:
5 — «полностью согласен»,
4 — «согласен»,
3 — «нейтрален»,
2 — «не согласен»,
1 — «полностью не согласен».
Сумма баллов по всем вопросам и будет баллом данного лица. Затем лица ранжируются по баллам. Главная заслуга Лайкерта состоит в том, что он предложил внутренний критерий вопросов, который позволяет отбрасывать вопросы, не впи-
сывающиеся п программу исследования. Определяется корреляция между баллами вопроса и общим баллом.
Это можно проиллюстрировать следующим примером. Десять лиц (А, В, С и т.д.) должны оценить предложенные им десять вопросов по пятибалльной системе. Каждый получает такой бланк:
Ответ
№ вопроса Полностью
согласен Согласен
Нейтрален
Не согласен Полностью
не согласен
1-й +
2-й +
3-й +
4-й +
5-й +
6-й +
7-й +
8-й +
9-й +
10-й +
Индивид делает отметку по каждому вопросу в соответствии со своим отношением к нему. Далее составляется следующая таблица по каждому вопросу (в примере даны вычисления для 5-го вопроса).
Лицо Общий
балл
(S0) Балл 5-го
вопроса
(S5) Разность
(S0 — S5) Лицо Общий
балл
(S0) Балл 5-го
вопроса
(S5) Разность
(S0 — S5)
A 45 5 40 F 39 4 35
B 42 5 37 G 33 3 30
C 35 4 31 H 40 4 36
D 35 4 31 I 22 1 21
E 20 1 19 J 27 2 25
Затем определяется коэффициент парной корреляции между баллами лиц по пятому вопросу (S5 в третьем столбце) и значениями разности между общим баллом S0 и баллом по пятому вопросу S5 (S0 — S5 — в четвертом столбце).
108
Для вычисления этого коэффициента корреляции строим корреляционную таблицу.
S0 — S5
S5 10-19 20-29 30-39 40-50
1 1 1 − −
2 − 1 − −
3 − − 1 −
4 − − 4 −
5 − − 1 1
Простым вычислением находится коэффициент корреляции между S5 и S0 — S5. Эта процедура осуществляется для каждого вопроса. Вопросы с малыми корреляциями выбрасываются.
Можно действовать и по терстоновской методике, используя квартальные отклонения. Нерешенным остается вопрос о значимости квартальных отклонений и коэффициентов корреляции вопросов.
Вплоть до настоящего времени идет дискуссия о преимуществах подходов Терстона и Лайкерта. В 30-х годах Г. Морфи защищал шкалу Лайкерта, отдавая ей предпочтение по сравнению со шкалой Терстона , в 40-х Л. Фергюсон выступил в защиту шкалы Терстона , в 50-х А. Эдварде попробовал найти баланс между этими шкалами .
Основной недостаток этих шкал заключается в том, что лица могут получить одинаковый балл, отвечая по-разному на разные вопросы. Кроме того, вопросам приписывается (например, по Лайкерту) балл по пятибалльной системе. Это вполне законная операция, как нумерация футболистов, т.е. измерение по номинальной шкале. Но затем эти баллы складываются, что делать, строго говоря, нельзя на этом уровне измерения; метод
Терстона зависит от оценок экспертов, которые могут вносить систематическую ошибку в измерение.
Одним из путей преодоления трудностей шкалирования по Терстону и Лайкерту является метод Гутмана — так называемый шкальный (или шкалограммный) анализ.
Метод Гутмана не требует экспертов и приписывания баллов, но, к сожалению, здесь имеются свои трудности, в силу которых проблема измерения установок так и осталась переменной. Существо этого метода заключается в следующем: N лицам задаем n так называемых дихотомических вопросов (т.е. вопросов, которые допускают только два альтернативных ответа, которые мы обозначим «+» и «—»). Следовательно, первоначально получим таблицу плюсов и минусов. Каждый столбец представляет некоторый вопрос, каждая строка — некоторое лицо. Метод сводится к построению шкалограммы. Это такая картина, когда лица и вопросы ранжированы, т.е. расположены так, что первое лицо отвечает положительно на все вопросы (первая строка состоит из одних плюсов), второе лицо отвечает положительно на все вопросы, кроме последнего, третье — на все, кроме последних двух и т.д. В таблице в этом случае можно провести наклонную прямую, отсекающую слева минусы от плюсов. Но практически так не получается. Переставляя строки и столбцы исходной эмпирической таблицы, можно составить только приближенную шкалограмму, где наклонная прямая не рассекает точно таблицу на часть с единицами и часть с нулями. Приводим шкалограмму в идеальном случае.
Лица Вопросы
1 2 3 4 5
1 + + + + +
2 − + + + +
3 − − + + +
4 − − − + +
5 − − − − +
Рассмотрим простой пример: 15 лицам задано 8 дихотомических вопросов. В I матрице представлена эмпирическая картина ответов. Проранжируем лица по их баллам. Для этого просто переставим строки таблицы в порядке убывания чисел
110
Таблица данных (I) Ранжирование лиц (II) Ранжирование лиц и вопросов (III)
Вопросы Балл Вопросы Балл Вопросы балл
Лица 1 2 3 4 5 6 7 8 Лица 1 2 3 4 5 6 7 8 Лица 7 5 1 7 2 4 5 3
1 + + + + + - + - 6 7 + + - + + + + + 7 7 + + + + + + + - 7
2 + - - - + - + + 4 9 + + - + + + + + 7 9 + + + + + + + - 7
3 + + - - + - + + 5 10 + + - + + - + + 6 10 + + + + + + - - 6
4 - - - - + - + - 2 1 + + + + + - + - 6 1 + + + - + + - + 6
5 + - - - + - + - 3 13 + + - + + - + + 6 13 + + + + + + - - 6
6 + - - - + - + + 4 3 + + - - + - + + 5 3 + + + + + - - - 5
7 + + - + + + + + 7 2 + - - - + - + + 4 2 + + + + - - - - 4
8 + - - + + - + - 4 6 + - - - + - + + 4 6 + + + + - - - - 4
9 + + - + + + + + 7 8 + - - + + - + - 4 8 + + + - - + - - 4
10 + + - + + - + + 6 14 + - - - + - + + 4 14 + + + + - - - - 4
11 - - - - - - - + 1 5 + - - - + - + - 3 5 + + + - - - - - 3
12 - - - - - - + - 1 15 + - - - + - + - 3 15 + + + - - - - - 3
13 + + - + + - + + 6 4 - - - - + - + - 2 4 + + - - - - - - 2
14 + - - - + - + + 4 11 - - - - - - - + 1 11 - - - + - - - - 1
15 + - - - + - + - 3 12 - - - - - - + - 1 12 + - - - - - - - 1
12 6 1 6 13 2 14 9 12 6 1 6 13 2 14 9 14 13 12 9 6 6 2 1
в последнем столбце (II матрица). В качестве последнего шага проранжируем вопросы по числу положительных ответов. Для этого переставим столбцы в порядке убывания чисел последней строки (III матрица). В результате получается некоторая шкалограммная картина (шкалограмма), в общем случае не идеальная, так как нельзя одной прямой отсечь все плюсы от минусов, а приходится проводить ломаную.
Вводится коэффициент воспроизводимости, определяющий возможное число отклонений (ошибок) от идеальной шкалы:
r = 1 − ,
где ne — общее числе ошибок; N — число лиц, п — число вопросов.
Гутман полагает, что r 90%.
В случае большого числа лиц определяются так называемые шкальные типы лиц. N испытуемых на четыре вопроса дали такие варианты ответов, причем всего 2n дали 16 различных вариантов ответов:
1 2 3 4 5
V + + + +
+ + − +
+ + + −
0
1
1
IV − + + +
− + − +
− + + − 0
1
1
III − − + +
− − + −
+ − + +
+ − + − 0
1
1
+
II − − − +
+ − − + 0
1
I − − − −
− + − −
+ − − −
+ + − − 0
1
1
2
В таблице пять столбцов;
1 — номера (римские буквы) классов;
2 — варианты ответов;
3 — число ошибок в каждом варианте ответов;
4 — число лиц данного варианта ответа;
5 — число ошибок (произведения числа лиц на число ошибок в варианте).
Существуют пять шкальных типов, соответствующих идеальной шкалограмме:
V + + + +
IV − + + +
III − − + +
II − − − +
I − − − −
Следовательно, оставшиеся 11 вариантов ответов являются нешкальными типами. Нужно попытаться их как-то разбросать по шкальным типам так, чтобы коэффициент воспроизводимости был наименьший. Естественно, например, что вариант ответа:
− + − +
следует отнести к типу IV, а не к V, поскольку в первом случае будет одна ошибка (отклонение от идеального IV типа), а во втором — две ошибки (отклонения от идеального V типа).
Затем определяется коэффициент воспроизводимости, и если он значим, то возможна классификация лиц по шкальным типам на основе их вариантов ответов.