Реферат: Нормы и интерпретация результатов теста
--PAGE_BREAK--Непараметрические методы. Ранжирование, медиана, квартиль.Далеко не все материалы, получаемые в психологических исследованиях, подлежат обработке параметрическими методами. Если после ознакомления с изучаемым рядом исследователь убеждается в том, что этот ряд не имеет свойств нормального распределения, ему остается перейти на методы непараметрической статистики. С их помощью могут быть получены и центральная тенденция изучаемого ряда — медиана — и величина, позволяющая судить о диапазоне варьирования и о строении изучаемого ряда — квартильное отклонение.Вот пример. После диагностических испытаний уровня умственного развития учеников 6-го класса полученные данные были упорядочены, т.е. расположены в последовательности от меньшей величины к большей. Испытания проходили 18 учащихся (табл. 2).
Таблица 2
Учащиеся
Баллы
Ранги (R)
Учащиеся
Баллы
Ранги (R)
А
25
1
К
68
10
Б
28
2
Л
69
11,5
В
39
4
М
69
11,5
Г
39
4
Н
70
14,5
Д
39
4
О
70
14,5
Е
45
6
П
70
14,5
Ж
50
7
Р
70
14,5
3
52
8,5
С
74
17,5
И
52
8,5
Т
74
17,5
Примечание.Буквами обозначены учащиеся, числами — полученные ими баллы по тесту.
Процедура ранжирования состоит в следующем. Все числа ряда в их последовательности получают по своим. порядковым местам присваиваемые им ранги. Если какие-нибудь числа повторяются, то всем повторяющимся числам присваивается один и тот же ранг — средний из общей суммы занятых ими ранговых мест. Так, числу 28 в изучаемом ряду присвоен ранг 2. Затем следуют трижды повторяющиеся числа 39. На них приходятся занятые ими ранговые места 3, 4, 5. Поэтому этим числам присваивается один и тот же средний ранг, в данном случае — 4. Поскольку места до 5-го включительно заняты, то следующее число получает ранг 6 и т.д.
При обработке ряда, не имеющего признаков нормального распределения — непараметрического ряда, — для величины, которая выражала бы его центральную тенденцию, более всего пригодна медиана, т.е. величина, расположенная в середине ряда. Ее определяют по срединному рангу по формуле Me= (п + 1)/2, где Me
—означает медиану, п — как в ранее приводившихся формулах — число членов ряда. При нечетном числе членов ряда ранговая медиана — целое число, при нечетном число — с 0,5. Заметим, что числовое значение медианы может и не быть в составе самого обрабатываемого ряда.
Возьмем к примеру ряд в семь членов: 3—5—6—7—9—10—11.
Проранжировав его, имеем: 1—2—3—4—5—6—7.
Ранговая медиана в таком ряду равна: Me
= (7 +1)/2 = 4, этот ранг приходится на величину 7.
Возьмем ряд в восемь членов: 3—5—6—7—9—10—11—12.
Проранжировав его, имеем: 1—2—3—4—5—6—7—8.
Ранговая медиана в этом ряду равна: Me= (8 + 1)/2 = 4,5.
Этому рангу соответствует середина между двумя величинами, имеющими ранг 4 и ранг 5, т.е. между 7 и 9. Медиана этого ряда равна: Me
= (7 +9)/2 = 8.
Следует обратить внимание на то, что величины 8 в составе ряда нет, но таково значение медианы этого ряда.
Вернемся к изучаемому ряду. Он состоит из 18 членов. Его ранговая медиана равна: Me= (18 + 1)/2 = 9,5.
Она расположится между 9-й и 10-й величиной ряда. 9-я величина — 52, 10-я — 68. Медиана занимает срединное место между ними, следовательно, Me
=(52 + 68)/2 = 60.
По обе стороны от этой величины находится по 50% величин ряда.
Характеристику распределения численностей в непараметрическом ряду можно получить из отношения его квартилей. Квартилью называется величина, отграничивающая 1/4 всех величин ряда. Квартиль первая — ее обозначение Q1—вычисляется по формуле:
<img width=«128» height=«34» src=«ref-1_429432311-1426.coolpic» v:shapes="_x0000_i1032">
Это полусумма первого и последнего рангов первой — левой от медианы половины ряда;
квартиль третья, обозначаемая Q3вычисляется по формуле:
<img width=«146» height=«35» src=«ref-1_429433737-1619.coolpic» v:shapes="_x0000_i1033">
т.е. как полусумма первого и последнего рангов второй, правой от медианы, половины ряда. Берутся порядковые значения рангов по их последовательности в ряду. В обрабатываемом ряду Q1= (1+9)/2 = 5, Q3= (10 + 18)/2 = 14.
Рангу 5 в этом ряду соответствует величина 39, а рангу 14 — 70. Следовательно, в данном ряду Q1=39, а Q3= 70.
<img width=«10» height=«2» src=«ref-1_429417968-153.coolpic» v:shapes="_x0000_s1043">Для характеристики распределения в непараметрическом ряду вычисляется среднее квартильное отклонение, обозначаемое Q
. Формула для Q такова: Q = (Q3— Q1)/2. Для обрабатываемого ряда Q = (70 - 39)/2 = 15,5. Были рассмотрены статистическая обработка параметрического ряда (xи s), статистическая обработка непараметрического ряда (M
еи Q). Параметрический ряд относится к шкале интервалов, непараметрический — к шкале порядка. Но встречаются также ряды, относящиеся к шкале наименований. Наиболее краткая характеристика такого ряда может быть получена с помощью моды, величины, которая выражает наивысшее числовое значение величин данного ряда, при п — числе членов ряда. Следует заметить, что моду можно лишь условно считать выражением центральной тенденции в ряду, относящемуся к шкале наименований. Она выражает наиболее типичную величину ряда.
Рассмотрим подробнее пример, приведенный выше (С. 242). Там речь шла об участниках некой конференции; в их числе были 3 англичанина, 2 датчанина, 5 немцев, 3 русских и 1 француз. Мода в данном ряду приходится на участников конференции — немцев. Число членов ряда равно — 13, а мода — Mo = 5.
Итак, мы рассмотрели статистические методы, применяющиеся для задач первого типа.
Второй тип задач.Психологу в его повседневной практической и исследовательской работе приходится искать ответы на различные вопросы. Предположим, что проведены диагностические испытания умственного развития у школьников шестых классов городской и сельской школ: можно ли в дальнейшем рассматривать обе школьные выборки как принадлежащие одной совокупности? По поводу неодинаковых условий обучения в городской и сельской школах высказано немало противоречивых суждений. Психолог в данном случае намерен опираться на экспериментальные факты. Чтобы прийти к какому-то решению, целесообразно проанализировать полученный экспериментальный материал. Это достаточно часто встречающаяся задача, встречаются и такие, где приходится решать тот же вопрос относительно нескольких, а не двух выборок. Это и есть задачи второго типа.
Перед психологом два ряда численностей. Прежде всего нужно установить, на какие статистические методы опираться — на параметрические или непараметрические? Применять параметрические методы следует в том случае, если оба ряда имеют распределение, не отличающееся от нормального. Если же один из рядов не соответствует этому требованию, то применение параметрических методов противопоказано.
Положим, оба ряда показывают распределение, допускающее применение параметрических методов. Сравнение величин центральных тенденций — в данном случае их представляют средние арифметические — не даст ответа на вопрос о том, относятся ли выборки к одной совокупности. Почти безошибочно можно утверждать, что средние арифметические не будут тождественными, но этого явно недостаточно для ответа на поставленный вопрос, ответ не был бы получен, даже если бы средние арифметические оказались равными. Для данного случая более всего подходит сравнение выборок по критерию tСтьюдента.
Перед тем как ознакомиться с техникой вычислений и интерпретаций результатов, получаемых при работе с критерием t Стьюдента, необходимо остановиться на некоторых статистических терминах; они постоянно встречаются в прикладной статистике.
В том разделе статистики, где заходит речь о проверке гипотез, постоянно приходится иметь дело с нуль-гипотезой, или нулевой гипотезой. При сравнении двух выборок нуль-гипотеза формулируется следующим образом: между изучаемыми выборками нет различия или, иначе, различие между ними несущественно. Все дальнейшие расчеты направлены на то, чтобы прийти к заключению верна ли нуль-гипотеза или от нее нужно отказаться, и в действительности существенная разница между выборками имеется. В других случаях в зависимости от содержания материала меняются формулировки, но вычисления показывают, какова вероятность нуль-гипотезы. Для обозначения нуль-гипотезы используется символ h
.
Допустим, что разница между выборками имеется. Исследователь встает перед вопросом, насколько существенна эта разница, как часто будет обнаруживаться она в последующем, когда придется работать с подобными же выборками. Самые общие соображения при этом таковы: если разница получена на небольшом материале (числе случаев, охваченных той или другой выборкой), то при повторном изучении таких же выборок разницу, возможно, найти и не удастся. Другое дело, если изучаемые выборки не малы. Далее важно, оказалась ли обнаруженная разница значительной. Это рассуждение и следует иметь в виду, когда в статистике речь идет об уровне значимости полученного коэффициента, параметра и пр. Уровни значимости представлены в специальных таблицах, которые обычно даются в учебниках статистики, есть такие таблицы и в конце этой главы. Какой уровень значимости можно признать удовлетворительным? В психологии и педагогике минимально допустимым для отказа от Н0 уровнем значимости признается 0,95. Это значит, что расчеты, основанные на математической теории вероятности, дают основание утверждать, что при проведении таких же исследований, по крайней мере в 95% случаев, будет получен такой же результат, возможно, лишь с несущественными отклонениями. В некоторых работах удается получить и более высокие уровни значимости — 0,990 и даже 0,999 (эти же уровни значимости можно записать: 0,05; 0,01; 0,001. Записывая уровень 0,95, имеют в виду, что полученные параметры повторяются в 95% случаев, а записывая 0,05, что в 5% случаев они не повторятся; смысл в том и другом случае один и тот же).
А если не получен уровень значимости 0,95? Тогда нужно признать, что нуль-гипотезу не следует отвергать. Впрочем, иногда, по задачам исследования признается достаточным и более низкий уровень. В некоторых исследованиях цель состоит в том, чтобы прийти к утверждению нуль-гипотезы.
Обращаясь к таблицам уровней значимости, исследователь обнаруживает во многих из них специальный столбец с указанием степеней свободы, относящихся к полученному параметру или коэффициенту. Уровень значимости прямо зависит от того, каким числом степеней свободы обладает данный коэффициент или параметр. Число независимых величин, участвующих в образовании того или другого параметра, называется числом степеней свободы этого параметра. Оно равно общему числу величин, по которым вычисляется параметр, минус число условий, связывающих эти величины (Урбах В.Ю. Указ. соч. С. 161). Число степеней свободы и способы его определения всегда даются в окончательных формулах, которыми пользуется исследователь при статистической обработке своих материалов.
Рассмотрим пример с двумя выборками, которые, по мнению исследователя, можно рассматривать как подлежащие обработке параметрическим методом.
Двум группам шестиклассников по 6 человек было дано задание бросать мяч в корзину. Группы обучались по разным программам. Можно ли считать, что разница в программах сказалась на конечной результативности школьников? Для сравнения было взято число попаданий в корзину. Всего было дано по 10 проб.
Формула вычисления t
:
где <img width=«287» height=«80» src=«ref-1_429435509-4750.coolpic» v:shapes="_x0000_i1034">
--PAGE_BREAK--
Подсчитаем сумму рангов по каждой школе.
åR= 258 + 284,5 + 156,5 + 121 = 820.
Проверочная формула: åR
=
N/2(N
+1) = 820, где N — общее число элементов, включающее все выборки. В этом примере оно равно 40.
--PAGE_BREAK--Рис. 3
--PAGE_BREAK--Таблица 6
Испытуемые
х
Rx
y
Ry
dRxRy
R2dRxR y
А
1
1
3
1
Б
2
2
4
2
В
3
3,5
5
3
0,5
0,25
Г
3
3,5
6
4,5
1
1
Д
4
6
6
4,5
1,5
2,25
Е
4
6
7
6,5
0,5
0,25
Ж
4
6
7
6,5
0,5
0,25
3
5
8,5
8
9,5
1
1
И
5
8,5
8
9,5
1
1
К
6
10,5
8
9,5
1
1
Л
6
10,5
8
9,5
1
1
М
7
12
9
12,5
0,5
0,25
Н
8
13
9
12,5
0,5
0,25
О
9
14
10
14
П
10
15
11
15
n= 15
n2 = 225
Σd2RxRy = 8,5
fd =
п
-2 = 15 — 2 = 13.
Производится раздельное ранжирование ряда х и ряда у. Вычисляется разность рангов d попарно. Знак разности не существенен, так как по формуле нужно возвести d в квадрат. Далее действия определяются формулой:
<img width=«380» height=«44» src=«ref-1_429552704-3650.coolpic» v:shapes="_x0000_i1050">
По таблице уровней значимости r> r0,99(0,98 > 0,70).
Коэффициенты, вычисленные двумя разными способами, как и нужно было ожидать, чрезвычайно близки друг к другу; отличаются они на 0,02, что никакого значения практически не имеет.
Нельзя трактовать коэффициент корреляции как величину, означающую процент взаимозависимых связей вариант двух коррелируемых рядов, т.е. например, коэффициент 0,50 трактовать как 50% таких связей этих рядов. Это далеко не так. Об этом проценте вообще по коэффициенту корреляции судить нельзя. Возведенный в квадрат коэффициент корреляции называется коэффициентом детерминации (r2 или r2). Он показывает, сколько процентов вариант обоих рядов оказались взаимозависимыми. При коэффициенте 0,50 процент таких взаимозависимых вариант составит 0,502, т.е. 0,25 (Heinz
A
.,
Ebner
С.GrundlagenderStatistikfiirPsychologen, PadagogenundSoziologen. Berlin, 1967. S. 112). Для коэффициента 0,98 коэффициент детерминации составит 0,982 = 0,9604. Следовательно, взаимозависимы примерно 96% вариант обоих рядов.
Корреляция как метод статистического анализа в психологических исследованиях применяется очень часто. Всем, кто работает с применением корреляционного анализа, т.е. выясняет посредством этого метода тесноту связи двух рядов, следует напомнить, что коэффициент, как бы высок он ни был, нельзя интерпретировать как показатель наличия причинной связи между коррелируемыми рядами. Если коэффициент и может быть как-то использован в обсуждении вопроса о возможных причинных связях, то только в том случае, когда содержательная логика исследования и выдвигаемые при этом теоретические соображения позволяют опереться как на один из аргументов и на значение коэффициента корреляции.
В изложении метода корреляции речь шла исключительно о линейных корреляциях, которые изображены на схемах №1,2, 4. Но там же приведена схема криволинейной корреляции (№ 5). Вообще говоря, вероятно, и в психике человека протекают процессы, взаимосвязь которых не имеет линейного вида. Вычисление нелинейных корреляций и, главное их истолкование не относятся к простейшим статистическим методам, о которых говорится в этой главе. Но об их существовании следует знать.
Наконец, полезно напомнить, что корреляции по Пирсону (с определенными ограничениями и в определенных сочетаниях) создают ту базу, на которой открываются возможности перехода к так называемому факторному анализу. (Наиболее ясное изложение сути факторного анализа см.: Теплов Б.М. Типологические особенности в н.д. человека. М., 1967. Т. 5. С. 239).
Метод определения меры различия между наблюдаемыми и предполагаемыми (теоретическими) численностями — хи-квадрат.
Ранее были рассмотрены различные отношения между выборками: количественное преобладание какого-то признака, представленного в одной из выборок, теснота связи между выборками. Но есть еще одно важное отношение между ними: количественная разница распределений, благодаря которой при сопоставлении выборок открывается возможность прийти к содержательным выводам. Это отношение обнаруживается при сопоставлении распределений численностей. Допустим, что сравниваются две выборки, выпускников двух школ. Часть выпускников каждой школы сдавали экзамены в вузы. Из первой школы сдавали экзамены 100 человек, из них 82 успешно, не сдали 18. Таково распределение численности в первой выборке. Из второй школы сдавали экзамены в вузы 87 человек, выдержали 44 человека, не сдали — 43. Таково распределение численностей во второй выборке. Достаточно ли этих данных, чтобы утверждать, что подготовленность к вузовским экзаменам выпускников этих школ неодинакова? На первый взгляд, разница налицо:
лучше подготовлены выпускники первой школы. Однако при таком раскладе численностей возможно влияние случайности. Поэтому встает вопрос, можно ли, считаясь с представленными распределениями, прийти к статистически обоснованному выводу о мере подготовленности к экзаменам в вузы той и другой выборки.
Метод, с помощью которого подвергаются статистическому анализу описанные распределения численностей, получил название хи-квадрат, его обозначают греческой буквой x2 с показателем степени. Он был разработан математиком Пирсоном. Метод x2 весьма универсален, применим во многих исследованиях, пригоден для статистического анализа распределения численностей разнообразных количественных материалов, относящихся ко всем статистическим шкалам, в том числе и к шкале наименований.
Техника вычисления хи-квадрата довольно проста. Рассмотрим пример со сдачей экзаменов в вузы выпускниками первой и второй школ. В условии сказано, что всего намерены были сдавать экзамены 187 человек: 100 учащихся (53,5%) из первой школы и 87 (46,5%) из второй. Предположим, что выпускники обеих школ подготовлены одинаково, тогда и доли сдавших и не сдавших будут такие же, как доли их представленности в общем числе сдающих. Всего сдало экзамены 126 выпускников (82 + 44). Согласно высказанному предположению, 53,5% от этого числа должны бы были прийтись на 1-ю школу — это составит 66,9 от 126 — и 46,5% на 2-ю школу, что составит 58,9 от 126. Такое же рассуждение повторяем и относительно несдавших. Их всего 61 человек (18 + 43). На 1-ю школу, как нам известно, должно, по предположению, прийтись 53,5% от этого числа, т.е. 33,0 от 61, а на долю 2-й школы — 46,5%, т.е. 28,1 от 61. Нуль-гипотеза, имеющая в данном раскладе тот смысл, что между выпускниками нет различия, при таком соотношении сдавших и несдавших подтвердилась бы. Однако в условиях этого исследования показано другое распределение. Количество выпускников 1-й школы, сдавших экзамены, составляет 82, а не 66,9, как можно было бы предположить, исходя из нуль-гипотезы. Соответственно количество выпускников 2-й школы, сдавших экзамены, составляет в действительности всего 44, а не 58,9. Точно также, сравнивая количество несдавших (по условию с предполагаемым распределением) найдем по 1-й школе 18, а не 33, а по 2-й школе — 43, а не 28,1.
Расхождения между действительными распределениями и распределениями, которые могли бы иметь место, если исходить из нуль-гипотез, налицо. Они-то и учитываются при вычислении x2. Все сказанное удобно представить в виде таблицы-графика распределения численностей (табл. 7). Количества, которые были бы получены при принятии нуль-гипотезы, заключены в скобки. В правом углу буквенное обозначение клетки.
Таблица 7
Школа
Число сдавших
Число несдавших
Всего
Долевые отношения, %
Первая
82 А
(66,9)
18 В
(33,0)
100
(100)
53,5
Вторая
44 С
(58,9)
43 Д
(28,1)
87
(87)
46,5
Всего
126
61
187
100
Получены разности по клеткам (знак разности несущественен). Клетки:
А fA = 82—66,9= 15,1;
В fB = 18 — 33 = 15,0;
С fC = 44 — 58,9 = 14,9;
Д fD= 43—28,1= 14,9. Формула хи-квадрат:
<img width=«107» height=«38» src=«ref-1_429556354-1340.coolpic» v:shapes="_x0000_i1051">
где f0— наблюдаемые численности; fe—предполагаемые (теоретические) численности.
В рассмотренном материале x2= 15,12/66,9 + 152/33 + 14,92/58,9 + 14,92/28,1= 288/66,9 + 225/33 + 222/58,9 + 222/28,1= 3,4 + 6,8 + 3,8 + 7,9 = 21,9
Для получения числа степеней свободы нужно воспользоваться формулой (только для хи-квадрат): fd
= (
k
-1)(с — 1) = (2 — 1) х (2 — 1) = 1 степень свободы, где k — число столбцов, с — число строк в таблице с анализируемым материалом.
Обратимся к таблице уровней значимости для одной степени свободы для хи-квадрат: x20,99= 6,6. Следовательно, полученная величина вполне достаточна для отклонения h.Есть все основания для содержательного вывода о различной степени подготовленности выпускников обеих школ к экзаменам в вузы.
Все вычисления, приводимые в этой главе, ведутся с точностью до первого знака, т.е. вычисляются целые и десятые. Этим объясняется та, в общем-то, несущественная разница при вычислениях одной и той же величины разными способами. Никакого практического значения встречающиеся расхождения в величинах не имеют.
Полезно знать, что коэффициент хи-квадрат и коэффициент четырехпольной корреляции взаимосвязаны и, поскольку известна численность и распределение сопоставляемых выборок, указанные коэффициенты могут быть определены один через другой.
Как показывает само название этого метода, числовой материал, подлежащий статистическому анализу, может быть распределен в таблице-графике, имеющей четыре поля. Такое расположение материала облегчает все последующие действия с ним. Чтобы рассмотреть технику вычисления коэффициента четырехпольной корреляции — он обозначается символом j(фи), — можно воспользоваться тем примером, где речь шла о вычислении коэффициента x2. Выпускники двух школ сравнивались между собой по подготовленности к вузовским экзаменам.
<img width=«247» height=«42» src=«ref-1_429557694-3095.coolpic» v:shapes="_x0000_i1052">
Заменив буквенные обозначения числами, получим:
<img width=«403» height=«41» src=«ref-1_429560789-5498.coolpic» v:shapes="_x0000_i1053">
Для получения коэффициента х2 нужно воспользоваться формулой х2 = j2 · n. В данном примере х2 = 0,342 ·187 = 0,1156 · 187 = = 21,7. Этот же коэффициент х2 вычислялся другим приемом. Получено значение 21,9. Расхождение вызвано разницей в технике вычислений.
Коэффициент четырехпольной корреляции jможет принимать значения от 0 до 1, причем знак получаемого jне принимается во внимание.
Психологу, намеренному воспользоваться для статистического анализа своих материалов методом хи-квадрат, нужно знать о некоторых обязательных требованиях этого метода; о них не упоминалось в приведенных примерах. При вычислении коэффициента х2 необходимо брать для анализа только абсолютные численности выборок, но не относительные, в частности, не проценты. Необходимость учитывать это свойство объясняется тем, что значение коэффициента х2 зависит от абсолютных величин рассматриваемых распределений. Так, сравнение выборок с численностями 60 и 40 даст совершенно не тот результат, что сравнение выборок с численностями 6 и 4, хотя процентное отношение распределений в обоих случаях одинаково (60 и 40%).
Далее, для вычисления коэффициента х2 нужно, чтобы в каждой клетке таблицы-графика было не менее пяти наблюдений. Наконец, нужно со вниманием относиться к определению числа степеней свободы; неверное определение этого числа повлечет за собой неверное определение уровня значимости коэффициента по таблице.
Этим заканчивается рассмотрение статистических методов, относящихся ко второму типу задач.
В этих задачах независимо от того, будут ли они практического или теоретического содержания, психолог сопоставляет, сравнивает между собой несколько выборок. При этом не следует забывать, что цель исследования не всегда состоит в том, чтобы при сопоставлении отвергнуть нуль-гипотезу. Иногда конечная или промежуточная цель исследования состоит в том, чтобы, допустим, сравнивая выборки, подтвердить нуль-гипотезу. Самый простой пример: исследователь желает составить большую выборку, для чего необходимо объединить в ней учащихся нескольких школ. Естественно, решающее значение имеет доказательство того, что группы учащихся из разных школ относятся к одной совокупности, нужно, чтобы примененные критерии подтвердили это, а значит, статистика должна подтвердить при сравнении групп нуль-гипотезу. Подтвердить или отвергнуть нуль-гипотезу при сопоставлении выборок — в этом и состоит назначение статистических критериев; наиболее простые из них были изложены в предшествующем тексте. Конечно, информация, которую выявят статистические методы, может быть противоречива утверждениям, которые намерен защищать исследователь. В таком случае ему придется внести поправки в свои утверждения или отказаться от них.
Переходим к задачам третьего типа — задачам, рассматривающим динамические, временные ряды.
<img width=«219» height=«250» src=«ref-1_429566287-17737.coolpic» hspace=«12» v:shapes="_x0000_s1055"><img width=«220» height=«60» src=«ref-1_429584024-355.coolpic» hspace=«12» alt=«Подпись: Недели экспериментаРис. 4» v:shapes="_x0000_s1056">Предположим, что психологу дано задание собрать информацию о состоянии умственной работоспособности школьников 8-х классов, начиная со второй недели учебного года и до девятой недели включительно. Одной из методик, с помощью которых можно фиксировать состояние умственной работоспособности, считается тест Крепелина. Он состоит из большого количества примеров, в каждом из них нужно складывать два двузначных числа; учитывается общее число правильно решенных примеров. Каждые 3 минуты испытуемые по сигналу экспериментатора отмечают черточкой сделанное. Общая длительность эксперимента в зависимости от возраста составит 9, 12 или 15 минут. Этой методикой и воспользовался психолог. Он начал с того, что сформировал из учащихся, средние успехи которых оценивались за предыдущее полугодие баллами 4 и 5, выборку из 10 человек. Все они изъявили желание участвовать в эксперименте. С этими учащимися психолог в течение первой недели учебного года провел по 12 тренировочных занятий; это было необходимо, иначе рост продуктивности вследствие упражняемости замаскировал бы изменения в динамике работоспособности. Затем начался эксперимент: по субботам после уроков учащиеся этой выборки в течение 12 минут работали с тестом Крепелина. Эксперимент, как было сказано, продолжался 8 недель. Были получены следующие данные, средние по всей выборке (рис. 4).
Визуальная оценка полученного динамического ряда свидетельствует о снижении умственной работоспособности, в чем, конечно, нет ничего удивительного. Однако снижение идет не вполне равномерно. Это ясно видно из графика.
Основная тенденция изменения умственной работоспособности вполне ясна. Наблюдаемые, в общем, незначительные отклонения от этой тенденции могут быть на графике устранены методом сглаживания. В этом случае применим метод скользящей средней. Для сглаживания суммируются три показателя у — в данном примере это показатели продуктивности по тесту, — далее, опуская по одному показателю, суммируются одна за другой триады. Средняя каждой триады принимается за показатель сглаженной ломанной, если ориентироваться по графику. Смысл проводимого действия состоит в том, что основная тенденция выступает более отчетливо.
В только что рассмотренном примере сглаживание имеет такой вид:
Результаты сглаживания приобретают большую наглядность при нанесении их на график. Выступает основная тенденция динамики умственной работоспособности. Судя по показателям, полученным после сглаживания, в течение первых трех экспериментальных недель значительного снижения работоспособности не наблюдается, а далее идет непрерывное и резкое ее снижение. Сглаживание, как видно на графике, устранило колебания в работоспособности, отмеченные на первичном графике после V недели. При сглаживании по триадам общее число точек уменьшается на 2.
Какое значение имеет выделение посредством сглаживания основной тенденции? Если условия, благодаря которым возникла основная тенденция, сохранятся, то и эта тенденция с высокой вероятностью сохранится и, таким образом, по основной тенденции может быть построен прогноз, как будут развиваться изучаемые явления. Но такой прогноз возможен только при стабильности определенных условий. Для его построения нужен не только формальный, но и содержательный анализ; он же позволяет раскрыть значение факторов, вызвавших отклонения в ту или другую сторону от основной тенденции.
еТехника метода скользящей средней дает возможность выбирать различные способы объединения показателей для сглаживания. Таковыми могут быть не только триады, но при достаточно большом числе показателей (порядка 30—40 и более) для выведения скользящей средней могут быть выбраны пентады (объединения пяти показателей) и даже септиды (семь показателей).
Нужно иметь в виду, что наглядный и простой метод скользящей средней малопригоден для сглаживания динамики процессов, развитие которых во времени не имеет линейной формы (см.: рис. 3, схема 5, с. 265). Сглаживание методом скользящей средней в таких случаях может привести к искажению действительной тенденции развивающегося процесса. Исследователю следует внимательно всмотреться в материал, подлежащий сглаживанию, чтобы решить, имеет ли он право воспользоваться этим методом. Если криволинейная зависимость отражена в достаточно больших отрезках кривой, то каждый из этих отрезков в отдельности может быть подвергнут сглаживанию. Таково ограничение в использовании метода скользящей средней.
Анализируя выраженную на графике основную тенденцию в ее приближении к прямой, можно заметить, что метод не дает меры наклона, угла, который образуется между полученной после сглаживания приближающейся к прямой ломаной и осью абсцисс. Между тем, узнав величину этого угла, исследователь получит информацию о том, с какой скоростью изменяются изучаемые явления во времени: чем круче наклон и соответственно чем меньше внешний угол сглаженной кривой с осью абсцисс, тем больший путь проходит за единицу времени изменяющийся процесс. Это хорошо видно на рис. 5.
<img width=«257» height=«107» src=«ref-1_429584379-2664.coolpic» v:shapes="_x0000_i1054">
продолжение
--PAGE_BREAK--Рис.5
Точные сведения о мере наклона отрезка прямой, полученного после сглаживания, дает метод наименьших квадратов.
Для получения параметров отрезка прямой нужно обратиться к отношению единиц времени (х) и показателей развивающего процесса (у).
Для нахождения параметров отрезка прямой, который после сглаживания представит основную тенденцию изменяющегося ряда, проделываются вычисления по определенным формулам.
Формула прямой: у = а + bх, где у означает показатели ряда, х — единицы времени, по которым прослеживаются изменения изучаемого ряда. Надлежит узнать величины а и b. Величина а необходима для установления точки, с которой берет свое начало отрезок прямой, b — необходимо для установления степени наклона отрезка прямой по отношению к оси абсцисс (оси иксов).
Для вычисления вышеуказанных параметров а и b имеется система двух уравнений с двумя неизвестными:
па + åxb
=åу;
åxa+ åx2b= åху;
х иу в этой формуле рассчитываются из фактических данных изучаемого ряда.
Порядок вычислений. Шестиклассники Саня и Толя в течение пяти дней упражнялись в бросках мяча в корзину. Показатели Сани приведены в таблице (х — единица времени, у число попаданий мячом в корзину. В таблице приведены вычисления и других, требуемых формулой, величин; п = 5).
åx= 15; åу
=26; åx2= 55;åху
=89 5a + 15b = 26;
15a+ 55b = 89.
Нахождение неизвестных а и bпроизводится обычным способом исключения одного неизвестного. Члены первого уравнения для этого умножаются на 3
15a + 45b = 78.
Из второго уравнения вычитается первое, вычисляем b:
10b = 11; b = 1,1.
Подставив числовое значение b в первое уравнение, можно получить числовое значение а:
5a + 16,5 = 26;
5a = 9,5; a = 1,9.
Поскольку известны оба параметра отрезка прямой, можно определить все значения параметров по пяти точкам, по формуле у = 1,9 + 1,1х.
y1= 1,9 + 1,1 =3,0;
y2 = 1,9+2,2=4,1;
y3= 1,9+3,3=5,2;
y4= 1.9 + 4,4 = 6,3;
y5 =1,9 + 5,5=7,4.
Как было сказано ранее, сверстник Сани Толя упражнялся в том же умении. Так же, как и у Сани, количество дней упражнения было равно 5. Ниже приводятся результаты Толи и показаны все другие величины, которые необходимы для вычисления величин, требуемых формулой.
åx= 15; åy
=32; åx
2
=55; åxy =112.
Обозначения здесь такие же, что и в предыдущем примере. Буквы заменяются их числовыми значениями.
5a + 15b = 32;
15a + 55b = 112.
Члены первого уравнения умножаются на 3
15a + 45b = 96.
Из второго уравнения вычитается первое, получим значение b:
10b
=16; b
=1,6.
Из первого уравнения получаем значение а:
5a + 24 = 32;
5a = 8; a = 1,6.
Можно получить сглаженные показатели по дням упражнений у Толи. y1 = 1,6 + 1,6=3,2;
y2 = 1,6+3,2=4,8;
y3=1,6 + 4,8 = 6,4;
y4= 1,6 + 6,4 = 8,0;
<img width=«118» height=«124» src=«ref-1_429587043-4967.coolpic» hspace=«12» v:shapes="_x0000_s1062">y5 = 1,6+ 8,0=9,6.
На рис. 6 показаны только результаты сглаживания. Следует обратить внимание на то, как различаются отрезки прямой по их наклону по отношению к оси абсцисс. Данные Толи изображены пунктирной прямой.
Таковы способы обработки задач третьего типа.
Задачи, встающие перед психологом, который работает в области психологической диагностики, составляют четвертый тип задач.
Они относятся к конструированию диагностических методик, к их применению и обработке. Американская психологическая ассоциация (АПА) периодически издает «Стандартные требования к педагогическим и психологическим тестам», специальный кодекс требований к диагностическим методикам; это пособие полезно как для авторов методик, так и для тех, кто методиками пользуется.
Некоторые из этих требований могут считаться дискуссионными, но полезность кодекса в целом несомненна. Его выполнение, с одной стороны, обеспечивает объективность методик и их обоснованность, а с другой — препятствует проникновению в арсенал методик психологической диагностики дилетантских поделок, произвольных наборов всевозможных заданий, заимствованных из популярных журналов или сочиненных самим автором. Самые общие и самые необходимые к исполнению требования можно было бы свести всего к двум: диагностические методики должны быть надежными и валидными. Значение этих терминов было дано в предыдущих главах. Реализация этих требований осуществляется посредством прочно вошедших в психологическую диагностику статистических методов (Как было показано в гл. XI, при работе с критериально-ориентированными методиками при их конструировании и проверке возможны другие подходы).
Чтобы получить коэффициент надежности, характеризующий гомогенность методики, ее внутреннюю согласованность, прибегают к приему, называемому расщеплением. Эксперимент проводится с выборкой желательно порядка 100, но не менее 50 испытуемых. Полученные от каждого участника выборки ответы на вопросы или решения заданий делятся на четные и нечетные — по их нумерации в методике. По каждой половинке методики выписывается число правильно выполненных каждым испытуемым заданий. Два эти ряда коррелируют между собой.
Допустим, что методика состоит из 24 заданий. Тогда максимальное число выполненных заданий в каждой половинке будет равно 12. Приводим результаты первых 16 испытуемых и технику вычисления коэффициента надежности (гомогенности) r(табл. 8).
Таблица 8
ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТА НАДЕЖНОСТИ МЕТОДИКИ А (ГОМОГЕННОСТЬ)
Испытуемые
Правильно решены задания
Ранг заданий
d
d2
четные
нечетные
четных
нечетных
А
10
11
10,5
13,5
3
9
Б
8
8
8
8,5
0,5
0,25
В
3
7
3
6,5
3,5
12,25
Г
3
3
3
2
1
1
Д
11
12
12,5
15,5
3
9
Е
12
10
15
11
4
16
Ж
12
12
15
15,5
0,5
0,25
3
9
8
9
8,5
0,5
0,25
И
7
7
6,5
6,5
К
6
6
6
6
Л
7
5
6,5
4
2,5
6,25
M
11
10
12,5
11
1,5
2,25
Н
3
4
3
3
1
1
О
2
2
1
1
П
10
11
10,5
13,5
3
9
Р
12
10
15
11
4
16
åd2= 82,5
<img width=«517» height=«43» src=«ref-1_429592010-5725.coolpic» v:shapes="_x0000_i1055">
Проделана обычная ранговая корреляция. По таблице уровней значимости r0,99=0,64; полученный коэффициент превышает эту величину. Принято считать, что коэффициент надежности не должен быть ниже 0,8. Полученный коэффициент удовлетворяет этому требованию (Применение коэффициента корреляции для нахождения коэффициента надежности-гомогенности путем сопоставления числа правильных решений по четным заданиям и числа правильных решений по нечетным заданиям некоторые авторы находят недостаточно корректным, поскольку порядок, в котором представлены коррелируемые ряды, может быть случайным, он может быть произвольно изменен. Однако никакого другого приема для установления этого вида надежности в «Стандартных требованиях к педагогическим и психологическим тестам» не дается. Нахождение коэффициента надежности-стабильности указанной недостаточной корректностью не грешит).
Есть поправочная формула Спирмена—Брауна к коэффициенту надежности-гомогенности, получаемому путем расщепления. Поскольку при прочих равных условиях получаемый коэффициент будет тем выше, чем больше заданий содержится в методике, следует принять во внимание, что прием расщепления уменьшает число заданий вдвое — на этом основывается данный прием. Поправочная формула
<img width=«87» height=«64» src=«ref-1_429597735-1359.coolpic» v:shapes="_x0000_i1056">
в нашем примере
<img width=«168» height=«36» src=«ref-1_429599094-2270.coolpic» v:shapes="_x0000_i1057">
<img width=«23» height=«30» src=«ref-1_429601364-546.coolpic» v:shapes="_x0000_s1063">
где rSB— коэффициент с учетом поправки, а — коэффициент, вычисленный при коррелировании двух половинок методики. Если этот последний равен 0,88, то после поправки Спирмена—Брауна коэффициент будет равен 0,94.
Поправочную формулу Спирмена—Брауна можно применять только в тех случаях, когда методика делится на половинки (расщепление). Если же в методике в процессе обработки не меняют число заданий, то поправочная формула не применяется.
Величина коэффициента надежности-гомогенности зависит от социально-психологических особенностей той выборки, по результатам испытания которой этот коэффициент устанавливался. Поэтому при опубликовании методики, приводя ее основные характеристики, автору следует указать, на каком контингенте проводилась проверка надежности.
При вычислении коэффициента надежности методики, характеризующего стабильность данных, получаемых с помощью этой методики, первый коррелируемый ряд представляет собой результаты первого, а второй — повторного испытания: его рекомендуют проводить примерно через шесть недель после первого. При необходимости этот срок может изменяться. Эти два ряда коррелируют между собой. Корреляция проводится по обычным правилам, о них сообщалось выше. Это прием «тест-ретест».
Для установления надежности методики существуют и некоторые другие приемы. Так, для получения коэффициента надежности практикуется прием параллельных форм. Авторы, конструирующие методику, создают две ее формы; условно назовем их формой А и формой Б. Обе формы должны быть однородны по психологической направленности, по доступности содержания заданий и по их трудности. В одном варианте формы Л и Б предъявляются испытуемым одна за другой, причем в одной половине выборки испытуемым сначала предлагается форма А, а за ней форма Б, а в другой половине выборки, наоборот, сначала форма Б, а затем А. Результаты, полученные по той и другой форме, коррелируют между собой, и полученный коэффициент трактуется как коэффициент надежности. Нетрудно заметить, что этот прием близок приему расщепления с той разницей, что методика как бы удвоена и сравниваются не четные и нечетные задания, а две половины этой удвоенной методики. Это дает право трактовать получаемый коэффициент скорее как коэффициент надежности-гомогенности, а не надежности-стабильности. Поскольку проверке подвергается набор заданий в целом, поправочную формулу Спирмена—Брауна применять не следует.
Другой вариант использования приема параллельных форм состоит- в том, что одна из форм предлагается испытуемым через какой-то интервал времени после другой, что сближает этот прием с приемом «тест-ретест». При проведении этого приема необходимо убедиться в том, что обе формы высоко коррелируют между собой, согласно только что изложенному приему по надежности-Гомогенности. Результаты обоих испытаний затем коррелируют. Полученный коэффициент может трактоваться как коэффициент надежности-стабильности. Выше указывалось, что в приеме «тест-ретест» рекомендуется интервал между испытаниями шесть недель. Для этого варианта приема параллельных форм этот интервал может быть уменьшен, так как испытуемый при выполнении заданий не сможет опираться на память.
Из предшествующего изложения явствует, что в приемах установления надежности главную роль играет статистический метод корреляций. Несколько по-иному обстоят дела при проверке валидности методики.
Если показатели того критерия, который взят для получения коэффициента внешней валидности, имеют примерно ту же меру рассеяния, меру вариативности, что и мера рассеяния показателей самой методики, то применение корреляции правомерно. Допустим, автор методики намерен установить ее валидность, сравнивая успешность выполнения методики с учебной деятельностью. Валидность устанавливается на выборке школьников. В этом случае, как показывает практика, суммарные оценки за одну учебную четверть или за полугодие покажут примерно тот же размах колебаний, что и размах колебаний по методике; методика состоит из 20 заданий, и при ее выполнении показан размах колебаний от 3 до 20. Суммарные оценки успеваемости, после того как они подсчитаны за полгода, имеют размах колебаний порядка от 14 до 36. Такие ряды вполне возможно коррелировать.
Но в некоторых случаях для получения коэффициента валидности приходится сравнивать успешность выполнения диагностической методики, допустим, в тех же пределах колебаний — от 3 до 20, и производственные достижения, которые имеют всего три ступени оценок: ниже средних, средние и выше средних. Корреляцией в этом случае воспользоваться нельзя, если иметь в виду линейную корреляцию, о которой идет речь в этой главе. Однако могут быть использованы некоторые другие статистические методы, показывающие существование или отсутствие связи между распределением двух рядов численностей. Простейший способ получения коэффициента валидности в описываемом случае и в других подобных случаях — метод «хи-квадрат». Всех испытуемых, прошедших диагностический эксперимент, делят на три равные группы — их и сопоставляют с тремя группами, на которые были поделены испытуемые при оценке их профессиональной успеваемости.
В изучаемой выборке — 90 человек. Они делятся по профессиональным достижениям на три группы: первая — в ней 30 испытуемых — лица с профессиональными достижениями ниже среднего уровня; вторая — 40 испытуемых — это лица со средними достижениями, и третья — 20 испытуемых, их достижения выше среднего уровня. Первая группа составляет 33,3% выборки, вторая — 44,4 и третья — 22,2%.
Приводим технику вычисления (табл. 9).
Таблица 9
Эксперимент, данные которого представлены в табл. 8, предпринимался, чтобы установить валидность психологической оценки. Нуль-гипотеза формулируется так: психологическая оценка не имеет никакого значения для профессиональных достижений; поэтому она никак не скажется на распределении численностей в таблице-графике «хи-квадрат»;
Принятие нуль-гипотезы может произойти в том случае, если в каждой из групп по профессиональной успешности испытуемые будут распределены независимо от их психологической оценки. Тогда испытуемые, получившие психологическую оценку «ниже среднего», распределятся по всем трем группам в тех же процентных отношениях, в каких они распределились и по профессиональным достижениям. Напомним эти отношения: 33,3 — 44,4 — 22,2. Психологическую оценку «ниже среднего» получили всего 30 испытуемых. 33,3% этого числа (10 человек) должны были бы попасть в группу с профессиональными достижениями ниже среднего уровня, с достижениями среднего уровня — 44,4% (в среднем 13,3), с достижениями выше среднего уровня — 22,2% (6,7).
Те же рассуждения повторяются и относительно испытуемых, имеющих психологические оценки «среднюю» и «выше среднего». Однако наблюдается иное распределение. Возникает вопрос: можно ли, учитывая фактическое распределение, отвергнуть нуль-гипотезу и признать, что психологическая оценка влияет на профессиональные достижения? Это раскроет методика «хи-квадрат».
В клетках таблицы представлены как фактически наблюдаемые численности, так и предполагаемые согласно нуль-гипотезе; они заключены в скобки.
Как известно, формула хи-квадрат такова:
<img width=«129» height=«46» src=«ref-1_429601910-1658.coolpic» v:shapes="_x0000_i1058">
где f0— фактически наблюденные численности, fe— предполагаемые численности.
Для получения значения хи-квадрат нужно суммировать по клеткам:
<img width=«85» height=«48» src=«ref-1_429603568-1174.coolpic» v:shapes="_x0000_i1059">
Клетки
<img width=«302» height=«440» src=«ref-1_429604742-26517.coolpic» v:shapes="_x0000_i1060">
x2=10 + 5,2 + 0,4 + 2,5 + 0,2 + 1,6 + 2,5 + 3,7 + 0,4 = 26,5, fd— число степеней свободы.
В этом примереc= (к - 1)(с — 1) = (3 — 1)(3 — 1) = 4.
x20,99 при 4 степенях свободы равно 11,34.
Сравнивая полученную в эксперименте величину x2 с величиной x20,99, указанной в таблице значимостей, можно заключить: полученная в эксперименте величина (x2 = 26,5) свидетельствует о валидности примененной психологической методики.
Величина хи-квадрат с указанием ее значимости служит в подобных случаях показателем или коэффициентом валидности. Этот же метод применяется, если оценка дается не по трем ступеням, как в рассмотренном примере, а по пяти (значительно ниже средней, ниже средней, средняя, выше средней, значительно выше средней и т.д.). Техника вычислений при такой дифференциации оценок аналогична показанной выше.
Были изложены четыре типа задач и показаны статистические методы, применяемые для каждого типа. В современной диагностике применяются не только перечисленные в этой главе статистические методы, но и многие другие. Однако можно полагать, что, ограничив свою цель изложением простейших статистических методов, нет необходимости обращаться к сложным и сложнейшим. Читатели, заинтересовавшиеся проблемами статистических методов в диагностике, могут обратиться к другим пособиям и источникам.
продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по психологие
Реферат по психологие
Психологический эксперимент 2
2 Сентября 2013
Реферат по психологие
Техника сознавания
2 Сентября 2013
Реферат по психологие
Психологические особенности людей, употребляющих наркотические вещества
2 Сентября 2013
Реферат по психологие
Методы психодиагностики и их классификация
25 Июня 2015