Реферат: Методические указания Екатеринбург 2006 утверждаю декан психологического факультета Глотова Г. А





ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение

высшего профессионального образования

Уральский государственный университет им. А.М. Горького


Факультет психологии

Кафедра общей психологии и психологии личности


ВВЕДЕНИЕ В МНОГОМЕРНЫЙ АНАЛИЗ ДАННЫХ

Методические указания


Екатеринбург

2006

УТВЕРЖДАЮ

Декан психологического факультета

____________________Глотова Г.А.


Учебно-методическое пособие по курсу «Введение в многомерный анализ данных» составлено в соответствии с требованиями федерального компонента к обязательному минимуму содержания и уровню подготовки:

дипломированного специалиста по специальности 030301

бакалавра, магистра по направлению «психология»

по циклу СД дисциплин государственного образовательного стандарта высшего

профессионального образования.


Автор-составитель:

к.п.н., доцент кафедры общей психологии и психологии личности Ур ГУ

Боднар А. М.


Рекомендовано к изданию учебно-методической комиссией

психологического факультета

Протокол заседания № от

ВВЕДЕНИЕ…………………………………………………………………………..3

Часть 1

^ НЕОБХОДИМОСТЬ МНОГОМЕРНОГО ПОДХОДА К АНАЛИЗУ

ДАННЫХ В ПСИХОЛОГИИ ………………………………………………………4

НАЗНАЧЕНИЕ И КЛАССИФИКАЦИЯ МНОГОМЕРНЫХ МЕТОДОВ……………….8

^ ОБЩАЯ ХАРАКТЕРИСТИКА МНОГОМЕРНЫХ МЕТОДОВ

ИССЛЕДОВАНИЯ ЛИЧНОСТИ И РЕЗУЛЬТАТЫ ИХ ПРИМЕНЕНИЯ ……..12

Методы сбора данных……………………………………………………….12

Общая характеристика математических методов многомерного

анализа данных о личности…...…………………………………………….15

Достижения экспериментальной психологии

по выделению черт и типов личности……………………………………..21


Часть 2

ФАКТОРНЫЙ АНАЛИЗ (ОБЩИЕ ВОПРОСЫ)……….………………………..28

Общая характеристика факторного анализа как научного метода……….28

Сведения о матрицах, минимально необходимые для изучения

факторного анализа………………………………………………………….35

ВАЖНЕЙШИЕ ПОНЯТИЯ И ТЕХНИКА ФАКТОРНОГО АНАЛИЗА………..38

Два вводных примера………………………………………………………..38

Схема решения и основные проблемы факторного анализа…….……….43

Классификация факторов и связь между отдельными

видами факторов…………………………………………………………….44

Важнейшие понятия факторного анализа,

связанные с дисперсией………………………………………………….…45

Суть основных проблем факторного анализа………………………….….47

Наглядное пояснение основной концепции факторного анализа

с помощью числового примера………………………………………..…...54

Дополнительные статистические показатели оценки результатов

факторного анализа………………………………………………………….59

Несколько замечаний по поводу конфирматорного

факторного анализа………………………………………………………….60

^ МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПРИСТУПАЮЩИМ

К ПРАКТИЧЕСКОМУ ОСВОЕНИЮ ФАКТОРНОГО АНАЛИЗА…………….61


ЛИТЕРАТУРА……………………………………………………………………...66

ПРИЛОЖЕНИЕ…………………………………………………………………….67

ВЕДЕНИЕ


Настоящие методические указания подготовлены по программе спецкурса «Введение в многомерный анализ данных», являющегося продолжением и развитием базовой дисциплины «Математические методы в психологии», читаемой студентам-психологам первого курса. Они имеют целью познакомить студентов старших курсов, приступающих к выполнению выпускных и дипломных работ, с теоретическими основами многомерных методов анализа эмпирической информации и – на примере факторного анализа – с практическими способами их применения.

Методические указания состоят из двух частей.

Первая часть посвящена идеям, лежащим в основании многомерного подхода, обоснованию необходимости появления этих идей и их внедрения в процесс получения и анализа данных. Приведены примеры достижений экспериментальной психологии, основанных на использовании многомерных методов, по выделению черт и типов личности.

Вторая часть посвящена факторному анализу. Из множества многомерных методов мы выбрали и обсуждаем идеи, проблемы и прикладные вопросы факторного анализа по ряду причин. Во-первых, с него начинается эпоха многомерных методов в психологии. Долгое время он был основным и практически единственным многомерным методом, применявшимся психологами. Но и после появления других методов к факторному анализу прибегают чаще, чем к этим другим методам. Кроме того, его идеи и техника сравнительно сложны, и потому при освоении факторного анализа желателен комментарий, каковым и являются данные методические указания. В них дается общая характеристика факторного анализа как научного метода, обсуждаются его важнейшие понятия и техника, даются методические рекомендации студентам, приступающим к практическому освоению факторного анализа.


^ НЕОБХОДИМОСТЬ МНОГОМЕРНОГО ПОДХОДА

К АНАЛИЗУ ДАННЫХ В ПСИХОЛОГИИ


В физико-химико-биологических науках роль научных концепций и теорий ежедневно подтверждается повсеместным использованием вычислительной техники, полимеров, вакцин и т. п., что служит лучшим подтверждением значимости этих наук.

Психологические же теории, которых множество и весьма солидных, в практической жизни не играют существенной роли. Почему?

Отвечая на этот вопрос, мы будем опираться на историю исследований и достижений прежде всего в области психологии личности. Тому есть две причины. Во-первых, в этой области ярко проявись основные тенденции, присущие научному исследованию в психологи, а, во-вторых, здесь получены впечатляющие результаты применения многомерных математических методов, в частности, факторного анализа.

Итак, почему же психологические знания не могут использоваться эффективным образом? Несомненно, психика человека является необыкновенно сложным объектом для изучения. Несомненно и то, что по сравнению с физико-химическими науками психология очень молода.

Однако, сделав эти оговорки, следует спросить: а не присущ ли психологическим методам исследования какой-либо недостаток, который тормозит практическое развитие психологии? Для ответа на этот вопрос обратимся к истории развития научных представлений о личности.

Систематизация психологических знаний о личности может быть условно разделена на две исторические фазы: клинико-психологическую и экспериментальную.

Клинико-психологическая фаза является фазой организованных наблюдений и вербальных теорий. Она возникла как стремление лечить и корригировать отклоняющиеся формы поведения. Эта фаза оставила нам в наследство много известных имен (таких, как Адлер, Бехтерев, Блейхер, Жанэ, Корсаков, Крепелин. Кречмер, Лазурский, Фрейд, Юнг и др.) и множество самобытных теорий. Будучи научными по своим целям, эти теории достигли популярности, не имея обоснованности, ибо в них отсутствует экспериментальная основа, имеющаяся в других науках. Эксперимент используется в клинико-психологической фазе исследования лишь имплицитно: измерение здесь заменено наблюдением, сбор данных – отбором показательных случаев, статистическая обработка – содержательной интерпретацией.

Однако такая бедность экспериментальной процедуры позволяет манипулировать большим числом объясняющих переменных.

Важно, что сторонники клинического метода стараются свести в единую систему все переменные, необходимые для формирования понятий о личности, без которых невозможно прийти к установлению реальных закономерностей.

Экспериментальная фаза возникла как реакция на вербальный характер клинико-психологического метода исследования. Эта фаза количественного и экспериментального исследования личности с самого начала четко разделилась на два течения: двумерное и многомерное. Оба подхода позволяют изучать взаимосвязи между переменными, но разными способами.

^ Двумерный эксперимент является по существу слепым перенесением в психологию метода исследования, принятого в физичecкиx науках. Он предполагает выделение зависимой и независимой переменных с помощью экспериментального контроля либо с помощью рандомизирующих (обеспечивающих случайный порядок) процедур.

В многомерном же эксперименте одновременно статистически учитываются все измеряемые факторы, взятые во всей их жизненной полноте.

Сторонники двумерного экспериментального метода считают, что выделение двух переменных необходимо для изучения психического феномена в чистом виде. По их мнению, при таком подходе устраняются контаминирующие (зашумляющие) влияния одновременно происходящих процессов, однако упускается из виду тот факт, что изучаемый психический процесс никогда не протекает изолированно. Поведение сложно и определяется множеством внутренних и внешних факторов. По этой причине пытаться сформировать две группы лиц, идентичных во всех отношениях, кроме одного, и поставить их в одинаковые условия невозможно даже в лабораторном эксперименте. Поэтому вместо устранения контаминирующих эффектов разумнее изучить их самих. Этот принцип и был положен в основу многомерных методов исследования.

Многомерный эксперимент в той разновидности, в которой он существовал до 60-х годов 20 в., требовал измерения множества сопутствующих признаков, независимость которых заранее неизвестна. Анализ связей между изучаемыми признаками позволял выявить небольшое число скрытых структурных факторов, от которых зависят наблюдаемые вариации измеряемых переменных.

Такой подход базируется на априорных соображениях, что исходные признаки – это только поверхностные индикаторы, косвенно отражающие скрытые от прямого наблюдения переменные (например, черты личности), знание которых позволит просто и понятно описать индивидуальное поведение. Поскольку скрытых черт значительно меньше, чем поверхностных, то даже полное описание личности остается экономным и удобным для практического использования.

Таким образом, зародившийся в начале 20 века многомерный подход к исследованию интеллекта и личности (реализованный в факторном анализе) может рассматриваться как синтез двух фаз развития психологических исследований. Он позволил объединить достоинства целостного подхода, свойственного клиническому методу с достоинствами метрического подхода, присущего двумерному эксперименту. В силу этих особенностей многомерный подход успешно применяется в тех областях, где человеческое поведение рассматривается в естественных условиях. Того, чего невозможно достичь прямой манипуляцией зависимых и независимых переменных, можно добиться с помощью более сложного статистического анализа всего множества существенных переменных. Главным достоинством многомерного подхода является его эффективность в исследовании реальных ситуаций без риска их искажений или загрязнения побочными влияниями, возникающими при создании искусственных экспериментальных условий.

Идея же применения многомерного подхода в психологии возникла в конце XIX века практически одно­временно с началом психологических измерений, однако широкое применение многомерных методов становит­ся возможным лишь к концу 1980-х годов, с распространением персо­нальных компьютеров. Дело в том, что любой многомерный метод тре­бует циклической обработки данных, где на каждом этапе сам исследователь должен принимать решение о характере обработки. Поэтому раньше коррект­ная реализация многомерного метода (факторного анализа) требовала недель работы группы специалистов: предметника (психолога), статистика, про­граммиста, оператора и др. Далеко не каждая исследовательская лаборатория могла себе это позволить.

В настоящее время, с появлением мощных и простых в применении про­граммных средств, сам специалист может реализовать весь процесс много­мерного анализа данных, не вдаваясь в вычислительные сложности. Для это­го ему достаточно знать общий смысл метода, требования к исходным данным и основные показатели для интерпретации получаемых результатов.


^ НАЗНАЧЕНИЕ И КЛАССИФИКАЦИЯ МНОГОМЕРНЫХ МЕТОДОВ

Роль математико-статистических методов в психологическом исследовании не однозначна. В курсе «Математические методы в психологии» акцент ставился на процедурах проверки статистических гипотез. Однако помимо статистического обоснования предположений есть еще одна функция математических ме­тодов в любой области знания – представление эмпирических данных в пригод­ном для интерпретации виде, поиск смысла в обилии исходной информации. Эта функция является исходной, а потому более значимой.

Действительно, прежде чем сформулировать гипотезу, мы пытаемся ос­мыслить данные, для чего, в частности, вы­числяем средние значения, сравниваем частоты и т. д. Эти операции, зачастую, не ассоциируются с при­менением математических методов, а на самом деле использование этих методов в их основных назначениях – по­исковых и описательных – с них и начинается. В результате мы получаем описательные математические модели, применяемые для представления исходных (эмпирических) данных в доступном для интерпретации виде, или эмпирические математические модели (ЭММ). Про­стейшие ЭММ – средние значения признака, вычисляемые для сравнивае­мых групп в предположении, что различия в средних значениях отражают различия между представителями групп. Или даже просто ранжирование членов группы, которое предполагает, что порядковый номер испытуемого отражает выраженность изучаемого свойства. Если у нас два признака, изме­ренных на группе объектов (испытуемых), то мы вычисляем коэффициент корреляции или сопряженности, исходя из предположения о согласованно­сти индивидуальной изменчивости признаков.

По сути дела, ЭММ идентичны мыслительным операциям. Но непосред­ственно сравнивать, различать, определять взаимосвязь и т. д. мы можем толь­ко при небольшой численности объектов или признаков. Когда много и объектов и признаков, простейшие ЭММ уже мало пригодны. И тогда возникает необходимость при­менения многомерных методов и компьютера.

Мы видим, таким образом, еще одну причину – наряду с указанной выше – неизбежности появления многомерных методов как дальнейшего развития ЭММ в от­ношении многостороннего (многомерного) описания изучаемых явлений. Как и простейшие ЭММ, многомерные ЭММ воспроизводят мыслительные операции человека, но в отношении таких данных, непосредственное осмыс­ление которых невозможно. Мно­гомерные методы выполняют такие интеллектуальные функции, как:

струк­турирование эмпирической информации (факторный анализ, кластерный анализ, многомерное шкалирование),

классификация (кластерный анализ),

экстраполяция (множественный регрессионный ана­лиз),

распознавание образов (дискриминантный анализ) и т. д.

Список многомерных методов, которые будут упомянуты ниже, не претендует на полноту и состоит из методов, наиболее часто применяемых в психологии.

Эти методы можно классифицировать по трем основаниям: по назначению; по способу сопоставления данных – по сходству (различию) или пропорциональности (корреляции); по виду исходных эмпирических данных.

^ Классификация методов по назначению:

Методы предсказания (экстраполяции): множественный регрессионный анализ. Пред­сказывает значения метрической «зависимой» переменной по множеству из­вестных значений «независимых» переменных, измеренных у множества объектов (испытуемых).

^ Методы классификации: варианты кластерного анализа и дискриминан­тный анализ. Кластерный анализ («классификация без обучения») по изме­ренным характеристикам у множества объектов (испытуемых) либо по дан­ным об их попарном сходстве (различии) разбивает это множество объектов на группы, в каждой из которых содержатся объекты, более похожие друг на друга, чем на объекты из других групп. Дискриминантный анализ («класси­фикация с обучением», «распознавание образов») позволяет классифициро­вать объекты по известным классам, исходя из измеренных у них признаков, пользуясь решающими правилами, выработанными предварительно на вы­борке идентичных объектов, у которых были измерены те же признаки.

^ Структурные методы: факторный анализ и многомерное шкалирование. Факторный анализ направлен на выявление структуры переменных как совокупности факторов, каждый из которых – это скрытая, обобщающая при­чина взаимосвязи группы переменных. Многомерное шкалирование выяв­ляет шкалы как критерии, по которым поляризуются объекты при их субъек­тивном попарном сравнении.

Классификация методов по исходным предположениям о структуре данных:

Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. На корреляционной модели основаны факторный анализ, множественный регрессионный анализ, отчас­ти – дискриминантный анализ.

Методы, исходящие из предположения о том, что различия между объек­тами можно описать как расстояние между ними. На дистантной модели основаны кластерный анализ и многомерное шкалирование, частично – дис­криминантный анализ. Многомерное шкалирование и дискриминантный ана­лиз добавляют предположение о том, что исходные различия между объекта­ми можно представить как расстояния между ними в пространстве небольшого числа шкал (функций).

^ Классификация методов по виду исходных данных:

Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ. дискриминантный анализ и факторный анализ.

Методы, исходными данными для которых могут быть попарные сход­ства (различия) между объектами: это кластерный анализ и многомерное шкалирование. Многомерное шкалирование, кроме того, может анализиро­вать данные о попарном сходстве между совокупностью объектов, оценен­ном группой экспертов. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами.

Представленные классификации свидетельствуют о необходимости зна­ния возможностей и ограничений многомерных методов уже на стадии общего замысла исследования. Например, ориентируясь только на фактор­но-аналитическую модель, исследователь ограничен в выборе процедуры ди­агностики: она должна состоять в измерении признаков у множества объек­тов. При этом исследователь ограничен и в направлении поиска: он изучает либо взаимосвязи между признаками, либо межгрупповые различия по изме­ряемым признакам. Общая осведомленность о других многомерных методах позволит исследователю использовать более широкий круг психодиагности­ческих процедур, решать более широкий спектр не только научных, но и прак­тических задач.

Применение многомерных методов требует соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы STATIST1CA, SPSS, STATGRAPH, STADIA, содержащие практически весь спектр статистических методов – от простейших до самых современных. Стоит обратить внимание на пакет STADIA, поскольку он – отечественный, а потому сравнительно дешевый.


^ ОБЩАЯ ХАРАКТЕРИСТИКА МНОГОМЕРНЫХ МЕТОДОВ

ИССЛЕДОВАНИЯ ЛИЧНОСТИ И РЕЗУЛЬТАТЫ ИХ ПРИМЕНЕНИЯ


Итак необходимость измерения в психологии была осознана, а через какое-то время, несмотря на неверный старт (двумерный эксперимент), нашлись психологи (прежде всего это Ч. Спирмен, Л. Терстоун, Р. Кеттел), сумевшие найти путь к измерениям, адекватным объекту исследования – многомерным методам. Но чтобы применять математические методы, в частности, многомерные, нужно иметь объект применении – данные, поэтому далее мы рассмотрим, каким образом психологи их получают.


^ Методы сбора данных

Психологическая информация может быть получена из трех принципиально различных источников. Данные, полученные из этих источников, обозначаются как «L»-, «Q»- и «Т»-данные (классификация Р. Б. Кеттела).

«L»-данные. Данные, полученные путем регистрации реального поведения человека в повседневной жизни, принято называть «L»-данными (от «life record data»)

Идеально было бы иметь полное и подробное описание образа жизни исследуемого лица, однако на практике это неосуществимо. В лучшем случае удается получить информацию относительно отдельных периодов или сторон жизни испытуемого, например сколько раз ученик правильно отвечал на вопросы, сколько раз нарушал дисциплину, обращался к врачу и т. п. Поэтому чаще всего «L»-данные получают путем формализации оценок экспертов, наблюдающих поведение испытуемого в определенных ситуациях и в течение некоторого периода времени.

С «L»-данных обычно начинаются предварительные исследования проблемы. В многомерных исследованиях очень важно достаточно полно охватить сферу исследования. Кэттелл считает, что «L»-данные идеальны для установления тех признаков поведения, которые нуждаются в измерении. «L»-данные хороши также тем, что все виды поведения уже представлены в языковой форме. Это гарантирует не только лучший начальный выбор переменных, но и более легкую интерпретацию полученных факторов.

«Q»-данные. Изучение личности с помощью опросников и других методов самооценок обозначается как «Q-данные (от «Questionnaire data»). Благодаря простоте инструментальных конструкций и легкости получения информации «Q-данные (опросники, самоотчеты, шкалы самооценок и т. п.) занимают центральное место в личностных исследованиях. Число методик для получения «Q-данных огромно. Из них наиболее известны Миннесотский многопрофильный личностный перечень (MMPI), шестнадцатифакторный личностный опросник (16PF), опросники Айзенка (EPI, EPQ), Калифорнийский психологический тест.

«Т»-данные – это сведения, получаемые от объективных тестов с контролируемой экспериментальной ситуацией (objective test data), а также от физиологических измерений. «T»-данные получают в результате объективного измерения поведения (вербального, невербального, социального и индивидуального) без обращения к самооценкам или оценкам экспертов. При всем многообразии объективных тестов во всех случаях создаются специальные микроситуации, способствующие проявлению основных измеряемых свойств.

Наиболее полное собрание объективных тестов представлено в «компендиуме объективных тестов личности и мотивации», составленном Р. Б. Кэттеллом и Ф. В. Варбуртоном. В этом справочнике авторами собрано более 400 различных тестов, расклассифицированных на 12 групп. Например:

тесты способностей. Выяснилось, что некоторые тесты, первоначально созданные для исследования интеллектуальных функций, знаний и способностей, высоко коррелируют с личностными факторами, например показатели беглости речи, моторной ригидности высоко коррелируют с фактором «невротическая регрессия–мобилизация энергии».

тесты умений и навыков. К этой группе относятся тесты на зрительно-моторную координацию, координацию движений рук, точность прохождения лабиринта и т. п.

опросники. Это группа тестов, построенная в виде анкетного опроса о поведении, вкусах, привычках и т. п., например анкеты для опроса о состоянии здоровья, выполнении гигиенических требований и т. Д.

проективные тесты. Сюда относятся все виды формализованных проективных личностных тестов.

ситуационные тесты. Они предполагают создание определенной социальной ситуации. Например, одно и то же задание выполняется в одиночестве и перед всем классом, для личного зачета и для командного, в ситуации соревнования или кооперации и т. д.

игры. В игровых ситуациях хорошо проявляются индивидуальные особенности личности испытуемого. Поэтому многие игры включены в состав объективных тестов.

физиологические тесты. К ним относятся тесты, в которых регистрируются физиологические показатели: КГР, ЭКГ, ЭЭГ, тремор и т. п.

физические тесты. Их не всегда легко отличить от физиологических. Размер грудной клетки, удельный вес тела, тургор мышц, величина жировой складки и другие показатели относят к физическим тестам.

Объективные тесты представляют собой истинно экспериментальный подход, полностью освобожденный от субъективных оценок. Большинство специалистов считают эту область наиболее перспективной, а Кеттелл сравнил переход к ним с «прохождением звукового барьера в авиации или с любым другим прорывом в науке в область новых принципов».


^ Общая характеристика математических методов

многомерного анализа данных о личности

В психологии существуют два основных направления исследований личности: подход на основе выделения черт личности и типологический подход

Первый предполагает существование конечного набора базисных качеств, и личностные различия определяются степенью их выраженности. При типологическом подходе исходят из постулата, что тип личности является целостным образованием, не сводимым к комбинации отдельных личностных факторов. Но оба подхода предназначены для формирования понятийного аппарата, систематизирующего информацию об индивидуальных различиях.

Черты объединяют группы тесно связанных признаков и выступают как некоторые интегральные характеристики, обобщающие информацию, содержащуюся в данной, группе признаков. Число черт определяет размерность личностного пространства.

Типы объединяют группы похожих испытуемых и составляют иной набор объяснительных понятий, где в качестве имени понятия выступает название соответствующего типа, а содержание раскрывается описанием типичного (или усредненного) представителя.

Таким образом, подход на основе черт требует группировки признаков, а подход на основе типов – группировки испытуемых.

Для решения каждой из этих двух задач существуют специальные математические методы и модели. Наиболее часто для группировки признаков используются методы факторного анализа, а для группировки испытуемых – методы автоматической классификации. Эти методы являются двумя способами формирования обобщений на экспериментальном массиве данных. Они позволяют «сжать» информацию за счет выявления неоднородностей в структуре связей между признаками или испытуемыми. В результате массив экспериментальных данных разбивается на некоторые подмассивы, которые являются обобщениями совокупности данных.

Для удобства понимания способа построения обобщений с помощью методов факторного анализа и автоматической классификации представим экспериментальный массив данных в виде двухмерной матрицы размерностью N на М (рис. 1).

a b c d e f M

1



















2



















3



















4



















5



















6



















N


Строки матрицы данных соответствуют множеству испытуемых (ученики, педагоги и т. п.), а столбцы – признакам личности (в «L»-, «Q»- или «T»-данных).

Такое представление данных допускает, как минимум, два способа построения обобщений: 1) по столбцам (признакам личности) и 2) по строкам матрицы данных (группировкам испытуемых).

^ Обобщение данных путем группировки признаков (по столбцам). Оно состоит в выделении из матрицы данных групп тесно связанных признаков при помощи методов факторного анализа.

^ Факторный анализ представляет собой систему методов для преобразования исходного набора признаков к более простой и содержательной форме. Он базируется на предположении, что наблюдаемое поведение испытуемого может быть объяснено с помощью небольшого числа скрытых характеристик, называемых факторами.

В матричном виде работа методов факторного анализа может быть представлена как разбиение матрицы данных по столбцам на подматрицы, каждая из которых соответствует одной группе сильно коррелирующих признаков, т. е. исходный прямоугольник (рис.2а) разрезается на вертикальные полоски (рис.2b) так, что каждая полоска содержит информацию о всех испытуемых, но не по всем признакам, а только по группе сильно коррелирующих признаков.

a M b M c P







. . . . . . . . . . .

….


Черта i

. . . . . . . . . . .







N N N

Помимо разбиения матрицы данных на вертикальные полоски (группы сильно коррелирующих признаков), факторный анализ формирует новый обобщающий вертикальный столбец (комплексный признак-фактор), который в конденсированном виде содержит основную информацию об испытуемых по всем столбцам соответствующей полоски. Это сжатие может быть изображено как замена матрицы с большим числом столбцов на матрицу с малым числом столбцов, равным числу факторов (Р) и хорошо описывающим все столбцы исходной матрицы данных (рис.2с).


^ Обобщение данных путем группировки испытуемых (по строкам). Оно представляет собой группировку испытуемых по степени их близости в пространстве измеряемых признаков, т. е. на матрице данных выделяются группы похожих испытуемых.

Существуют два основных варианта постановки задачи группировки испытуемых: 1) группировка испытуемых на незаданные группы; 2) группировка испытуемых на заданные группы.

^ 1. Задача группировки испытуемых на незаданные группы (кластерный анализ). Этот вариант задачи формулируется следующим образом: имеется многомерное психологическое описание выборки испытуемых и требуется осуществить их разделение на однородные группы, т. е. такое разделение, при котором в составе выделенных групп оказались бы испытуемые, похожие по психологическим характеристикам. Такая постановка задачи группировки испытуемых соответствует интуитивным представлениям о типе личности.

Для решения этой задачи используются методы автоматической классификации «без учителя». Методы автоматической классификации разработаны в рамках математической теории распознавания образов и предназначены для анализа структуры взаимного расположения испытуемых в пространстве измеряемых признаков. Они позволяют производить объективную классификацию испытуемых по большому набору признаков и основываются на гипотезе «компактности». Если представить каждого испытуемого в виде точки в многомерном пространстве признаков, то естественно предположить, что геометрическая близость точек в этом пространстве указывает на похожесть соответствующих испытуемых.

Методы автоматической классификации «без учителя»дают возможность получать сокращенное описание распределения испытуемых путем выделения их скоплений в пространстве исследуемых признаков.

Под структурой множества испытуемых в этом случае понимается взаимное расположение этих скоплений, их размеры и число испытуемых в каждом скоплении. В результате разбиения множества испытуемых на типы, соответствующие скоплениям похожих испытуемых, получаем описание распределения испытуемых в терминах выделенных типов. В этом случае каждый испытуемый характеризуется уже не исходным набором признаков, а принадлежностью к тому или иному типу.

Таким образом, в результате автоматической классификации матрица данных (рис. 3а) разбивается по строкам на подматрицы, каждая из которых соответствует группе похожих между собой испытуемых (рис.3b). Это позволяет «сжать» информацию, представленную в исходной матрице данных, с большим числом строк и построить новую матрицу с меньшим количеством строк, равным числу выделенных типов испытуемых (рис. 3c).


a M b M c M







. . . . . .






Тип j

K

. . . . . .

N N


Если сравнить схемы на рисунках 2 и 3, то становится ясно, что, в отличие от методов факторного анализа, которые разбивают матрицу данных на вертикальные полоски, методы автоматической классификации производят разбиение матрицы данных на горизонтальные полоски. При этом каждая горизонтальная полоска соответствует одному типу испытуемых, представители которого являются близкими по значениям всего набора используемых признаков.

^ 2. Задача группировки испытуемых на заданные группы – дискриминантный анализ. При решении этой задачи предполагается, что имеются результаты психологического обследования нескольких групп испытуемых, и о каждом испытуемом заранее известно, к какой группе он принадлежит. Например, в задаче профотбора это могут быть группы хороших и плохих специалистов, при исследовании полового диморфизма – это испытуемые разного пола, при педагогических исследованиях – это группы школьников, различающихся по успешности обучения, дисциплинированности, общественной активности, возрасту и т. п.

Задача заключается в том, чтобы найти правило разбиения испытуемых на заданные группы по психологическим характеристикам.

В настоящее время для решения этой задачи с успехом используются алгоритмы обучения распознаванию образов с «учителем». Все они основываются на предположении, что существует такое многомерное пространство психологических характеристик, в котором точки, представляющие испытуемых одной группы, расположены кучно и «далеко» от точек, представляющих испытуемых другой группы.

В этом случае может быть построена простая поверхность, разделяющая испытуемых разных групп.

Для того чтобы найти разделяющую поверхность, выбирается некоторое количество испытуемых первой и второй групп (при классификации на две труппы) и проводится обучение программы. В результате программа формирует разделяющее правило (в виде уравнения разделяющей поверхности), с помощью которого можно по значениям психологических признаков определить, к какой группе принадлежит испытуемый. Это оказывается возможным, если каждой группе испытуемых соответствует своя область в многомерном пространстве психологических признаков, так как тогда группы хорошо разделяются сравнительно простыми поверхностями.

Таким образом, очевидно, что обе постановки задачи группировки испытуемых достаточно близки, ибо обе базируются на гипотезе «компактности».


^ Методы одновременного выделения черт и типов. В большинстве психологических исследований разрабатывается какой-либо один подход: на базе черт или типологический. Вместе с тем представляется перспективным их объединение. Объединение этих двух подходов предполагает одновременное выделение черт и типов. С этой целью могут быть использованы методы, основанные на использовании комбинации моделей факторного анализа и автоматической классификации.

В рамках данного подхода разработано два вида комбинаций совместного использования факторного анализа и автоматической классификации: прямая и обратная комбинации.

При прямой комбинации методами факторного анализа вначале производится группировка признаков, а затем с помощью методов автоматической классификации в каждой выделенной группе параметров осуществляется группировка испытуемых. В матричном виде прямая комбинация может быть изображена как разбиение матрицы данных вначале по столбцам, а затем разбиение каждой из подматриц по строкам.

При прямой комбинации мы получаем информацию о факторах и об особенностях распределения испытуемых по каждому фактору.

При обратной комбинации вначале используются методы автоматической классификации, и только после этого производится группировка признаков с помощью методов факторного анализа в каждом выделенном типе отдельно. Условно обратная комбинация может быть изображена, как разбиение матрицы данных вначале по строкам, а затем разбиение каждой из подматриц по столбцам.

В результате использования обратной комбинации методов факторного анализа и автоматической классиф
еще рефераты
Еще работы по разное