Реферат: Методы путевого анализа и их применение к системам одновременных уравнений
Содержание
Введение
Методыпутевого анализа и их применение к системам одновременных уравнений
1.Метод Райта путевогоанализа
2. Основная теоремапутевого анализа
3. ПроцедураСаймона-Блейлока
Заключение
Список используемойлитературы
Введение
Методы корреляций и регрессий создавались как методы описаниясовместных изменений двух и более переменных. Совместные измененияпеременных могут не означать наличия причинных связей между ними.Потребность в причинном объяснении корреляции привела американскогогенетика С. Райта к созданию метода путевого анализа (1910—1920) как одного из разновидностей структурного моделирования. Путевойанализ основан на изучении всей структуры причинных связей между переменными, т. е. на построении графа связей иизоморфной ему рекурсивной системыуравнений. Его основным положениемявляется то, что оценки стандартизированных коэффициентов рекурсивной системы уравнений, которыеинтерпретируются как коэффициентывлияния (путевые коэффициенты), рассчитываютсяна основе коэффициентов парной корреляции. Это позволяет проанализировать структуру корреляционной связи с точки зрения причинности. Каждый коэффициент парнойкорреляции рассматривается как мераполной связи двух переменных.
Путевой анализ позволяет разложить величину этого коэффициента на четырекомпоненты.
Таким образом, путевой анализ С. Райта, так же как и структурныемодели, позволил прояснить проблему ложной корреляции, которой занималисьмногие видные статистики, начиная с К. Пирсона (1857-1936).
Методы путевого анализа и их применение к системамодновременных уравнений
1. Метод Райта путевого анализа
Метод путевого анализа (или путевых коэффициентов) предложен в 20-х гг. XX в. американскимгенетиком С. Райтом. Сегодня этот методнашел широкое применение в биометрии построении социологическихпричинных моделей, но все еще остается малознакомым экономистам. Основные положения метода сводятся к следующему.Пусть x1, x2, ...., xp— случайные переменные, измеренные всоответствующих единицах. Основным предположениемметода является предположение об аддитивности и линейности связей междупеременными. (1)
Здесь xui— символ неизмеримогоимплицитного фактора ui, действующего на хi, и обозначающего действие на хi всех переменных, не включенных во множество {xj}; gij — некоторые константы; giu— коэффициент влияния xuiна xi.
Будемназывать xj<sub/>j-йпричиной, а хi — следствием комбинированного действия всех m-причин. Использование линейных зависимостей между всемипеременными делает р-анализ специальнымслучаем регрессионного анализа, в котором коэффициенты регрессииинтерпретируются в терминах причинно-следственных отношений.
Соотношение(1) можно записать также в виде (2)
где xj – среднее значение j-й переменной
Без потери общности можно допустить, что xiuимеет нулевое среднее и единичнуюдисперсию. В стандартизованной форме уравнение (2) будет иметь вид: (3)
где, Sj – стандартное отклонениеj-й переменной.
Тогда pij = (sj/si)cij.
Коэффициенты cijявляются специальным типом частных коэффициентоврегрессии. Коэффициент pijявляется стандартизованным коэффициентом p-регрессии. Будем называть pijкоэффициентом влияния (согласно С. Райту), понимая приэтом, что pijесть числовая величина, которая измеряет долюстандартного отклоненияi-й эндогенной переменной(следствия) с соответствующим знаком,обусловленную влиянием j-йэкзогенной переменной (причины) в том смысле, что если произвести измерениеэтого влияния при изменении j-йпеременной в тех же условиях, что и в данных наблюдениях и при неизменныхпрочих условиях (включая постоянное воздействие фактора xij), то полученный результатбудет равен pij. (4)
В формуле (4)si.12…(j-1)(j+1)…p.u показывает стандартноеотклонение i-йпеременной с учетом влияния переменных от, 1 до (j-1) и от (j+1) до p при постоянном влияниифактора u.
Из данного определения следует, что квадрат p-коэффициента показывает, какаячасть общей вариации следствия определяется j-й причиной. Эта величинапредставляет собой коэффициент детерминации: dxij<sub/> = p2ij.
Относительноимплицитных переменных xuiзаметим, что фактор xui, представляющий постоянноевоздействие на следствие xiпеременных, не включенныхявным образом в модель, считается некоррелированнымни с другими аналогичными факторами xu, ни с экзогеннымипеременными (входами или причинами) системы xj.
Входом системы называют переменную xj, прикоторой ее вариация целиком и полностью определяется фактором xuj, т. е. pjuj<sub/>= 1, djuj = 1. Входы системы могут быть коррелированы попарно.
Простейшим случаем является модель звена линейной причинной цепи, т. е.детерминации следствия y, всего лишь одной переменной — причиной x. Уравнение этой модели вформе линейной регрессии будет иметь вид(для стандартизованных переменных): (5)
Систему (5)можно представить в виде графа связей (рис.1). Встает вопрос об оценкекоэффициентов pyx, pyu2.Коэффициент корреляции случайных переменных xи yкак первый смешанныймомент нормированных случайных величин определяетсясоотношением
так как cov(x, x)= 1, cov(x, xu)= 0 по условию онекоррелированности имплицитных факторов.Но, как известно, в данном частном случае ryx=byx, где byx — стандартизованныйкоэффициент линейной регрессии. Таким образом, p-коэффициент (рyx )естьстандартизованный регрессионный коэффициент byx, и его оценка методом наименьших квадратов будет являтьсяоценкой эффективности влияния по С. Райту (рис.1 и 2).
Прямая оценка влияний неизмеримых факторов хиневозможна,поэтому ее получают косвенным образом из соотношений для коэффициентов детерминации. Вслучае модели (5) оценку коэффициента pyu2, можно получить следующимобразом. Соотношение полной детерминации упосредством хи u2имеет вид: r2yy<sub/>= p2yx<sub/>+ p2yu2 = 1,
Откуда pyu2 = √1-p2yx = √1-b2yx<sub/> = √1-r2yx .
Обобщение рассмотренной модели на случай n-звеннойлинейной цепи, а также случай к независимых причин xkодногои того же следствия у могут быть проведены индуктивно.
Широко распространена структурная модель системы с коррелированными входами(случай множества взаимодополняющих причин), изображенная на рис.2. Для этоймодели основное уравнение системызаписывается следующим образом: (6), акорреляция следствия с i-йпричиной определяется из соотношения (7)
Соотношение(7) демонстрирует важную особенность коэффициента влияния Райта — он может бытькак больше, так и меньше соответствующегокоэффициента корреляции по абсолютной величине и не совпадать с ним по знаку.
Значения p-коэффициента заключены винтервале [-∞, ∞]. Положительное значение р- коэффициента указывает нато, что фактор xjвлияет на хi,- таким образом, что приизменении xjв одномнаправлении (допустим, увеличении) признак xi,- изменяетсяв этом же направлении. Отрицательное значение показывает, что хi, и xjизменяются противоположно.Знак коэффициента влияния получаетсяавтоматически в результате решения системы уравнений, связывающей rij<sub/>и pij. Содержательнаяинтерпретация коэффициентов влияния Райтакак показателей интенсивности влияния по дуге графа аналогичнаинтерпретации b-коэффициентов(как показателей сравнительной силывоздействия факторов) в обычных моделях множественной регрессии.
Выражение полной детерминации у посредством множества взаимокоррелированныхпричин {хj} имеет вид: (8)
Слагаемое называетсяпоказателем корреляционной детерминации.Квадрат множественного коэффициента корреляции (коэффициент множественнойдетерминации):
Такимобразом, метод p-коэффициентов позволяет найти наилучшую оценку множественнойкорреляции R2y*x1…xk.
Подчеркнем,что попарная корреляция входов в модели (8) неструктурируется. Между тем эта корреляция может быть как следствиемкоординированного изменения двух различных взаимонезависимых причин —истинной корреляцией, так и ложной — результатом воздействия третьей переменной— общей для этих двух переменных причины.
Пусть на рис.3аизображен граф модели, истинность корреляциивходов которой находится под вопросом. Г. Саймон показал, что если корреляция x1и x2являетсяложной в отмеченном смысле, то частный коэффициент корреляции первого порядка rx1x2*zгде z— общая для х1и х2причина — должен быть равен нулю.
В самом деле,для такой модели (сравните граф на риc.3б с рис.3а)будут справедливы следующие отношения:
2.Основная теорема путевого анализа
Первым этапом путевого анализа является идентификация уравненийсистемы.
В современной эконометрической литературе идентификация понимается какструктурная спецификация модели, призванная не только определить значенияпараметров, но и выделить одну-единственную итоговую структурнуюмодель анализируемых данных.
Проблема идентифицируемости в системе структурных уравнений связана с наличиемдостаточного числа ограничений, накладываемых на него моделью. Применительно к p-анализу — это проблемасоответствия между количеством возможных соотношений между rijи pijи числом pij.
Иначе говоря,проблема идентифицируемости структурных параметров — это проблема достаточностиэмпирических данных для оценки всех коэффициентов модели. Необходимым условиемидентифицируемости уравнения является отсутствие среди линейных комбинаций оставшихся уравнений, таких, которые удовлетворялибы всем ограничениям модели, накладываемым на исследуемое уравнение.
Это эквивалентно так называемому условию порядка: для того чтобыуравнение в системе из т линейных структурных уравнений былоидентифицируемо, необходимо, чтобы в нем отсутствовало по меньшей мере т —1 переменных из т + к переменных, встречающихся в модели.Обозначим через т число эндогенных переменных в модели, к — числопредопределенных переменных, h— число эндогенных переменных в рассматриваемомуравнении, g— число предопределенных переменных в рассматриваемом уравнении. Тогда условие порядка можетбыть записано в форме т+к — h— g> m— 1 или к — g> h— 1.
Структурное уравнение называется идентифицируемым, если оноудовлетворяет условию порядка; в случае точного равенства уравнение называетсяточно идентифицируемым, при строгом неравенстве — сверхидентифицируемым.
Следующимэтапом является оценивание структурных параметров. Для структурных моделей,построенных на основе p-коэффициентов, оценка pijпроизводитсяне методом наименьших квадратов, а с помощью такого приема. Запишемуравнение (3)следующим образом: или иначе (9)
Используем коэффициенты корреляции между зависимой переменной и каждой изобъясняющих переменных: (10)
где n- число наблюдений.
Подставляя в(10) вместо xiправую часть выражения (10), получим: (11)
В этом преобразовании учтено, что корреляция ui, схj по определению равна нулю. Еслиучесть, что rij=1, то соотношение (11), называемое основной теоремойпутевого анализа, можно записать так: (12)
Здесь j указывает на объясняющуюпеременную, связь которой с объясняемой переменной i раскрывается вструктурной модели, к пробегает поподмножеству всех переменных, непосредственновлияющих на i-ю переменную (на графе этивершины связаныс вершиной iдугами). Соотношение (12) справедливо для любой рекурсивной системы.
Путевой анализ позволяет произвести декомпозицию корреляцииrij. Введемпонятия «полная (совокупная) связь», «совокупное влияние», «прямое влияние», «косвенноевлияние». Если коэффициент корреляциинулевого порядка rijрассматривать как измеритель полной связи двухпеременных, то мерой совокупного влияния j-й переменной на i-ю переменную (qij) будет являться еечасть, не зависящая ни от общих для них переменных — причин, ни от корреляции между общими для j-й и i-йпеременных причинами (компоненты ложной корреляции), ни от наличия не анализируемой в моделиаприорной корреляции предопределенных переменных — входов.
Такимобразом, мы можем разложить полную связь двух переменных на четыре составляющие с учетом постулируемой в модели асимметрии воздействия: на совокупное влияние(причинное влияние) j-йпеременной на i-ю, на две компоненты,измеряющие эффект ложной корреляции, и на компоненту, еще неимеющую общепринятого названия. В свою очередь, совокупное влияниеможет быть разложено на две составляющие с учетом того, каким образом оноосуществляется — непосредственно или через другие переменные.
Прямое влияние одной переменной на другую измеряетсякоэффициентомpij; в этом случае вцепи между объясняющей и объясняемойпеременными нет промежуточных звеньев. Косвенное влияние —это влияние тех составляющих совокупного влияния одной переменной на другую,которое образуется при учете эффекта передачи воздействия через посредствопеременных, специфицированных в модели как промежуточные звенья в причинной цепи, связывающей изучаемые переменные.Поскольку строение совокупного влияния всецело зависит от постулируемой причинной структуры отношений между переменными,то и все введенные выше понятия имеют смысл только лишь по отношению к причинной модели с заданным графом связей.
3.Процедура Саймона-Блейлока
Структурныепричинные модели в эконометрике и социологиисоединяют теорию объекта с эмпирическими данными на основе графа связей. Структурные модели формализуютгипотезы о причинных отношениях. Встает задача выбора гипотез, обозначаемая иногда в эконометрической исоциологической литературе как проблема каузального вывода. Х.Блейлок, изучаяэтот вопрос как часть общего вопроса о средствах построениясоциологических теорий, предложил формальный прием, основанный на идеях Г.Саймона о ложной корреляции и каузальнойупорядоченности, иногда называемый процедурой Саймона — Блейлока.
Формальное содержание этого подхода заключается в гипотезе о полностьюспецифицированной линейной рекурсивной причинноймодели, оценке ее параметров, а затем использовании этих значений длявоспроизведения эмпирической корреляционной матрицы. Основная идея процедуры —это положение о том, что модель, которая невоспроизводит эмпирических корреляций, должна быть отвергнута.
Очевиднацелесообразность использования процедуры Саймона — Блейлока в двух случаях. Во-первых,когда известен причинный приоритет средипеременных. Если в этом случае имеютсядве гипотезы, постулирующие различные причинные цепи (структуры графа),то, используя процедуру Саймона — Блейлока, можно воссоздать эмпирическиекорреляции и отвергнуть ту каузальную цепь,где рассогласование слишком большое. Таким образом, мы можем сравнивать теории.
Второй ситуацией является случай с неизвестнымкаузальным приоритетом среди переменных. Допустим, что мы имеем наборпеременных, для которых не известен каузальный порядок причина-следствие, иимеются две гипотезы, каждая по-своему устанавливающая его, постулируяотсутствие тех или иных возможных отношений. Описываемый подходможет быть применен как для сравнения этих теорий, так и для ихотбрасывания. Заметим, что в процедуре сравнения одна модель-гипотеза может оказатьсялучше другой, но никогда — правильной. Болеетого, если одна из гипотез близка к тому, чтобы описываться полной рекурсивнойсистемой, то обычно она работает, лучшевоспроизводя корреляционную матрицу, и, естественно, будет выбиратьсякак более удачная, даже если она весьма далека от истины.
ПроцедураСаймона — Блейлока является формальным приемом,создающим базис для отвергания гипотез, но никоим образом непредставляет собой процедуру для создания новых теорий.
Другимизвестным приемом является вычеркивание связей в чрезмерно связанном графе сцелью изучения поведения системы и ееэлементов в новых условиях. Устойчивость системы может означать верность гипотезы. Решение обуничтожении той или иной связи модели может быть принято или на основаниикритерия статистической значимости, или на основании произвольноустановленного порогового критерия величины коэффициента причинного влияния.Проверкой правильности гипотез и корректностимодели должно служить ее подтверждение при испытаниях на контрольных данных.
Использование p-анализав социально-экономических исследованиях связано с рядом трудностей. Прежде всего не всегда можно считать, что линейная зависимость всостоянии удовлетворительно отразить все разнообразиепричинно-следственных связей в реальныхструктурах. Кроме того, следует учитывать, что р-анализ разработан для количественных переменных. Структурные модели и путевой анализ иллюстрируют единствотеоретического (качественного) и формально-математического (количественного) подходов. Значимость результатов анализаопределяется в первую очередьправильностью построения логического каркаса структурной модели —максимально связанного графа связей, изоморфной математической модели в видесистемы уравнений.
Заключение
В данном реферате былрассмотрен метод Райта, который нашёл широкое применение в биометрии,построении социологических причинных моделей.
Путевой анализ можноразделить на несколько этапов.
Первым этапом путевогоанализа является идентификация уравнений системы. Под идентификацией понимаетсяструктурная спецификация модели, призванная выделить одну-единственную итоговуюструктурную модель анализируемых данных.
Следующим этапом являетсяоценивание структурных параметров.
Структурныепричинные модели в эконометрике и социологиисоединяют теорию объекта с эмпирическими данными на основе графа связей. Структурные модели формализуютгипотезы о причинных отношениях. Встает задача выбора гипотез, обозначаемая иногда в эконометрической исоциологической литературе как проблема каузального вывода. Х.Блейлок, изучаяэтот вопрос как часть общего вопроса о средствах построениясоциологических теорий, предложил формальный прием, основанный на идеях Г.Саймона о ложной корреляции и каузальнойупорядоченности, иногда называемый процедурой Саймона — Блейлока.
Формальное содержание этого подхода заключается в гипотезе о полностьюспецифицированной линейной рекурсивной причинноймодели, оценке ее параметров, а затем использовании этих значений длявоспроизведения эмпирической корреляционной матрицы. Основная идея процедуры —это положение о том, что модель, которая невоспроизводит эмпирических корреляций, должна быть отвергнута.
Путевой анализ Райтапозволил прояснить проблему ложной корреляции, которой занимались многиестатистики.
Используемаялитература
1. Айвазян С.А., Мхитарян В.С.Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998
2. Дубров А.М., Мхитарян В.С., ТрошинЛ.И. Многомерные статистические методы.- М.: Финансы и статистика,1998
3. Елисеева И.И… –М: Финансы истатистика,2001
4. Ферстер Э., Ренц Б. Методыкорреляционного и регрессионного анализа.- М.: Финансы и статистика, 1983