Реферат: Корреляционно-регрессионный анализ

Тема 6. Корреляционно-регрессионныйанализ


Цель: изучение видов взаимосвязей явлений (функциональная,корреляционная); видов корреляционной зависимости; способов определения теснотысвязи; усвоение смысла показателей регрессии.

После изучения высможете: определятьсилу тесноты связи между социально – экономическими показателями, даватьинтерпретацию параметров управления регрессии.

Информационные источники:

1. Курс теориистатистики: Учебник/Под ред. В.Н. Салина, Э.Ю. Чурикова. – М.: Финансы иСтатистика, 2006.

2. Годин А.М. Статистика:Учебник. – М.: Дашков и К’, 2008.

3. Статистика:Учебник/Под ред. И.И. Елисеевой. – М.: Крокус, 2008

4. Теория статистики:Учебник/Под ред. Г.П. Громыко. – М.: ИНФРА-М, 2000.

5. Галкина В.А. Статистика: Учебноепособие: М.: РГАЗУ,2002.

Содержание темы: исследование объективно существующихсвязей; количественные оценки тесноты связи; регрессионный анализ; показателитесноты связи (параметрические, ранговые).

 


Корреляционно–регрессионныйанализ

Пристатистических исследованиях корреляционных связей одной из главных задачявляется определение формы корреляционной связи, т.е. построение моделисвязи.

Дляаналитических целей корреляционную связь представляют при помощи математическихфункций, т.е. придают ей функциональную форму. Под формой связи понимаюттенденцию, которая проявляется в изменении результативного признака в связи сизменением признака-фактора.

Построение ианализ корреляционной модели связи осуществляются с помощьюкорреляционно-регрессионного анализа, который состоит из следующих этапов:

¾ предварительногоаприорного анализа;

¾ сбора информации и еепервичной обработки;

¾ построения модели(уравнения регрессии);

¾ оценки и анализамодели.

Все этапысвязаны между собой, границы их часто переплетаются и носят условный характер.

Формакорреляционной связи может быть выражена различными математическими функциями.Выбор формы связи решается на основе теоретического анализа существа изучаемыхявлений и исследования эмпирических данных.

Эмпирическоеисследование формы связи включает построение графиков корреляционных полей,эмпирических линий регрессии, а также анализ параллельных рядов. Изучениеэмпирического материала дает возможность установить направление и форму связи.

Дляопределения видов функции необходимо применять комплекс приемов: экономический,логический, графический и математический.

Линейная форма связи может быть выражена уравнением прямой:


yх=a0+a (1.8.1)

Нелинейнаяформа связи показана:

1) уравнениемпараболы второго порядка

 

ух=a0+a1х+а2 х2(1.8.2)

2) уравнениемгиперболы

 

yх=a0+/>(1.8.3)

3) показательнойфункцией

 

yх=a0+a(1.8.4)

4) степеннойфункцией

 

yх=a×/>(1.8.5)

и другимифункциями.

Главнойпроблемой при построении модели связи является определение вида аналитическойфункции, которая отразит механизм связи между факторным и результативнымпризнаками и даст количественную оценку этой связи.

Наиболеечасто для определения формы корреляционной связи используют уравнение прямой

 

yх=a0+a

где ух — теоретические значения результативного признака;


х — факторный признак;

а0 и а1, — параметры уравнения связи.

Уравнениемсвязи называется уравнение регрессии, а анализ, производимый с помощьюуравнения регрессии, называется регрессионным анализом.

Послеустановления вида функции для модели связи определяются параметры уравнениярегрессии а0 и а1. Параметры уравнения регрессии определяютсяметодом наименьших квадратов, суть которого состоит в том, что теоретическаялиния регрессии должна быть проведена так, чтобы сумма квадратов отклоненийэмпирических данных от теоретических была величиной минимальной. Исчисляя первыепроизводные по а0 и а1 от функции Σ(у -а0 –а1х)2 —>min и приравнивая их к нулю, получаем системунормальных уравнений вида:

(1.8.6)

  />

/>

Решая системунормальных уравнений, определяем параметры а0 и а1 :

/>

/>

/>

Параметр а1называетсякоэффициентом регрессии и показывает изменения результативногопризнака при изменении факторного признака на единицу. Параметр а0 неимеет экономического содержания, так как может принимать отрицательныезначения.

Очень частоисследуемые признаки имеют разные единицы измерения, поэтому для оценки влиянияфакторного признака на результативный применяется коэффициент эластичности.Он вычисляется для каждой точки и в среднем для всей совокупности.

Теоретическийкоэффициент эластичности вычисляют по формуле:

/> (1.8.7)

где /> - перваяпроизводная уравнения регрессии ух

Средний коэффициент эластичности для уравнения прямой вычисляетсятак:

/>

Коэффициентэластичности показывает, на сколько процентов изменяется результативный признакпри изменении факторного признака на один процент.

Рассмотримрасчет параметров уравнения прямой в табл. 1.8.1.

корреляционныйрегрессионный дисперсия


Таблица 1.8.1

Основные фонды и выпуск продукции 44 предприятий

Исходные данные Расчетные данные Номер предприятия

Среднегодовая стоимость основных производственных фондов (х), м

Выпуск продукции (у), тыс. т

ху

х2

ух

(у-ух)2

(у-/>)2

(х-/>)2

1 11,6 1,4 16,24 134,56 3,24 3,39 24,01 630,01 2 23,3 3,6 83,88 542,89 4,65 1,1 7,29 179,56 … … … … … … … … … 44 30,0 8,0 240,0 64,0 5,44 6,55 2,89 44,89 Итого 1615 277 11792 72675 277 251,2 449,16 13337,1 В среднем 36,7 6,3 5,66 10,2 303,11

Предположим,что форму связи между размером фондов и объемом произведенной продукции можновыразить в виде уравнения прямой:

 

yх=a0+a

где ух — выпускпродукции;

х — основные фонды.

Дляопределения параметров уравнения регрессии построим систему нормальныхуравнений (1.8.6). Для решения системы вычислим значения Σу, Σхх2, Σ ух (см. табл. 1.8.1).

Система нормальных уравнений имеет вид:

277 — 44ао+1615а1;

11792 — 1615ао+ 72675а1.

Решая системунормальных уравнений, определим значения а0 и а1:

а0 = 1,84; а1 = 0,12.

Уравнениерегрессии, характеризующее зависимость произведенной продукции от основныхфондов, имеет вид:

ух = 1,84+ 0,12 х.

Параметр а1= 0,12 показывает, что с ростом основных фондов на 1 тыс. руб. объемпроизведенной продукции увеличится на 0,12 т.

Вычислимкоэффициент эластичности (по формуле 1.8.8):

Э=0,12´(36,7 / 6,3) = 0,7

Коэффициентэластичности показывает, что с ростом основных фондов на 1% объем произведеннойпродукции увеличится на 0,7%.

Подставляя вуравнение регрессии значения факторного признака, найдем теоретические значенияобъема произведенной продукции ух (см. табл. 1.8.1).

Уравнениерегрессии имеет практическое значение. Сравнивая фактический объем продукции уотдельных предприятий с теоретическим, мы получаем возможность его оценки сточки зрения средних условий существующих в данной совокупности предприятий.Регрессионную модель можно использовать для прогноза выпуска продукции взависимости от изменения основных фондов тогда, когда не изменяются условияформирования уровней исследуемого признака.

Измерениетесноты корреляционной связи. Важное место в анализе регрессионной модели занимает оценкатесноты корреляционной связи между изучаемыми признаками.

Для измерения тесноты корреляционной связи между признаками прилинейной форме связи применяется линейный коэффициент корреляции:

/> (1.8.9)

Он изменяетсяв пределах от -1 до +1 и показывает тесноту и направление корреляционной связи.Чем ближе коэффициент корреляции к 1 (по модулю), тем связь теснее.Отрицательное значение свидетельствует об обратной связи между признаками.Коэффициент корреляции можно вычислять и по формулам:

/> (1.8.10

/> (1.8.11)

При любойформе связи для измерения тесноты корреляционной связи применяются теоретическоекорреляционное отношение и индекс корреляции. Теоретическоекорреляционное отношение определяется по формуле:

/> (1.8.12)

, где ή — теоретическое корреляционное отношение.

Факторнаядисперсия, характеризующаявариацию результативного признака под влиянием вариации признака-фактораопределяется по следующей формуле:

/>

 

Общая дисперсия, характеризующая вариацию результативно- го признака под влияниемвсех факторов, вызывающих эту вариацию, определяется по формуле

/>


Представиминдекс корреляции:

/> (9.13)

Остаточнаядисперсия, характеризующаявариацию результативного признака под влиянием прочих неучтенных факторов,определяется по формуле

/>

Индекскорреляции и теоретическое корреляционное отношение изменяются от 0 до 1 ипоказывают не только тесноту связи, но и степень пригодности подобранныхфункций связи.

ή, Rназываютсякоэффициентами детерминации, которые показывают долю вариации результативногопризнака под влиянием вариации признака-фактора. Коэффициент детерминациииспользуют в качестве критерия оценки подбора наилучшей модели связи.

Показателитесноты корреляционной связи используются не только для оценки уже построенноймодели связи (уравнения регрессии), но и для выбора оптимального варианта формысвязи. Если теоретический анализ не дает возможности дать однозначный ответ оформе связи, то необходимо строить уравнения регрессии с различными формамисвязи — линейные и нелинейные. Оценка пригодности модели связи осуществляетсяпутем анализа коэффициента детерминации или индекса корреляции. Наилучшейсчитается модель с наибольшими значениями этих показателей.

При линейнойформе связи теоретическое корреляционное отношение и линейный коэффициенткорреляции равны.

Измеримтесноту корреляционной связи между основными фондами и выпуском продукциилинейным коэффициентом и индексом корреляции (формулы (1.8.11), (1.8.13)).

Необходимыедля расчета этих показателей данные представлены в табл. 1.8.1.

а1, =0,12;

/> =10,2;

σу =/>= 3,19;

/>=5,66;

/>

r=0.12×(17,41 / 3,19) = 0,66

/>

Всеисчисленные показатели показывают тесную корреляционную связь между основнымифондами и выпуском продукции. Коэффициент детерминации R2 = 0,44 свидетельствует о том, что вариация выпуска продукциина 44% объясняется вариацией основных фондов, а на 56% прочими факторами.

Так каклинейный коэффициент корреляции равен индексу корреляции, можно сделатьзаключение, что связь между основными фондами и выпуском продукции линейная,т.е. форма связи подобрана правильно.

еще рефераты
Еще работы по экономике