Реферат: Методы решения уравнений линейной регрессии
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕУЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
ФИЛИАЛ В Г. ЛИПЕЦКЕ
Контрольная работа
по эконометрике
Липецк, 2009 г.
Задача
По предприятиям легкойпромышленности региона получена информация, характеризующая зависимость объемавыпуска продукции (Y, млн.руб.) отобъема капиталовложений (Х, млн.руб.)
Y 31 23 38 47 46 49 20 32 46 24 Х 38 26 40 45 51 49 34 35 42 24Требуется:
1. Найти параметрыуравнения линейной регрессии, дать экономическую интерпретацию коэффициентарегрессии.
2. Вычислитьостатки; найти остаточную сумму квадратов; оценить дисперсию остатков />; построить графикостатков.
3. Проверитьвыполнение предпосылок МНК.
4. Осуществитьпроверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (α=0,05).
5. Вычислитькоэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (α=0,05), найтисреднюю относительную ошибку аппроксимации. Сделать вывод о качестве.
6. Осуществитьпрогнозирование среднего значения показателя Y при уровне значимости α=0,01 при Х=80% от егомаксимального значения.
7. Представитьграфически фактических и модельных значений Y, точки прогноза.
8. Составитьуравнения нелинейной регрессии:
· Гиперболической;
· Степенной;
· Показательной.
Привести графикипостроенных уравнений регрессии.
9. Для указанных моделейнайти коэффициенты детерминации, коэффициенты эластичности и средние относительныеошибки аппроксимации. Сравнить модели по этим характеристикам и сделать вывод.
Решение
1. Уравнение линейной регрессииимеет вид:
/>= а0+ а1x.
Построим линейную модель.
Для удобства выполнениярасчетов предварительно упорядочим всю таблицу исходных данных по возрастаниюфакторной переменной Х (Данные => Сортировка). ( рис. 1).
/>
Рис.1
Используем программуРЕГРЕССИЯ и найдем коэффициенты модели (рис.2)
/>
Рис.2
Коэффициенты моделисодержатся в таблице 3 (столбец Коэффициенты).
Таким образом, модельпостроена и ее уравнение имеет вид
Yт = 12,70755+0,721698Х.
Коэффициент регрессии b=0,721698, следовательно, приувеличении объема капиталовложений (Х) на 1 млн руб. объем выпуска продукции (Y) увеличивается в среднем на 0,721698млн руб.
2. Вычислитьостатки; найти остаточную сумму квадратов; оценить дисперсию остатков S²e; построить график остатков.
Остатки содержатся встолбце Остатки итогов программы РЕГРЕССИЯ (таблица 4).
Программой РЕГРЕССИЯнайдены также остаточная сумма квадратов SSост=148,217 и дисперсия остатков MS=18,52712 (таблица 2).
Для построения графикаостатков нужно выполнить следующие действия:
· Вызвать МатерДиаграмм, выбрать тип диаграммы Точечная (с соединенными точками).
· Для указанияданных для построения диаграммы зайти во вкладку Ряд, нажать кнопку Добавить; вкачестве значений Х указать исходные данные Х (таблица 1); значения Y — остатки (таблица 4).
/>
Рис.3 График остатков
3. Проверить выполнение предпосылок МНК.
Предпосылками построенияклассической линейной регрессионной модели являются четыре условия, известныекак условия Гаусса-Маркова.
· В уравнениилинейной модели Y=a+b*X+ε слагаемоеε — случайная величина, которая выражает случайный характер результирующейпеременной Y.
· Математическоеожидание случайного члена в любом наблюдении равно нулю, а дисперсия постоянна.
· Случайные членыдля любых двух разных наблюдений независимы (некоррелированы).
· Распределениеслучайного члена является нормальными.
1) Проведем проверкуслучайности остаточной компоненты по критерию повторных точек.
Количество повторныхточек определим по графику остатков: p=5
Вычислим критическоезначение по формуле:
/>.
При/> найдем />
Схемакритерия:
/>
Сравним/>, следовательно, свойствослучайности для ряда остатков выполняется.
1. Равенствонулю математического ожидания остаточной компоненты для линейной модели,коэффициенты которой определены по МНК, выполняется автоматически. С помощьюфункции СРЗНАЧ для ряда остатков можно проверить: />.
Свойствопостоянства дисперсии остаточной компоненты проверим по критериюГольдфельда–Квандта.
Вупорядоченных по возрастанию переменной Xисходных данных (/>) выделим первые4 и последние 4 уровня, средние 2 уровня не рассматриваем.
Спомощью программы РЕГРЕССИЯ построим модель по первым четырем наблюдениям(регрессия-1), для этой модели остаточная сумма квадратов />.
Дисперсионный анализ df SS MS F Значимость F Регрессия 1 107,7894737 107,7894737 15,67347 0,15751 Остаток 1 6,877192982 6,877192982 Итого 2 114,6666667Спомощью программы РЕГРЕССИЯ построим модель по последним четырем наблюдениям(регрессия-2), для этой модели остаточная сумма квадратов />.
Дисперсионный анализ df SS MS F Значимость F Регрессия 1 4,166666667 4,166666667 0,186916 0,707647 Остаток 2 44,58333333 22,29166667 Итого 3 48,75Рассчитаемстатистику критерия:
/>.
Критическоезначение при уровне значимости />и числахстепеней свободы /> составляет />.
Схемакритерия:
/>
Сравним/>, следовательно, свойствопостоянства дисперсии остатков выполняется, модель гомоскедастичная.
2. Дляпроверки независимости уровней ряда остатков используем критерийДарбина–Уотсона
/>.
Предварительнопо столбцу остатков с помощью функции СУММКВРАЗН определим />; используем найденнуюпрограммой РЕГРЕССИЯ сумму квадратов остаточной компоненты />.
Такимобразом,
/>
Схемакритерия:
/>
Полученноезначение d=2,375, чтосвидетельствует об отрицательной корреляции. Перейдем к d’=4-d=1,62и сравним ее с двумя критическими уровнями d1=0,88и d2=1,32.
D’=1,62 лежит в интервале от d2=1,32до 2, следовательно, свойство независимости остаточной компоненты выполняются.
/>
Спомощью функции СУММПРОИЗВ найдем для остатков />, следовательно r(1)=2,4869Е-14/148,217=1,67788Е-16.
Критическоезначение для коэффициента автокорреляции определяется как отношение />Önи составляет для данной задачи />
Сравненияпоказывает, что çr(1)=1,67788Е-16<0,62, следовательно, ряд остатков некоррелирован.
4)Соответствие ряда остатков нормальному закону распределения проверим с помощью />критерия:
/>.
Спомощью функций МАКС и МИН для ряда остатков определим />, />. Стандартная ошибка моделинайдена программой РЕГРЕССИЯ и составляет />.Тогда:
/>
Критическийинтервал определяется по таблице критических границ отношения /> и при /> составляет (2,67; 3,57).
Схемакритерия:
/>
2,995/> (2,67; 3,57), значит, дляпостроенной модели свойство нормального распределения остаточной компонентывыполняется.
Проведеннаяпроверка предпосылок регрессионного анализа показала, что для моделивыполняются все условия Гаусса–Маркова.
4.Осуществить проверку значимости параметров уравнения регрессии с помощью t–критерияСтьюдента (/>).
t–статистика для коэффициентовуравнения приведены в таблице 4.
Длясвободного коэффициента /> определенастатистика />.
Длякоэффициента регрессии /> определенастатистика />.
Критическоезначение /> найдено для уравнениязначимости /> и числа степеней свободы /> с помощью функцииСТЬЮДРАСПОБР.
Схемакритерия:
/>
Сравнениепоказывает:
/>, следовательно,свободный коэффициент aявляется значимым.
/>, значит,коэффициент регрессии bявляется значимым.
5.Вычислить коэффициент детерминации, проверить значимость уравнения регрессии спомощью F–критерия Фишера (/>), найти среднююотносительную ошибку аппроксимации. Сделать вывод о качестве модели.
Коэффициентдетерминации R–квадрат определенпрограммой РЕГРЕССИЯ и составляет />.
Такимобразом, вариация объема выпуска продукции Yна 79,5% объясняется по полученному уравнению вариацией объема капиталовложенийX.
Проверимзначимость полученного уравнения с помощью F–критерияФишера.
F–статистика определена программой РЕГРЕССИЯ(таблица 2) и составляет />.
Критическоезначение /> найдено для уровня значимости/> и чисел степеней свободы />, />.
Схемакритерия:
/>
Сравнениепоказывает: />; следовательно, уравнениемодели является значимым, его использование целесообразно, зависимая переменнаяY достаточно хорошо описываетсявключенной в модель факторной переменной Х.
Длявычисления средней относительной ошибки аппроксимации рассчитаем дополнительныйстолбец относительных погрешностей, которые вычислим по формуле
/>
спомощью функции ABS (таблица 5).
ВЫВОД ОСТАТКА
Наблюдение Предсказанное Y Остатки Отн. Погр-ти 1 27,14150943 6,858490566 20,17% 2 29,30660377 -3,306603774 12,72% 3 30,02830189 -6,028301887 25,12% 4 35,08018868 2,919811321 7,68% 5 35,80188679 -0,801886792 2,29% 6 40,13207547 -0,132075472 0,33% 7 45,90566038 -3,905660377 9,30% 8 45,90566038 5,094339623 9,99% 9 46,62735849 -1,627358491 3,62% 10 48,07075472 0,929245283 1,90%Постолбцу относительных погрешностей найдем среднее значение /> (функция СРЗНАЧ).
Схемапроверки:
/>
Сравним:9,31% < 15%, следовательно, модель является точной.
Вывод:на основании проверки предпосылок МНК, критериев Стьюдента и Фишера и величиныкоэффициента детерминации модель можно считать полностью адекватной. Дальнейшееиспользование такой модели для прогнозирования в реальных условияхцелесообразно.
6.Осуществить прогнозирование среднего значения показателя Yпри уровне значимости />, если прогнозноезначение фактора X составит 80% отего максимального значения.
Согласноусловию задачи прогнозное значение факторной переменной Х составит 80% от 49,следовательно, />. Рассчитаем поуравнению модели прогнозное значение показателя У:
/>.
Такимобразом, если объем капиталовложений составит 39,2 млн. руб., то ожидаемыйобъем выпуска продукции составит около 48 млн. руб.
Зададимдоверительную вероятность /> ипостроим доверительный прогнозный интервал для среднего значения Y.
Дляэтого нужно рассчитать стандартную ошибку прогнозирования:
/>
Предварительноподготовим:
— стандартную ошибку модели /> (Таблица2);
— по столбцу исходных данных Х найдем среднее значение /> (функция СРЗНАЧ) иопределим /> (функция КВАДРОТКЛ).
Следовательно,стандартная ошибка прогнозирования для среднего значения составляет:
/>
При/> размах доверительногоинтервала для среднего значения
/>
Границамипрогнозного интервала будут
/>
/>
Такимобразом, с надежностью 90% можно утверждать, что если объем капиталовложенийсоставит 39,2 млн. руб., то ожидаемый объем выпуска продукции будет от 45,3млн. руб. до 50,67 млн. руб.
7.Представить графически фактические и модальные значения Yточки прогноза.
Дляпостроения чертежа используем Мастер диаграмм (точечная) – покажем исходныеданные (поле корреляции).
Затемс помощью опции Добавить линию тренда… построим линию модели:
тип→ линейная; параметры → показывать уравнение на диаграмме.
Покажемна графике результаты прогнозирования. Для этого в опции Исходные данныедобавим ряды:
Имя→ прогноз; значения />; значения/>;
Имя→ нижняя граница; значения />; значения/>;
Имя→ верхняя граница; значения />;значения />
/>
8.Составить уравнения нелинейной регрессии: гиперболической; степенной;показательной.
8.1 Гиперболическая модель
Уравнение гиперболическойфункции:
/>= a + b/x.
Произведем линеаризациюмодели путем замены X = 1/x. В результате получим линейноеуравнение
/>= a + bX.
Рассчитаем параметрыуравнения по данным таблицы 2.
b =/> =/>
а = /> =38,4+704,48*0,03=60,25.
Получим следующееуравнение гиперболической модели:
/> = 60,25-704,48/х.
8.2 Степенная модель
Уравнение степенноймодели имеет вид: />=аxb
Для построения этой моделинеобходимо произвести линеаризацию переменных. Для этого произведемлогарифмирование обеих частей уравнения:
lg />= lg a + b lg x.
Обозначим через
Y=lg />, X=lg x, A=lg a.
Тогда уравнение приметвид: Y = A + bX –линейное уравнение регрессии. Рассчитаем его параметры, используя данныетаблицы 3.
b = /> =/>
A = /> = 1,57-0,64*1,53=0,59
Уравнение регрессии будетиметь вид: Y = 0,59+0,64* Х.
Перейдем к исходным переменнымx и y, выполнив потенцирование данного уравнения.
/>= 100,59* х0,64.
Получим уравнениестепенной модели регрессии:
/>= 3,87* х0,64.
8.3 Показательная модель
Уравнение показательнойкривой: />=abx.
Для построения этоймодели необходимо произвести линеаризацию переменных. Для этого осуществимлогарифмирование обеих частей уравнения:
lg /> = lg a + x lg b.
Обозначим: Y = lg />, B = lg b, A = lg a. Получим линейное уравнение регрессии: Y = A + B x. Рассчитаем его параметры, используяданные таблицы 4.
В =/> =/>
А =/> = 1,57-0,01*35,6=1,27
Уравнение будет иметьвид: Y = 1,27+0,01х.
Перейдем к исходнымпеременным x и y, выполнив потенцирование данного уравнения:
/>=101,27* ( 100,01)х= 18,55*1,02х.
Графики построенныхмоделей:
/>
Рис.3. Гиперболическая
/>
Рис.4. Степенная
/>
Рис.5. Показательная
9. Сравнение моделей похарактеристикам: коэффициенты детерминации, коэффициенты эластичности и средниеотносительные ошибки аппроксимации. Вывод.
9.1 Гиперболическая модель
Коэффициент детерминации:
/>=/>
Вариация результата Y на 70,9% объясняется вариацией фактораХ.
Коэффициент эластичности:
/> =/> =0,05.
Это означает, что приувеличении фактора Х на 1 % результирующий показатель изменится на 0,05 %.
Бета-коэффициент:
Sx=/>=0,01Sy=/>=8,5/>60,25*0,01/8,5=0,07.
Т.е. увеличение объемакапиталовложений на величину среднеквадратического отклонения этого показателяприведет к увеличению среднего значения объема выпуска продукции на 0,07среднеквадратического отклонения этого показателя.
Средняя относительнаяошибка аппроксимации:
/>отн = 109,7/ 10= 10,97 %.
В среднем расчетныезначения /> для гиперболической моделиотличаются от фактических значений на 10,97%.
9.2 Степенная модель
Коэффициент детерминации:
/>=/>
Вариация результата Y на 73,6% объясняется вариациейфактора Х. Коэффициент эластичности:
/> =/> =0,57.
Это означает, что приувеличении факторного признака на 1 % результирующий показатель увеличится на0,57%.
Бета-коэффициент:
/>, Sy=/> иSx=/>.
Sx=/>=0,14Sy=/>=0,10/>0,59*0,14/0,1=0,78.
Т.е. увеличение объемакапиталовложений на величину среднеквадратического отклонения этого показателяприведет к увеличению среднего значения объема выпуска продукции на 0,78среднеквадратического отклонения этого показателя.
/>отн= /> = 93,77/10 = 9,34%.
В среднем расчетныезначения /> для степенной моделиотличаются от фактических значений на 9,34%.
9.3 Показательная модель
Коэффициент детерминации:
/>=/>
Вариация результата Y на 75,7% объясняется вариациейфактора Х. Коэффициент эластичности:
/> /> =28,71.
Это означает, что приросте фактора Х на 1 % результирующий показатель Y изменится на 28,71 %.
Бета-коэффициент:
Sx=/>=10,5Sy=/>=0,10/>1,27*10,5/0,10=129,10.
Т.е. увеличение объемакапиталовложений на величину среднеквадратического отклонения этого показателяприведет к увеличению среднего значения объема выпуска продукции на 129,1 среднеквадратическогоотклонения этого показателя.
/>отн= 91,9/ 10 = 9,19%.
В среднем расчетныезначения /> для показательной моделиотличаются от фактических значений на 9,19%.
Вывод
Лучшей из уравненийнелинейной регрессии является показательная: выше коэффициент детерминации,наименьшая относительная ошибка. Модель можно использовать для прогнозирования.