Реферат: Линейный множественный регрессивный анализ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННАЯ ТЕХНОЛОГИЧЕСКАЯАКАДЕМИЯ

КафедраПМиИОЭ

Контрольная работа

по курсу

Эконометрика

(вариант 8)


Задача 1

 

В исходной таблице(вариант 8) представлены статистические данные о размерах жилой площади истоимости квартир:

Жилая площадь, х Цена кв., у 20 15,9 40,5 27 16 13,5 20 15,1 28 21,1 46,3 28,7 45,9 27,2 47,5 28,3 87,2 52,3 17,7 22 31,1 28 48,7 45 65,8 51 21,4 34,4

 

Требуется:

1.  Построить поле корреляции исформулировать гипотезу о виде уравнения регрессии (линейное, показательное,гиперболическое и т.п.).

2.  Построить наиболее подходящееуравнение регрессии.

3.  Оценить величину влияния фактора наисследуемый показатель с помощью коэффициента корреляции и детерминации.

4.  Оценить качество построенной модели сточки зрения адекватности и точности. Для этого оценить математическое ожиданиезначений остаточного ряда, проверить случайность уровней остатков ряда, ихнезависимость и соответствие нормальному закону. Для оценки точностииспользовать среднюю относительную ошибку аппроксимации.

5.  С помощью коэффициента эластичностиопределить силу влияния фактора на результативный показатель.

6.  Проверить значимость коэффициентарегрессии и провести его интервальную оценку.

7.  Рассчитать прогнозное значениерезультата, если прогнозное значение фактора увеличилось на 10 % от среднегоуровня. Определить доверительный интервал прогноза для уровня значимости />.

8.  Сделать выводы по полученнымрезультатам.

Решение:

Дляудобства вычислений в ходе решения будем достраивать исходную таблицу данных довспомогательной (см. Приложение 1), округляя и занося в расчетную таблицупромежуточные результаты.

1.  Построим поле корреляции:

 

/>

Визуальныйанализ полученного графика показывает, что точки поля корреляции располагаютсявдоль некоторой воображаемой прямой линии, но не очень плотно, рассеиваясьоколо неё. Поэтому делаем предположение о линейном виде уравнения регрессии.Нельзя сказать, что прослеживается тесная зависимость, но заметно, что сувеличением размера жилой площади х наблюдается тенденция к увеличениюстоимости квартир у. Можно предположить, что связь размера жилой площади и еестоимости положительная, не очень тесная, и на цену квартир оказывают влияние идругие факторы (район места ее расположения, этаж, наличие коммуникаций, состояниеквартиры и т.п.).

2.  Построим в соответствии с выбраннымлинейным видом уравнение регрессии:

/>

Чтобыопределить параметры линейной модели с помощью метода наименьших квадратов,решим систему уравнений на основе исходных и расчетных данных:

/>

Рассчитав на основеисходных данных необходимые значения (графы 3, 5 таблицы Приложения 1),получаем систему:

/>

Решив полученную системууравнений при помощи надстройки «Поиск решения» приложения MS Excel, находим:

b0 = 9,308595

b1 = 0,52076

Составим уравнение парнойлинейной регрессии:


/>

Вдекартовой системе координат ХОУ на поле корреляции строим график линиирегрессии по найденному уравнению (рис.1).

3.  Для оценки влияния фактора наисследуемый показатель вычислим линейный коэффициент корреляции и коэффициентдетерминации.

Используя надстройкуприложения MS Excel «Пакет анализа» — инструмент «Корреляция», находимвеличину линейного коэффициента корреляции.

Столбец 1 Столбец 2 Столбец 1 1 Столбец 2 0,8559571 1

По величине коэффициентакорреляции />,принадлежащей интервалу (0,7; 1), оценим качественную характеристику связи каксильную прямую.

Находим парныйкоэффициент детерминации:

/>

Изменение У примерно на74 % определяется вариацией фактора х, на 26 % — влиянием других факторов. Тоесть изменения величины стоимости жилой площади на 74% обусловлены колебаниямиее размеров, и на 26 % — колебаниями и изменениями других факторов и условий.

4.  Оценим качество построенной модели

Производим расчеты данныхдля граф 6-10 вспомогательной таблицы (Приложение 1).

Оценим качествопостроенной модели с точки зрения адекватности. Для этого проверим выполнениеследующих требований:

1)  Уровни ряда остатков имеют случайныйхарактер. Для проверки выполнения данного требования воспользуемся критериемповоротных точек (пиков).

-3,829 -3,4095 -4,145 -4,629 -2,797 -4,7313 -6,0229 -5,7565 -2,4402 3,4693 2,4879 10,3183 7,4092 13,9416 + - + + - - + - + + + +

Число поворотных точек р= 8

/>

Поскольку р > 5,требование считаем выполненным.

2)  Математическое ожидание уровня рядаостатков равно нулю.

/>

Поскольку полученноезначение близко к 0, требование считаем выполненным.

3)  Дисперсия каждого отклоненияодинакова для всех х. Для проверки выполнения данного требования используемкритерий Гольдфельда-Квандта. Исходные значения х расположим в возрастающемпорядке:

Жилая площадь, х Цена кв., у. 16 13,5 17,7 22 20 15,9 20 15,1 21,4 34,4 28 21,1 31,1 28 40,5 27 45,9 27,2 46,3 28,7 47,5 28,3 48,7 45 65,8 51 87,2 52,3

Делим полученную таблицуна 2 равные части

Жилая площадь, х Цена кв., у Жилая площадь, х Цена кв., у 16 13,5 40,5 27 17,7 22 45,9 27,2 20 15,9 46,3 28,7 20 15, 47,5 28,3 21,4 34,4 48,7 45 28 21,1 65,8 51 31,1 28 87,2 52,3

По каждой группе строимуравнение регрессии:

Жилая площадь, х Цена кв., у

/>

/>

16 13,5 256 216 17,7 22 313,29 389,4 20 15,9 400 318 20 15,1 400 302 21,4 34,4 457,96 736,16 28 21,1 784 590,8 31,1 28 967,21 870,8

154,2

150

3578,46

3423,16

Чтобыопределить параметры линейной модели с помощью метода наименьших квадратов,решим систему уравнений:

/>


Решив полученную системууравнений при помощи надстройки «Поиск решения» приложения MS Excel, находим:

b0= 7,01310810173176

b1= 0,65439846490193

Составим уравнение парнойлинейной регрессии:

/>

На его основе найдемрасчетные значения результативного показателя, а также ряд остатков иостаточные суммы квадратов для первой группы:

Жилая площадь, х Цена кв, у

/>

/>

/>

/>

(/>)2

16 13,5 256 216 17,477 -3,977 15,816529 17,7 22 313,29 389,4 18,5888 3,4112 11,636285 20 15,9 400 318 20,093 -4,193 17,581249 20 15,1 400 302 20,093 -4,993 24,930049 21,4 34,4 457,96 736,16 21,0086 13,3914 179,3296 28 21,1 784 590,8 25,325 -4,225 17,850625 31,1 28 967,21 870,8 27,3524 0,6476 0,4193858

154,2

150

3578,46

3423,16

176,0978

0,0622

267,5637

/>

Рассчитаем аналогичныепараметры для второй группы данных:

Жилая площадь, х Цена кв, у

/>

/>

/>

/>

(/>)2

40,5 27 1640,25 1093,5 28,6765 -1,6765 2,81065225 45,9 27,2 2106,81 1248,48 31,9003 -4,7003 22,0928201 46,3 28,7 2143,69 1328,81 32,1391 -3,4391 11,8274088 47,5 28,3 2256,25 1344,25 32,8555 -4,5555 20,7525803 48,7 45 2371,69 2191,5 33,5719 11,4281 130,60147 65,8 51 4329,64 3355,8 43,7806 7,2194 52,1197364 87,2 52,3 7603,84 4560,56 56,5564 -4,2564 18,116941

381,9

259,5

22452,17

15122,9

259,480

0,0197

258,3216

Решив полученную системууравнений

/>

при помощи надстройки«Поиск решения» приложения MS Excel, находим:

b0= 4,49765806824428

b1= 0,59705785159018

Составим уравнение парнойлинейной регрессии:

/>

/>

По критериюГольдфельда-Квандта найдем расчетное значение

/>

/> 

(табличные значениякритерия Фишера – в Приложении 5).

Поскольку /></>, то условиегомоскедастичности выполнено.

4)  Значения уровней ряда остатков независимыдруг от друга. Проверку на отсутствие автокорреляции осуществим с помощью d-критерия Дарбина-Уотсона:

/>

Поскольку d< d1 0,31<1,08 (табличные значения критерия – в Приложении 2),то гипотеза об отсутствии автокорреляции отвергается, и имеется значительнаяавтокорреляция.

5)  Уровни ряда остатков распределены понормальному закону. Проверку выполнения требования проведем по RS-критерию:

/>

/>

Для объема генеральнойсовокупности, равного 14, и уровня вероятности ошибки в 5 %, табличные значениянижней и верхней границ RS-критерияравны соответственно 2,92 и 4,09 (табличные значения критерия – в Приложении3). Поскольку рассчитанное значение критерия не попадает в интервал табличныхзначений, гипотеза о нормальном распределении отвергается.

Оценим качествопостроенной модели с точки зрения точности. Для этого используем среднююотносительную ошибку аппроксимации, рассчитав данные для графы 11вспомогательной таблицы (Приложение 1).

/>

/>

Всреднем смоделированные значения стоимости квартир отклоняются от фактическихна 19,8 %. Подбор модели к фактическим данным можно оценить как не оченьточный, отклонения фактических значений от теоретических заметные.

5.  С помощью коэффициента эластичностиопределим силу влияния фактора на результативный показатель.

Рассчитаемсредние значения фактора и результативного показателя:

/>

/>

/>

Среднийкоэффициент эластичности показывает, что в среднем при повышении размера жилойплощади на 1% от своего среднего значения ее стоимость увеличивается на 0,682%от своего среднего значения.

6.  Проверим значимость коэффициентарегрессии и проведем его интервальную оценку.

Значимость коэффициента b1 определим с помощью t-критерия Стьюдента (табличныезначения критерия приведены в Приложении 4). Рассчитаем опытное значениекритерия:

/>


При этомсреднеквадратическое отклонение коэффициента b1 найдем по формуле:

/>,

где остаточное среднеквадратическоеотклонение найдем:

/>

/>

/>

/>

Поскольку />, то /> и коэффициент b1, как и все уравнение регрессии, является значимым.

Такимобразом, можно считать, что предполагаемая зависимость стоимости квартиры от ееразмера подтвердилась и статистически установлена.

Проверимзначимость выбранного коэффициента с помощью критерия Фишера:

/>

/>

Наблюдаемоезначение F–критерия превышает табличное: 34,083 > 4,75,т.е. выполнено неравенство />, а значит, в 95 % случаевуравнение регрессии статистически значимо и отражает существенную зависимостьмежду размером цены квартиры от ее жилой площади. Уравнение можно признатьнадежным и значимым, доказывающим наличие исследуемой зависимости.

Доверительныйинтервал для /> рассчитывается поформуле:

/>

Привыбранной надежности g=0,95 получим:

/>, откуда />.

Такимобразом, с надежностью 95% можно утверждать, что истинное значение параметра b1 будет заключено в пределах от 0,3227 до 0,7193.

7.  Рассчитаемпрогнозное значение результата, если прогнозное значение фактора увеличится на10% от среднего уровня.

Полученныеоценки уравнения регрессии позволяют использовать его для прогноза численныхзначений стоимости жилой площади. Но как уже говорилось, точность моделиневысока.

/>

Вслучае увеличения фактора на 10 % от своего среднего значения размер данногоувеличения составит:

/>

Прогнозноезначение фактора при этом составит:

/>

Точечныйпрогноз:

/>

Т.е.по модели предсказываем, что если жилая площадь квартиры, увеличившись на 10 %от своего среднего значения, составит 42,12 условных единиц, то ожидаемая(прогнозная) величина ее стоимости составит 31,25 условных единиц.

Доверительныйинтервал для среднего размера стоимости квартиры при условии, что ее жилаяплощадь составляет х = 42,12 условных единиц с надежностью g=0,95:

/>

/> 

гдестандартная ошибка для средних значений:

/>

Т.е.средний размер стоимости жилой площади размером 42,1223 условные единицынаходится в границах от 27,2719 до 35,2375 условные единицы.

Доверительныйинтервал для индивидуальных значений размера стоимости квартир с жилой площадью42,1223 условные единицы с надежностью g=0,95:

/>

/>,

гдестандартная ошибка для индивидуальных значений:

/>

Такимобразом, если размер жилой площади будет находиться на уровне 42,1223 условныеединицы, то возможный размер ее стоимости в 95% случаев может находиться внутриинтервала от 16.046 до 46.463 условные единицы. Этот интервал определяетграницы, за пределами которых могут оказаться не более 5% значений стоимостиквартир, которые могли быть зафиксированы при размере их жилой площади в42,1223 условные единицы.

Выводы,сделанные ранее подтвердились. Интервальный прогноз не отличается высокойточностью, но вполне пригоден для практического использования.

8.  Полученныерезультаты позволяют сделать следующие выводы:

Статистическизначимый коэффициент регрессии b1 и коэффициент корреляции rух свидетельствуюто наличии сильной зависимости стоимости квартиры от размера ее жилой площади.Можно считать, что наличие этой зависимости статистически доказано, направлениеи общая тенденция отражена уравнением регрессии верно и согласуется сэкономической теорией. Высокое значение коэффициента детерминации R2 указывает, чтона формирование стоимости квартир существенное влияние оказывает именно размерих жилой площади и в значительно меньшей мере (порядка 26 %) — другиеэкономические факторы.

Сдругой стороны, относительная ошибка аппроксимации свидетельствует, что модельподобрана не точно: в среднем теоретические (смоделированные данные) отличаютсяот фактических на 19,8 %. В целом применение полученного уравнения регрессиивозможно в случае повышения его прогностической силы и практической ценности засчет увеличения объема выборки.

 

Задача 2

 

В исходной таблице(вариант 8) представлены статистические данные о различных параметрах уровняжизни населения в 2004 г.:

Страны

Х1

Х3

Х6

Х8

Х9

У

1 Россия 55 30 20,4 28 124 84,98 2 Австралия 100 47 71,4 121 87 30,56 3 Австрия 93 37 78,7 146 74 38,42 4 Азербайджан 20 12,4 12,1 52 141 60,34 5 Армения 20 4,3 10,9 72 134 60,22 6 Белоруссия 72 28 20,4 38 120 60,79 7 Бельгия 85 48 79,7 83 72 29,82 8 Болгария 65 18 17,3 92 156 70,57 9 Великобритания 67 39 69,7 91 91 34,51 10 Венгрия 73 40 24,5 73 106 64,73 11 Германия 88 35 76,2 138 73 36,63 12 Греция 83 24 44,4 99 108 32,84 13 Грузия 21 36 11,3 55 140 62,64 14 Дания 98 38 79,2 89 77 34,07 15 Ирландия 99 31 57 87 102 39,27 16 Испания 89 26 54,8 103 72 28,46 17 Италия 84 27 72,1 169 118 30,27 18 Казахстан 61 19,2 13,4 10 191 69,04 19 Канада 98 44 79,9 123 77 25,42 20 Киргизия 46 23,5 11,2 20 134 53,13 21 Нидерланды 86 37 72,4 176 59 28,00 22 Португалия 73 27 48,6 150 83 38,79 23 США 115 29 100 99 103 32,04 24 Финляндия 62 36 63,9 82 94 38,58 25 Франция 91 36 77,5 84 85 18,51 26 Чехия 82 45 34,7 65 114 57,62 27 Япония 40 20 83,5 60 119 20,80

 

1966

837,4

1385,2

2405

2854

1181,05

/>

 

72,81

31,01

51,3

89,07

105,7

43,74

Х1 — потребление мяса и мясопродуктов на душу населения (кг),

Х3 — потребление сахара на душу населения (кг),

Х6 — оценкаВВП по паритету покупательной способности в 1994 г. на душу населения (в % к США),

Х8 — потребление фруктов и ягод на душу населения (кг),

Х9 — потребление хлебных продуктов на душу населения (кг),

У – смертность населения попричине болезни органов кровообращения на 100000 населения.

Требуется:

1)  Рассчитать параметры линейногоуравнения множественной регрессии.

2)  Определить сравнительную оценкувлияния факторов на результативный показатель с помощью коэффициентов эластичности.

3)  Оценить статистическую значимостьпараметров регрессионной модели с помощью t-критерия. Адекватность модели проверить с помощью F-критерия.

4)  Оценить качество построенногоуравнения с помощью средней ошибки аппроксимации.

5)  Используя метод многошаговогорегрессионного анализа, построить регрессионную модель только со значимымифакторами и оценить ее параметры.

6)  Определить прогнозное значениерезультата, если прогнозные значения факторов составляют 80 % от ихмаксимальных значений.

7)  Рассчитать ошибки и доверительныйинтервал прогноза для уровня значимости /> и />.

8)  Сделать выводы по полученнымрезультатам.

Решение:

1.  Рассчитаем параметры линейногоуравнения множественной регрессии

Дляудобства в ходе решения будем достраивать исходную таблицу данных довспомогательной (см. Приложение 6), округляя и занося в ее промежуточныерезультаты. Уравнение множественной линейной регрессии для нашего случая имеетобщий вид:

/>

Параметры данногоуравнения найдем с помощью инструмента «Регрессия» надстройки «Анализ данных»приложения MS Excel (результаты вычисления – в Приложении 7):

b0= 40,0007992

b1= 0,071828228

b2= 0,295651645

b3= -0,500054859

b4= -0,500054859

b5= 0,15192311

Получаем уравнениелинейной множественной регрессии:

/>

2.  Определим сравнительную оценкувлияния факторов на результативный показатель с помощью коэффициентовэластичности.

Т.к. факторы имеютразличную природу и размерность, непосредственная оценка их влияния затруднена.Поэтому для каждого из них необходимо рассчитать свой коэффициент эластичности.

Для расчета коэффициентовнайдем средние значения факторов и результативного показателя:

/>

/>

/>

/>

/>

/>

Подставим полученныезначения в формулу:

/>

/>

/>

/>

/>

/>

Такимобразом, смертность населения по причине болезни органов кровообращения на100000 населения увеличивается примерно на 0,12 % при увеличении потреблениямяса и мясопродуктов на душу населения на 1 %, на 0,21% при увеличении на 1%потребления сахара на душу населения и на 0,37% при увеличении потребленияхлебных продуктов на душу населения на 1%.

А приувеличении оценки ВВП по паритету покупательной способности в 1994 г. на душу населения на 1% результативный показатель, наоборот, уменьшится на 0,59%. Увеличениеже потребления фруктов и ягод на душу населения на 1% повлечет снижениесмертности примерно на 1,02%.

3.  Оценим статистическую значимостьпараметров регрессионной модели с помощью t-критерия.

Расчетные значениякритерия для пяти заданных параметров получили с помощью инструмента «Регрессия»надстройки «Анализ данных» приложения MS Excel (результаты вычисления – вПриложении 7):

/>

/>

/>

/>

/>

Поскольку />, то коэффициенты b1, b2, b3, b4, b5 не являются значимыми для построенной модели.

Адекватность моделипроверим с помощью F-критерия.

/>


Величина множественногокоэффициента детерминации R2=0,799, также рассчитана с помощьюинструмента «Регрессия» надстройки «Анализ данных» приложения MS Excel(результаты вычисления – в Приложении 7). Построенную модель на основе этогопараметра можно признать достаточно качественной. А изменение результативногопоказателя примерно на 80 % обусловлено влиянием факторов, включенных в модель.

/>

/>

Наблюдаемоезначение F–критерия превышает табличное: 16,65 > 4,52,т.е. выполнено неравенство />, а значит, в 95 % случаевуравнение регрессии статистически значимо и отражает существенную зависимостьмежду факторами и результативным показателем.

Уравнениеможно признать надежным и значимым, доказывающим наличие исследуемойзависимости.

4.  Оценим качество построенногоуравнения с помощью средней ошибки аппроксимации.

Проведем необходимыедополнительные расчеты с вспомогательной таблицей (графа 11 Приложения 6). Наоснове полученных данных найдем значение средней ошибки аппроксимации:

/>

Полученное значениесредней ошибки аппроксимации подтверждает удовлетворительную точностьпостроенной модели.

5.  Используя метод многошаговогорегрессионного анализа, построим регрессионную модель только со значимымифакторами и оценим ее параметры.

Посколькумодель со всеми заданными факторами уже построена, и значимость каждого факторарассчитана, можем перейти к следующему шагу анализа, исключив из модели самыйнезначимый фактор.

/>

Исключаем фактор Х6 — оценка ВВП по паритету покупательной способности в 1994 г. на душу населения (в % к США). Строим новую модель с оставшимися факторами:

/>

Параметры данногоуравнения найдем с помощью инструмента «Регрессия» надстройки «Анализ данных»приложения MS Excel (результаты вычисления – в Приложении 8):

b0=11,3789103724081

b1= -0,140477614195711

b2= 0,334073328849854

b4= -0,0590948468841696

b5= 0,354719169807746

Получаем уравнениелинейной множественной регрессии:

/>

Расчетные значениякритерия для заданных параметров получили с помощью инструмента «Регрессия»надстройки «Анализ данных» приложения MS Excel (результаты вычисления – вПриложении 8):

/>

/>

/>

/>

Поскольку />, то коэффициенты b1, b2, b4 не являются значимыми для построенной модели. Исключаемсамый незначимый фактор:

/>

Исключаем фактор Х1 — потребление мяса и мясопродуктов на душу населения (кг).

Строим новую модель составшимися факторами:

/>

Параметры данногоуравнения найдем с помощью инструмента «Регрессия» надстройки «Анализ данных»приложения MS Excel (результаты вычисления – в Приложении 9):

b0= 5,45597214112287

b2= 0,200539077387593

b4= -0,0847616134509301

b5= 0,374792925415136

Получаем уравнениелинейной множественной регрессии:

/>


Расчетные значениякритерия для заданных параметров получили с помощью инструмента «Регрессия»надстройки «Анализ данных» приложения MS Excel (результаты вычисления – вПриложении 8):

/>

/>

/>

Поскольку />, то коэффициенты b2, b4 не являются значимыми дляпостроенной модели. Исключаем самый незначимый фактор:

/>

Исключаем фактор Х8 — потребление фруктов и ягод на душу населения (кг). Строим новую модель составшимися факторами:

/>

Параметры данногоуравнения найдем с помощью инструмента «Регрессия» надстройки «Анализ данных»приложения MS Excel (результаты вычисления – в Приложении 10):

b0= -14,5137453627595

b2= 0,272342209805998

b5= 0,471219957359132

Получаем уравнениелинейной множественной регрессии:


/>

Расчетные значениякритерия для заданных параметров получили с помощью инструмента «Регрессия»надстройки «Анализ данных» приложения MS Excel (результаты вычисления – вПриложении 10):

/>

/>

Поскольку

/>,

то коэффициент b2 не является значимым для построенной модели.Исключаем незначимый фактор:

/>

Исключаем фактор Х3 — потребление сахара на душу населения (кг). Строим новую модель с оставшимсяфактором:

/>

Параметры данногоуравнения найдем с помощью инструмента «Регрессия» надстройки «Анализ данных»приложения MS Excel (результаты вычисления – в Приложении 11):

b0= 0,166147

b5= 0,412251


Получаем уравнениелинейной парной регрессии:

/>

Расчетное значениекритерия для параметра b5 получили с помощью инструмента«Регрессия» надстройки «Анализ данных» приложения MS Excel (результатывычисления – в Приложении 11):

/>

Поскольку

/>,

то коэффициент b5 является значимым для построенноймодели. Таким образом, посредством пошагового регрессионного анализа,осуществленного методом исключения факторов, получили модель, содержащую толькоодин значимый фактор Х9 — потребление хлебных продуктов на душунаселения (кг).

6.  Определим прогнозное значениерезультата, если прогнозные значения факторов составляют 80 % от ихмаксимальных значений.

Поскольку в уравнениирегрессии остался лишь один значимый фактор, именно на основе данных опотреблении хлебных продуктов на душу населения будем рассчитывать прогнозноезначение результативного показателя.

/>

Если прогнозное значениефактора составит 80% от своего максимального значения

/>,

тогда точечное прогнозноезначение результативного показателя составит

/>

Т.е. если потребление хлебных продуктов на душунаселения составит 152,8 кг, то прогнозное значение смертности населения попричине болезни органов кровообращения на 100000 населения составит примерно63.

7.  Рассчитаем ошибки и доверительныйинтервал прогноза для уровня значимости /> и />.

/>

Доверительныйинтервал для среднего размера смертности населения по причине болезни органовкровообращения на 100000 населения при условии, что потребление хлебныхпродуктов составляет х = 152,8 кг с надежностью g=0,95:

/>/>

гдестандартная ошибка для средних значений:


/>

Т.е.средний размер смертности населения по причине болезни органов кровообращенияна 100000 населения при условии, что потребление хлебных продуктов составляет х= 152,8 кг, находится в интервале от 53 до 72 человек. Доверительный интервалдля индивидуальных значений размера смертности населения по причине болезниорганов кровообращения на 100000 населения при условии, что потребление хлебныхпродуктов составляет х = 152,8 кг с надежностью g=0,95:

/>

/>,

гдестандартная ошибка для индивидуальных значений:

/>

Такимобразом, если потребление хлебных продуктов будет находиться на уровне 152,8 кг, то возможный размер смертности населения по причине болезни органов кровообращения на100000 населения в 95% случаев может находиться внутри интервала от 35 до 90человек.

Рассчитаемте же показатели для уровня значимости />

Доверительныйинтервал для среднего размера смертности населения по причине болезни органовкровообращения на 100000 населения при условии, что потребление хлебныхпродуктов составляет х = 152,8 кг с надежностью g=0,90:


/>/>

Т.е.средний размер смертности населения по причине болезни органов кровообращенияна 100000 населения при условии, что потребление хлебных продуктов составляет х= 152,8 кг, находится в интервале от 55 до 70 человек.

Доверительныйинтервал для индивидуальных значений размера смертности населения по причинеболезни органов кровообращения на 100000 населения при условии, что потреблениехлебных продуктов составляет х = 152,8 кг с надежностью g=0,90:

/>

/>

Такимобразом, если потребление хлебных продуктов будет находиться на уровне 152,8 кг, то возможный размер смертности населения по причине болезни органов кровообращения на100000 населения в 90% случаев может находиться внутри интервала от 40 до 85человек.

8.  Полученные результаты позволяютсделать следующие выводы:

Наоснове сравнительной оценки влияния факторов на результативный показательпосредством расчета коэффициентов эластичности удалось установить, чтосмертность населения по причине болезни органов кровообращения на 100000населения увеличивается примерно на 0,12 % при увеличении потребления мяса имясопродуктов на душу населения на 1 %, на 0,21% при увеличении на 1%потребления сахара на душу населения и на 0,37% при увеличении потребленияхлебных продуктов на душу населения на 1%.

А при увеличении оценкиВВП по паритету покупательной способности в 1994 г. на душу населения на 1% результативный показатель, наоборот, уменьшится на 0,59%. Увеличениеже потребления фруктов и ягод на душу населения на 1% повлечет снижениесмертности примерно на 1,02%.

Величина множественногокоэффициента детерминации R2=0,799 свидетельствует о том, чтоизменение результативного показателя примерно на 80% обусловлено влияниемфакторов, включенных в модель. Оценка качества построенного уравнения с помощьюсредней ошибки аппроксимации подтверждает удовлетворительную точностьпостроенной модели.

Оценка адекватностипостроенной модели с помощью F-Критерия Фишера подтвердила, что в 95 % случаевуравнение регрессии статистически значимо и отражает существенную зависимостьмежду факторами и результативным показателем. А значит, уравнение можнопризнать надежным и значимым, доказывающим наличие исследуемой зависимости.

Посредством пошаговогорегрессионного анализа, осуществленного методом исключения факторов, получилимодель, содержащую только один значимый фактор — потребление хлебных продуктовна душу населения. С его использованием построили новое уравнение регрессии, спомощью которого рассчитали прогнозное точечное значение результативногопоказателя и доверительный интервал для уровня значимости /> и />.

Задача 3

 

В исходной таблице (графы2 и 3 Приложения 13) представлены статистические данные об объеме продажпродовольственных товаров с 1 января 1990 г. в относительных единицах.

Требуется:

1.  Представить временной ряд графически,провести его сглаживание методом простой скользящей средней, оценить наличиетренда.

2.  Построить уравнение неслучайнойсоставляющей (тренда) временного ряда, проверить значимость построенногоуравнения по F-критерию при уровне значимости />.

3.  Дать точечную, интервальную оценкипрогноза среднего и индивидуального значений с надежностью />на 1 и 2 шага вперед.

4.  Построить авторегрессионную модельвременного ряда, дать точечный, интервальный прогноз среднего и индивидуальногозначений с надежностью />на 1 и 2 шага вперед.

5.  Сделать выводы по полученнымрезультатам.

 

Решение:

1.  Представим временной ряд графически:

 

/>

Проведем его сглаживаниеметодом простой скользящей средней. Выбрав величину скользящей средней, равную3, доработаем исходную таблицу данных – найдем средние значения для каждых трехисходных (графа 4 Приложения 13).

На основе среднихзначений строим диаграмму сглаженных данных:


/>

По графику можно сделатьпредположение о наличии тренда линейного типа. Для наглядности еще болеесгладим исходные данные, построив с помощью инструмента «Скользящее среднее»надстройки «Анализ данных» приложения MS Excel график пятичленной скользящейсредней.

/>

Предположение о наличиитренда подтверждается, очевидно, также имеет место сезонная компонента.

2.  Построим уравнение неслучайнойсоставляющей (тренда) временного ряда

Для определенияпараметров модели временного ряда из линейного уравнения

/>

воспользуемсяинструментом «Регрессия» надстройки «Анализ данных» приложения MS Excel(результаты вычислений – в Приложении 14).

Получаем уравнение трендавременного ряда следующего вида:

/>

Проверим значимостьпостроенного уравнения по F-критерию при уровне значимости />

/>

Величина коэффициентадетерминации R2=0,324 также рассчитана с помощью инструмента«Регрессия» надстройки «Анализ данных» приложения MS Excel (результатывычисления – в Приложении 14). Судя по этому параметру, изменениерезультативного показателя примерно на 32 % обусловлено влиянием временногофактора. Построенную модель на основе парного коэффициента корреляции =0,57можно признать умеренно качественной.

/>

/>


Наблюдаемоезначение F–критерия меньше табличного: 250,476 > 16,2,т.е. выполнено неравенство />, а значит, в 95 % случаевуравнение регрессии статистически незначимо и не отражает зависимости междувременем и объемом продаж продовольственных товаров, что подтверждаетсяэкономической теорией.

3.  Дать точечную, интервальную оценкипрогноза среднего и индивидуального значений с надежностью /> на 1 и 2 шага вперед.

Чтобы сделать точечныйпрогноз на 1 и 2 шага вперед, подставим соответствующие значения фактора вполученное уравнение регрессии:

/>

Доверительныйинтервал для среднего размера объема продаж продовольственных товаров на01.12.1995 г. (t=36) с надежностью g=0,95:

/>

/>

гдестандартная ошибка для средних значений:

/>,

/>

Т.е.средний размер объема продаж продовольственных товаров на 01.12.1995 г. (t=36) примернонаходится в интервале от 249 до 292 относительных единиц.

Доверительныйинтервал для индивидуальных значений размера объема продаж продовольственныхтоваров на 01.12.1995 г. (t=36) с надежностью g=0,95:

/>

/>

гдестандартная ошибка для индивидуальных значений:

/>

Такимобразом, размер объема продаж продовольственных товаров на 01.12.1995 г. (t=36) в 95%случаев может находиться внутри интервала примерно от 205 до 335 относительныхединиц.

Для прогноза на 2 шагавперед:

/>

Доверительныйинтервал для среднего размера объема продаж продовольственных товаров на01.01.1996 г. (t=37) с надежностью g=0,95:

/>

/> 

гдестандартная ошибка для средних значений:


/>,

/>

Т.е.средний размер объема продаж продовольственных товаров на 01.01.1996 г. (t=37) примернонаходится в интервале от 250 до 294 относительных единиц.

Доверительныйинтервал для индивидуальных значений размера объема продаж продовольственныхтоваров на 01.01.1996 г. (t=37) с надежностью g=0,95:

/>

/>

гдестандартная ошибка для индивидуальных значений:

/>

Такимобразом, размер объема продаж продовольственных товаров на 01.01.1996 г. (t=37) в 95%случаев может находиться внутри интервала примерно от 207 до 304 относительныхединиц.

4.  Построим авторегрессионную модельвременного ряда.

Для построенияавторегрессионной модели 1-го порядка вида


/>

Определим ее параметры спомощью МНК из системы уравнений:

/>

/>

Воспользовавшисьнадстройкой «Поиск решения» приложения MS Excel, находим коэффициенты модели:

 

/>

Получаем модель:

/>

 

Дадим точечный прогнозпо полученной авторегрессионной модели на 1 и 2 шага вперед:

/>

/>

 

Дадим интервальныйпрогноз среднего и индивидуального значений по полученной авторегрессионноймодели с надежностью />на 1 и 2 шага вперед.

Доверительныйинтервал для среднего размера объема продаж продовольственных товаров пополученной авторегрессионной модели на 01.12.1995 г. (t=36) снадежностью g=0,95:

/>

/> 

гдестандартная ошибка для средних значений:

/>, />

Доверительныйинтервал для индивидуальных значений размера объема продаж продовольственныхтоваров по полученной авторегрессионной модели на 01.12.1995 г. (t=36) снадежностью g=0,95:

/>

/>

гдестандартная ошибка для индивидуальных значений:

/>

Итак,с надежностью 0,95 среднее значение объема продаж продовольственных товаров намомент t=36 будет заключено в пределах от 233,17 до 275,99относительных единиц, а его индивидуальное значение — от 189,44 до 319,72относительных единиц.

Для прогноза на 2 шагавперед:

/>


Доверительныйинтервал для среднего размера объема продаж продовольственных товаров пополученной авторегрессионной модели на 01.12.1995 г. (t=37) снадежностью g=0,95:

/>

/> 

гдестандартная ошибка для средних значений

/>

Доверительныйинтервал для индивидуальных значений размера объема продаж продовольственныхтоваров по полученной авторегрессионной модели на 01.01.1996 г. (t=37) снадежностью g=0,95:

/>

/>

гдестандартная ошибка для индивидуальных значений: />

Итак,с надежностью 0,95 среднее значение объема продаж продовольственных товаров намомент t=37 будет заключено в пределах от 212,28 до 254,64относительных единиц, а его индивидуальное значение — от 169,06 до 299,86относительных единиц.

5.  Выводы по полученным результатам:

Проведя сглаживаниевременного ряда методом простой скользящей средней, по графику сделалипредположение о наличии тренда линейного типа. Вычислив параметры модели,получаем уравнение тренда


/>

Величина коэффициентадетерминации R2=0,324 свидетельствует о том, что изменение У на 32%обусловлено влиянием времени. Построенную модель на основе коэффициентакорреляции можно признать умеренно качественной.

Проверивзначимость построенного уравнения по F-критерию, приходим к выводу, чтов 95% случаев уравнение регрессии статистически незначимо и не отражаетзависимости между временем и объемом продаж продовольственных товаров, чтоподтверждается экономической теорией.

Точечный прогноз на 1 шагвперед на основе полученной модели примет значение

/>

Интервальный прогнозпозволяет установить, что размер объема продаж на 01.12.1995 г. в 95% случаевможет находиться в интервале от 205 до 335 относительных единиц, а среднийразмер объема продаж — в интервале от 249 до 292 относительных единиц.

Точечный прогноз на 2шага вперед на основе полученной модели примет значение

/>

Интервальный прогнозпозволяет установить, что размер объема продаж на 01.01.1996 г. в 95% случаевможет находиться внутри интервала примерно от 207 до 304 относительных единиц,а средний размер объема продаж – внутри интервала от 207 до 304 относительныхединиц.

Поскольку построенноеранее уравнение линейного тренда не является значимым, для прогнозированиязначений временного ряда построили авторегрессионную модель

/>

Даем точечный прогноз на1 шаг вперед

/>

и интервальный на уровнезначимости 0,05 для среднего и индивидуального значений –

/>

и />

А такжеточечныйпрогноз на 2 шага вперед

/>,

и интервальный на уровнезначимости 0,05 для среднего и индивидуального значений –

/> и />.

 

линейный множественныйрегрессия модель


 

Приложение 1

 

Жилая пло

щадь, x

Цена квартиры, у

/>

/>

/>

/>

/>

(/>)2

/>

(/>)2

/>

1 2 3 4 5 6 7 8 9 10 11 20 15,9 400 252,81 318 19,729 -3,829 14,66124 - - -0,241 40,5 27 1640,25 729 1093,5 30,4095 -3,4095 11,62469 0,4195 0,175980 -0,126 16 13,5 256 182,25 216 17,645 -4,145 17,18103 -0,7355 0,540960 -0,307 20 15,1 400 228,01 302 19,729 -4,629 21,42764 -0,484 0,234256 -0,307 28 21,1 784 445,21 590,8 23,897 -2,797 7,823209 1,832 3,356224 -0,133 46,3 28,7 2143,69 823,69 1328,81 33,4313 -4,7313 22,3852 -1,9343 3,741517 -0,165 45,9 27,2 2106,81 739,84 1248,48 33,2229 -6,0229 36,27532 -1,2916 1,668231 -0,221 47,5 28,3 2256,25 800,89 1344,25 34,0565 -5,7565 33,13729 0,2664 0,070969 -0,203 87,2 52,3 7603,84 2735,29 4560,56 54,7402 -2,4402 5,954576 3,3163 10,99785 -0,047 17,7 22 313,29 484 389,4 18,5307 3,4693 12,03604 5,9095 34,92219 0,158 31,1 28 967,21 784 870,8 25,5121 2,4879 6,189646 -0,9814 0,963146 0,089 48,7 45 2371,69 2025 2191,5 34,6817 10,318 106,4673 7,8304 61,31516 0,229 65,8 51 4329,64 2601 3355,8 43,5908 7,4092 54,89625 -2,9091 8,462863 0,145 21,4 34,4 457,96 1183,36 736,16 20,4584 13,942 194,3682 6,5324 42,67225 0,405 ∑ 536,1 409,5 26030,63 14014,35 18546,06 409,6341 -0,1341 544,4277 17,7706 169,1216 |2,776|

 


 

Приложение 2

 

В таблице приведенызначения критерия Дарбина-Уотсона для уровня значимости 5% (m — числонезависимых переменных уравнения регрессии).

Число наблюдений (n) m = 1 m = 2 m = 3 m = 4 m = 5

d1

d2

d1

d2

d1

d2

d1

d2

d1

d2

15203050100 1,081,201,351,501,65 1,361,411,491,591,69 0,951,101,281,461,63 1,541,541,571,631,72 0,821,001,211,421,61 1,751,681,651,671,74 0,690,901,141,381,59 1,971,831,741,721,76 0,560,791,071,341,57 2,211,991,831,471,78 /> /> /> /> /> /> /> /> /> /> /> /> /> />

Приложение 3

 

Критические границыотношения R/S

Объем выборки (n) Нижние границы Верхние границы Вероятность ошибки 0,000 0,005 0,01 0,025 0,05 0,10 0,10 0,05 0,025 0,01 0,005 0,000 34567891011121314151617181920 1,7321,7321,8261,8261,8211,8211,8971,8971,9151,9151,9271,9271,9361,9361,9441,9441,9491,949 1,7351,831,982,112,222,312,392,462,532,592,642,702,742,792,832,872,902,94 1,7371,872,022,152,262,352,442,512,582,642,702,752,802,842,882,922,962,99 1,7451,932,092,222,332,432,512,592,662,722,782,832,882,932,973,013,053,09 1,7581,982,152,282,402,502,592,672,742,802,862,922,973,013,063,103,143,18 1,7822,042,222,372,492,592,682,762,842,902,963,023,073,123,173,213,253,29 1,9972,4092,7122,9493,1433,3083,4493,573,683,783,873,954,024,094,154,214,274,32 1,9992,4292,7533,0123,2223,3993,5523,6853,803,914,004,094,174,244,314,374,434,49 2,0002,4392,7823,0563,2823,4713,6343,7773,9034,024,124,214,294,374,444,514,574,63 2,0002,4452,8033,0953,3383,5433,7203,8754,0124,1344,2444,344,444,524,604,674,744,80 2,0002,4472,8133,1153,3693,5853,7723,9354,0794,2084,3254,4314,534,624,704,784,854,91 2,0002,4492,8283,1624,4653,7424,0002,2434,4724,6904,8995,0995,2925,4775,6575,8316,0006,164

 


 

Приложение 4

 

Таблица значений функциираспределения Стьюдента (для интервальных оценок)

Значение доверительной вероятности

0.9

0.91

0.92

0.93

0.94

0.95

0.96

0.97

0.98

0.99

Степени

свободы

1

6.314 7.026 7.916 9.058 10.579 12.706 15.894 21.205 31.821 63.656

2

2.920 3.104 3.320 3.578 3.896 4.303 4.849 5.643 6.965 9.925

3

2.353 2.471 2.605 2.763 2.951 3.182 3.482 3.896 4.541 5.841

4

2.132 2.226 2.333 2.456 2.601 2.776 2.999 3.298 3.747 4.604

5

2.015 2.098 2.191 2.297 2.422 2.571 2.757 3.003 3.365 4.032

6

1.943 2.019 2.104 2.201 2.313 2.447 2.612 2.829 3.143 3.707

7

1.895 1.966 2.046 2.136 2.241 2.365 2.517 2.715 2.998 3.499

8

1.860 1.928 2.004 2.090 2.189 2.306 2.449 2.634 2.896 3.355

9

1.833 1.899 1.973 2.055 2.150 2.262 2.398 2.574 2.821 3.250

10

1.812 1.877 1.948 2.028 2.120 2.228 2.359 2.527 2.764 3.169

11

1.796 1.859 1.928 2.007 2.096 2.201 2.328 2.491 2.718 3.106

12

1.782 1.844 1.912 1.989 2.076 2.179 2.303 2.461 2.681 3.055

13

1.771 1.832 1.899 1.974 2.060 2.160 2.282 2.436 2.650 3.012

14

1.761 1.821 1.887 1.962 2.046 2.145 2.264 2.415 2.624 2.977

15

1.753 1.812 1.878 1.951 2.034 2.131 2.249 2.397 2.602 2.947

16

1.746 1.805 1.869 1.942 2.024 2.120 2.235 2.382 2.583 2.921

17

1.740 1.798 1.862 1.934 2.015 2.110 2.224 2.368 2.567 2.898

18

1.734 1.792 1.855 1.926 2.007 2.101 2.214 2.356 2.552 2.878

19

1.729 1.786 1.850 1.920 2.000 2.093 2.205 2.346 2.539 2.861

20

1.725 1.782 1.844 1.914 1.994 2.086 2.197 2.336 2.528 2.845

21

1.721 1.777 1.840 1.909 1.988 2.080 2.189 2.328 2.518 2.831

Приложение 5

 

/>


 

Приложение 6

Страны

Х1

Х3

Х6

Х8

Х9

У

/>

/>

/>

1 2 3 4 5 6 7 8 9 10 11 1 Россия 55 30 20,4 28 124 84,98 61,1244 23,8556 0,2807 2 Австралия 100 47 71,4 121 87 30,56 37,1498 -6,5898 -0,2156 3 Австрия 93 37 78,7 146 74 38,42 27,7670 10,653 0,2773 4 Азербайджан 20 12,4 12,1 52 141 60,34 59,8539 0,4861 0,0081 5 Армения 20 4,3 10,9 72 134 60,22 56,7572 3,4628 0,0575 6 Белоруссия 72 28 20,4 38 120 60,79 61,0272 -0,2372 -0,0039 7 Бельгия 85 48 79,7 83 72 29,82 30,3919 -0,5719 -0,0192 8 Болгария 65 18 17,3 92 156 70,57 63,9434 6,6266 0,0939 9 Великобритания 67 39 69,7 91 91 34,51 34,2298 0,2802 0,0081 10 Венгрия 73 40 24,5 73 106 64,73 60,0524 4,6776 0,0723 11 Германия 88 35 76,2 138 73 36,63 28,0102 8,6198 0,2353 12 Греция 83 24 44,4 99 108 32,84 46,083 -13,243 -0,4033 13 Грузия 21 36 11,3 55 140 62,64 67,1154 -4,4754 -0,0714 14 Дания 98 38 79,2 89 77 34,07 29,3072 4,76277 0,1398 15 Ирландия 99 31 57 87 102 39,27 42,2326 -2,9626 -0,0754 16 Испания 89 26 54,8 103 72 28,46 36,3877 -7,9277 -0,2786 17 Италия 84 27 72,1 169 118 30,27 33,8748 -3,6048 -0,1191 18 Казахстан 61 19,2 13,4 10 191 69,04 72,2562 -3,2162 -0,0466 19 Канада 98 44 79,9 123 77 25,42 30,3257 -4,9057 -0,193 20 Киргизия 46 23,5 11,2 20 134 53,13 64,7713 -11,6413 -0,2191 21 Нидерланды 86 37 72,4 176 59 28,00 27,7780 0,222 0,0079 22 Португалия 73 27 48,6 150 83 38,79 39,7452 -0,9552 -0,0246 23 США 115 29 100 99 103 32,04 21,2971 10,7429 0,3353 24 Финляндия 62 36 63,9 82 94 38,58 36,4471 2,1329 0,0553 25 Франция 91 36 77,5 84 85 18,51 30,3382 -11,8282 -0,639 26 Чехия 82 45 34,7 65 114 57,62 58,3873 -0,7673 -0,0133 27 Япония 40 20 83,5 60 119 20,80 24,3958 -3,5958 -0,1729

 

1966 837,4 1385,2 2405 2854 1181,05 1181,05 |4,0665|

/>

 

72,81 31,01 51,3 89,07 105,7 43,74

 

еще рефераты
Еще работы по экономико-математическому моделированию