Реферат: Социально-экономические явления и методы исследования связей между ними
--PAGE_BREAK--X+β; α2Y+β)=rxy,где α1, α2, b— постоянные величины, причем α1>0, α2>0.
Случайные величины Х, Y, можно уменьшать (увеличивать) в α раз, а также вычитать или прибавлять к значениям <img width=«47» height=«17» src=«ref-1_1256643250-130.coolpic» v:shapes="_x0000_i1103">одно и тоже число β — это не приведет к изменению коэффициента корреляции r.
При r= ±1 случайные величины<img width=«47» height=«17» src=«ref-1_1256643250-130.coolpic» v:shapes="_x0000_i1104">связаны линейной зависимостью, т.е.
<img width=«81» height=«21» src=«ref-1_1256644719-181.coolpic» v:shapes="_x0000_i1105">.
При r= 0 линейная корреляционная связь отсутствует.
В практических расчетах коэффициент корреляции rгенеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции r, так как выборочная совокупность переменных <img width=«47» height=«17» src=«ref-1_1256643250-130.coolpic» v:shapes="_x0000_i1106">случайна, то в отличие от параметра r
, r– случайная величина. Оценкой коэффициента корреляции <img width=«15» height=«16» src=«ref-1_1256645030-88.coolpic» v:shapes="_x0000_i1107"> является выборочный парный коэффициент корреляции:
<img width=«120» height=«51» src=«ref-1_1256645118-502.coolpic» v:shapes="_x0000_i1108">= <img width=«371» height=«100» src=«ref-1_1256645620-1491.coolpic» v:shapes="_x0000_i1109">, (3.3)
<img width=«147» height=«41» src=«ref-1_1256647111-429.coolpic» v:shapes="_x0000_i1110"> <img width=«143» height=«41» src=«ref-1_1256647540-437.coolpic» v:shapes="_x0000_i1111">
Для оценки значимости коэффициента корреляции применяется t — критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:
<img width=«172» height=«68» src=«ref-1_1256647977-689.coolpic» v:shapes="_x0000_i1112"> (3.4)
Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.
Если tнабл > tкр, то полученное значение коэффициента корреляции признается значимым (то есть нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь.
Если значение <img width=«28» height=«28» src=«ref-1_1256648666-115.coolpic» v:shapes="_x0000_i1113"> близко к нулю, связь между переменными слабая. Если случайные величины связаны положительной корреляцией, это означает, что при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если случайные величины связаны отрицательной корреляцией, это означает, что при возрастании одной случайной величины, другая имеет тенденцию в среднем убывать.
4. Оценка качества однофакторных линейных моделей
Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков — <img width=«16» height=«24» src=«ref-1_1256630620-91.coolpic» v:shapes="_x0000_i1114">.
После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих — <img width=«17» height=«25» src=«ref-1_1256648872-106.coolpic» v:shapes="_x0000_i1115">и <img width=«16» height=«24» src=«ref-1_1256630620-91.coolpic» v:shapes="_x0000_i1116">; <img width=«76» height=«25» src=«ref-1_1256649069-182.coolpic» v:shapes="_x0000_i1117"> (4.1)
Остаток <img width=«16» height=«24» src=«ref-1_1256630620-91.coolpic» v:shapes="_x0000_i1118"> представляет собой отклонение фактического значения зависимой переменной от значения данной переменной, полученное расчетным путем: <img width=«72» height=«24» src=«ref-1_1256649342-167.coolpic» v:shapes="_x0000_i1119"> (<img width=«48» height=«23» src=«ref-1_1256649509-133.coolpic» v:shapes="_x0000_i1120">). Если <img width=«43» height=«24» src=«ref-1_1256649642-128.coolpic» v:shapes="_x0000_i1121">(<img width=«48» height=«23» src=«ref-1_1256649509-133.coolpic» v:shapes="_x0000_i1122">), то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции <img width=«83» height=«25» src=«ref-1_1256649903-194.coolpic» v:shapes="_x0000_i1123">) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак <img width=«15» height=«17» src=«ref-1_1256650097-89.coolpic» v:shapes="_x0000_i1124"> полностью обусловлен влиянием фактора <img width=«13» height=«15» src=«ref-1_1256650186-84.coolpic» v:shapes="_x0000_i1125">.
На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от теоретических (<img width=«51» height=«24» src=«ref-1_1256650270-135.coolpic» v:shapes="_x0000_i1126">). Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.
При анализе качества модели регрессии используется основное положение дисперсионного анализа, согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения <img width=«15» height=«20» src=«ref-1_1256650405-94.coolpic» v:shapes="_x0000_i1127"> может быть разложена на две составляющие — объясненную и необъясненную уравнением регрессии дисперсии:
<img width=«272» height=«45» src=«ref-1_1256650499-840.coolpic» v:shapes="_x0000_i1128"> (4.2)
где<img width=«18» height=«27» src=«ref-1_1256651339-187.coolpic» v:shapes="_x0000_i1129">— значения y, вычисленные по модели <img width=«83» height=«25» src=«ref-1_1256649903-194.coolpic» v:shapes="_x0000_i1130">.
Разделив правую и левую часть (4.2)на <img width=«79» height=«45» src=«ref-1_1256651720-346.coolpic» v:shapes="_x0000_i1131">
<img width=«302» height=«97» src=«ref-1_1256652066-1894.coolpic» v:shapes="_x0000_i1132">
<img width=«211» height=«97» src=«ref-1_1256653960-1236.coolpic» v:shapes="_x0000_i1133">.
Коэффициент детерминации определяется следующим образом:
<img width=«489» height=«95» src=«ref-1_1256655196-1835.coolpic» v:shapes="_x0000_i1134"> (4.3)
Коэффициент детерминации
показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
Чем ближе <img width=«28» height=«24» src=«ref-1_1256657031-219.coolpic» v:shapes="_x0000_i1135"> к 1, тем выше качество модели.
Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции
R R = <img width=«103» height=«86» src=«ref-1_1256657250-630.coolpic» v:shapes="_x0000_i1136">= <img width=«85» height=«86» src=«ref-1_1256657880-634.coolpic» v:shapes="_x0000_i1137"> (4.4)
Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных.
При построении однофакторной модели он равен коэффициенту линейной корреляции
Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным. Также для оценки точности регрессионных моделей целесообразно использовать среднюю относительную ошибку аппроксимации: <img width=«12» height=«19» src=«ref-1_1256658514-73.coolpic» v:shapes="_x0000_i1138">
<img width=«310» height=«56» src=«ref-1_1256658587-1325.coolpic» v:shapes="_x0000_i1139"> ( 4.5)
Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели.
После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров.
Оценить значимость уравнения регрессии– это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y
Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: <img width=«47» height=«21» src=«ref-1_1256659912-134.coolpic» v:shapes="_x0000_i1140">. Альтернативная ей гипотеза о значимости уравнения — гипотеза о неравенстве нулю параметров регрессии.
Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение с n1= kи n2= (n — k- 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой. Для модели парной регрессии:
<img width=«257» height=«56» src=«ref-1_1256660046-809.coolpic» v:shapes="_x0000_i1141"> (4.6)
В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины (<img width=«19» height=«24» src=«ref-1_1256660855-101.coolpic» v:shapes="_x0000_i1142">) называется стандартной ошибкой оценки.
<img width=«101» height=«69» src=«ref-1_1256660956-511.coolpic» v:shapes="_x0000_i1143"> (4.7)
Для модели парной регрессии
<img width=«91» height=«74» src=«ref-1_1256661467-520.coolpic» v:shapes="_x0000_i1144">
Анализ статистической значимости параметров модели парной регрессии
<img width=«148» height=«31» src=«ref-1_1256661987-533.coolpic» v:shapes="_x0000_i1145">
Значения <img width=«17» height=«24» src=«ref-1_1256662520-94.coolpic» v:shapes="_x0000_i1146">, соответствующие данным <img width=«16» height=«24» src=«ref-1_1256630120-91.coolpic» v:shapes="_x0000_i1147"> при теоретических значениях <img width=«16» height=«15» src=«ref-1_1256633416-88.coolpic» v:shapes="_x0000_i1148"> и <img width=«16» height=«21» src=«ref-1_1256629933-96.coolpic» v:shapes="_x0000_i1149"> являются случайными. Случайными являются и рассчитанные по ним значения коэффициентов <img width=«16» height=«15» src=«ref-1_1256633416-88.coolpic» v:shapes="_x0000_i1150"> и <img width=«16» height=«21» src=«ref-1_1256629933-96.coolpic» v:shapes="_x0000_i1151">.
Надежность получаемых оценок <img width=«16» height=«15» src=«ref-1_1256633416-88.coolpic» v:shapes="_x0000_i1152"> и <img width=«16» height=«21» src=«ref-1_1256629933-96.coolpic» v:shapes="_x0000_i1153"> зависит от дисперсии случайных отклонений (ошибок). По данным выборки эти отклонения и, соответственно, их дисперсия не оцениваются – в расчетах используются отклонения зависимой переменной <img width=«17» height=«24» src=«ref-1_1256630029-91.coolpic» v:shapes="_x0000_i1154">от ее расчетных значений <img width=«18» height=«27» src=«ref-1_1256651339-187.coolpic» v:shapes="_x0000_i1155">: <img width=«127» height=«29» src=«ref-1_1256663535-413.coolpic» v:shapes="_x0000_i1156">. Так как ошибки (остатки) <img width=«16» height=«24» src=«ref-1_1256663948-92.coolpic» v:shapes="_x0000_i1157"> нормально распределены, то среднеквадратическое отклонение ошибок используется для измерения этой вариации. Среднеквадратические отклонения коэффициентов известны как стандартные ошибки (отклонения):
<img width=«428» height=«85» src=«ref-1_1256664040-1901.coolpic» v:shapes="_x0000_i1158">
<img width=«393» height=«80» src=«ref-1_1256665941-1511.coolpic» v:shapes="_x0000_i1159"> (4.8)
где <img width=«15» height=«17» src=«ref-1_1256667452-88.coolpic» v:shapes="_x0000_i1160"> — среднее значение независимой переменной х;
<img width=«20» height=«25» src=«ref-1_1256667540-107.coolpic» v:shapes="_x0000_i1161"> стандартная ошибка, вычисляемая по формуле (4.8);
<img width=«125» height=«51» src=«ref-1_1256667647-465.coolpic» v:shapes="_x0000_i1162">.
Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t-критерия (t–статистики) для соответствующих коэффициентов регрессии:
<img width=«232» height=«67» src=«ref-1_1256668112-869.coolpic» v:shapes="_x0000_i1163"> (4.9)
Затем расчетные значения <img width=«28» height=«25» src=«ref-1_1256668981-115.coolpic» v:shapes="_x0000_i1164"> сравниваются с табличными t
табл. Табличное значение критерия определяется при (n-2) степенях свободы (n - число наблюдений) и соответствующем уровне значимости a(0,1; 0,05)
Если расчетное значение t-критерия с (n - 2) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).
По имеющейся информации о результатах деятельности 19 Российских предприятий, стоящих по рейтингу на первых позициях, построить уравнение линейной зависимости прибыли предприятий от размера собственного капитала.
Собранный статистический материал представлен в таблице 1.
Таблица 1. Данные о величине собственного капитала и прибыли Российских предприятий за 2005
Рейтинг
Название предприятия
Собственный капитал, млн. руб.
Прибыль, млн. руб.
1
2
3
4
1
«Газпром»
2772000
348400
2
РЖД
1851000
237545
3
ОАО «Сургутнефтегаз»
707913
214479
4
РАО «ЕЭС России»
386200
203448
5
Нефтяная компания «ЛУКойл»
222156
126326
6
ГМК «Норильский никель»
208143
118159
7
ТНК-ВР
165000
110400
8
«Связьинвест»
167572
95700
9
Нефтяная компания «Сибнефть»
153000
84800
10
АФК «Система»
150844
76503
11
Сбербанк России
148000
62929
12
“Татнефть”
103653
36876
13
«Северсталь»
103275
34312
14
Нефтегазовая компания «Славнефть»
101270
29923
15
Евраз Груп
77558
29517
16
«Русал»
75600
28512
17
АК «Транснефть»
46629
4608
18
АвтоВАЗ www.tatneft.ru/
43308
1400
19
Магнитогорский металлургический комбинат
28500
1345
На основании имеющихся данных найдем:
1)уравнение прямой регрессии У = а + bX, где У – прибыль предприятий (результативный признак), Х – размер собственного капитала (факторный признак).
2)тесноту связи между прибылью предприятий с помощью линейного коэффициента корреляции rху.
Получили, что коэффициенты регрессии а = 51,61 и b= 0,115. Таким образом, уравнение зависимости прибыли предприятий (У) от величины собственного капитала (Х) имеет вид: У = 51,61 + 0,115Х, т.е. при увеличении размера собственного капитала на 1 млн. руб. прибыль предприятий в среднем увеличивается на 115 тыс. руб.
Коэффициент корреляции rху= 0,867 свидетельствует о сильной и прямой связи между размером собственного капитала и прибылью организации.
Изобразим графически исходные данные о прибыли и размере собственного капитала и полученную прямую зависимости данных признаков.
продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по мировой экономике
Реферат по мировой экономике
Свободные экономические зоны в Республике Беларусь
2 Сентября 2013
Реферат по мировой экономике
Свободные экономические зоны России и перспективы их развития
2 Сентября 2013
Реферат по мировой экономике
Кадровая политика предприятия
2 Сентября 2013
Реферат по мировой экономике
Свободные экономические зоны их сущность и возможности
2 Сентября 2013