Реферат: Использование корреляционно-регрессионного анализа для обработки экономических статистических данных

Министерство образования Российской Федерации

Ивановский государственный университетФизический факультетКафедратеоретической физики,математическогои компьютерного моделирования

КУРСОВАЯ РАБОТА

на тему

“Использованиекорреляционно-регрессионного анализа для обработки экономических статистическихданных”

Выполнил:

студент 3 курса Одинокий А.В.

Научный руководитель:

доцентОзерова В.М.

Иваново2002


СОДЕРЖАНИЕ

1.  Введение

2.  Роль корреляцонно-регрессионного анализа в обработке экономических данных

3.  Корреляционно-регрессионный анализ и его возможности

4.  Предпосылки корреляционного и регрессионного анализа

5.   Пакетанализа Microsoft Excel

6.  Заключение

7.  Литература


Введение

Обработка статистических данных  уже давно  применяется в самых разнообразных видах человеческой деятельности. Вообще говоря, трудноназвать ту сферу, в которой она бы не использовалась. Но, пожалуй, ни в однойобласти знаний и практической деятельности обработка статистических данных  неиграет такой исключительно большой роли, как в экономике, имеющей дело собработкой и анализом огромных массивов информации о социально-экономическихявлениях и процессах. Всесторонний и глубокий анализ этой информации, такназываемых статистических данных, предполагает использование различных специальныхметодов, важное место среди которых занимает корреляционный и регрессионныйанализы обработки статистических данных.

В экономических исследованиях часто решают задачувыявления факторов, определяющих уровень и динамику экономического процесса.Такая задача чаще всего решается методами корреляционного и регрессионногоанализа. Для достоверного отображения объективно существующих в экономикепроцессов необходимо выявить существенные взаимосвязи и не только выявить, но идать им количественную оценку. Этот подход требует вскрытия причинныхзависимостей. Под причинной зависимостью понимается такая связь междупроцессами, когда изменение одного из них является следствием изменениядругого.

Основными задачами корреляционного анализа являются оценкасилы связи и проверка статистических гипотез о наличии и силе корреляционнойсвязи. Не все факторы, влияющие на экономические процессы, являются случайнымивеличинами, поэтому при анализе экономических явлений обычно рассматриваютсясвязи между случайными и неслучайными величинами. Такие связи называютсярегрессионными, а метод математической статистики, их изучающий, называетсярегрессионным анализом.

Использование возможностей современной вычислительнойтехники, оснащенной пакетами программ машинной обработки статистическойинформации на ЭВМ, делает практически осуществимым оперативное решение задачизучения взаимосвязи показателей биржевых ставок  методамикорреляционно-регрессионного анализа.

При машинной обработке исходной информации на ЭВМ,оснащенных пакетами стандартных программ ведения анализов, вычислениепараметров применяемых математических функций является быстро выполняемойсчетной операцией.

Данная работа посвящена изучению возможности обработкистатистических данных биржевых ставок методами корреляционного и регрессионного анализа с использованием пакета прикладных программ Microsoft Excel.


Ролькорреляцонно-регрессионного анализа в обработке экономических данных

Корреляционный анализ и регрессионный анализ являютсясмежными разделами математической статистики, и предназначаются для изучения повыборочным данным статистической зависимости ряда величин; некоторые из которыхявляются случайными. При статистической зависимости величины не связаныфункционально, но как случайные величины заданы совместным распределениемвероятностей. Исследование взаимосвязи случайных величин биржевых ставокприводит к теории корреляции, как разделу теории вероятностей и корреляционномуанализу, как разделу математической статистики. Исследование зависимостислучайных величин приводит к моделям регрессии и регрессионному анализу на базевыборочных данных. Теория вероятностей и математическая статистика представляютлишь инструмент для изучения статистической зависимости, но не ставят своейцелью установление причинной связи. Представления и гипотезы о причинной связидолжны быть привнесены из некоторой другой теории, которая позволяетсодержательно объяснить изучаемое явление.

 Формально корреляционная модель взаимосвязи системыслучайных величин />может бытьпредставлена в следующем виде: />, где Z –набор случайных величин, оказывающих влияние на изучаемые случайные величины.

Экономические данные почти всегда представлены в видетаблиц. Числовые данные, содержащиеся в таблицах, обычно имеют между собойявные (известные) или неявные (скрытые) связи.

Явно связаны показатели, которые получены методами прямогосчета, т. е. вычислены по заранее известным формулам. Например, процентывыполнения плана, уровни, удельные веса, отклонения в сумме, отклонения впроцентах, темпы роста, темпы прироста, индексы и т. д.

Связи же второго типа (неявные) заранее неизвестны. Однаконеобходимо уметь объяснять и предсказывать (прогнозировать) сложные явления длятого, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятсявыявить скрытые зависимости и выразить их в виде формул, т. е. математическисмоделировать явления или процессы. Одну из таких возможностей предоставляеткорреляционно-регрессионный анализ.

Математические модели строятся и используются для трехобобщенных целей:

• для объяснения;

• для предсказания;

• для управления.

Представление экономических и других данных в электронныхтаблицах в наши дни стало простым и естественным. Оснащение же электронныхтаблиц средствами корреляционно-регрессионного анализа способствует тому, чтоиз группы сложных, глубоко научных и потому редко используемых, почтиэкзотических методов, корреляционно-регрессионный анализ превращается дляспециалиста в повседневный, эффективный и оперативный аналитический инструмент.Однако, в силу его сложности, освоение его требует значительно больших знаний иусилий, чем освоение простых электронных таблиц.

Пользуясь методами корреляционно-регрессионного анализа,аналитики измеряют тесноту связей показателей с помощью коэффициентакорреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые,умеренные и др.) и различные по направлению (прямые, обратные). Если связиокажутся существенными, то целесообразно будет найти их математическое выражениев виде регрессионной модели и оценить статистическую значимость модели. Вэкономике значимое уравнение используется, как правило, для прогнозированияизучаемого явления или показателя.

Регрессионный анализ называют основным методом современнойматематической статистики для выявления неявных и завуалированных связей междуданными наблюдений. Электронные таблицы делают такой анализ легко доступным.Таким образом, регрессионные вычисления и подбор хороших уравнений — этоценный, универсальный исследовательский инструмент в самых разнообразныхотраслях деловой и научной деятельности (маркетинг, торговля, медицина и т.д.). Усвоив технологию использования этого инструмента, можно применять его помере необходимости, получая знание о скрытых связях, улучшая аналитическуюподдержку принятия решений и повышая их обоснованность.

Корреляционно-регрессионный анализ считается одним изглавных методов в маркетинге, наряду с оптимизационными расчетами, а такжематематическим и графическим моделированием трендов (тенденций). Широкоприменяются как однофакторные, так и множественные регрессионные модели.


Корреляционно-регрессионныйанализ и его возможности

Корреляционный анализ является одним из методовстатистического анализа взаимосвязи нескольких признаков.

Он определяется как метод,применяемый тогда, когда данные наблюдения можно считать случайными ивыбранными из генеральной совокупности, распределенной по многомерномунормальному закону. Основная задача корреляционного анализа (являющаясяосновной и в регрессионном анализе) состоит в оценке уравнения регрессии.

Корреляция – это статистическая зависимость междуслучайными величинами, не имеющими строго функционального характера, прикоторой изменение одной из случайных величин приводит к изменениюматематического ожидания другой.

1.        Парная корреляция – связь междудвумя признаками (результативным и факторным или двумя факторными).

2.        Частная корреляция – зависимостьмежду результативным и одним факторным признаками при фиксированном значениидругих факторных признаков.

3.        Множественная корреляция –зависимость результативного и двух или более факторных признаков, включенных висследование.

Корреляционный анализ имеет своей задачейколичественное определение тесноты связи между двумя признаками (при парнойсвязи) и между результативным признаком и множеством факторных признаков (примногофакторной связи).

Теснота связи количественно выражается величинойкоэффициентов корреляции. Коэффициенты корреляции, представляя количественнуюхарактеристику тесноты связи между признаками, дают возможность определить«полезность» факторных признаков при построении уравнений множественнойрегрессии. Величина коэффициентов корреляции служит также оценкой соответствияуравнению регрессии выявленным причинно-следственным связям.

Первоначально исследования корреляции проводились вбиологии, а позднее распространились и на другие области, в том числе насоциально-экономическую. Одновременно с корреляцией начала использоваться ирегрессия. Корреляция и регрессия тесно связаны между собой: первая оцениваетсилу (тесноту) статистической связи, вторая исследует ее форму. И корреляция, ирегрессия служат для установления соотношений между явлениями и для определенияналичия или отсутствия связи между ними.


Предпосылки корреляционного и регрессионного анализа

Перед рассмотрением предпосылок корреляционного ирегрессионного анализа, следует сказать, что общим условием, позволяющимполучить более стабильные результаты при построении корреляционных ирегрессионных моделей биржевых ставок, является требование однородностиисходной информации. Эта информация должна быть обработана на предметаномальных, т.е. резко выделяющихся из массива данных, наблюдений. Этапроцедура выполняется за счет количественной оценки однородности совокупностипо какому-либо одномерному или многомерному критерию (в зависимости от исходнойинформации) и имеет цель тех объектов наблюдения, у которых наилучшее (илинаихудшее) условия функционирования по не зависящим или слабо зависящимпричинам.

После обработки данных на предмет «аномальности»следует провести проверку, насколько оставшаяся информация удовлетворяетпредпосылкам для использования статического аппарата при построении моделей,так как даже незначительные отступления от этих предпосылок часто сводят к нулюполучаемый эффект. Следует иметь  ввиду, что вероятностное или  статистическоерешение любой экономической задачи должно основываться на подробном осмысленииисходных математических понятий и предпосылок, корректности и объективностисбора исходной информации, в постоянном сочетании с теснотой связиэкономического и математико-статистического анализа.

Для применения корреляционного анализа необходимо,чтобы все рассматриваемые переменные были случайными и имели нормальный законраспределения. Причем выполнение этих условий необходимо только привероятностной оценке выявленной тесноты связи.

Рассмотрим простейшие случай выявления тесноты связи –двумерную модель корреляционного анализа.

Для характеристики тесноты связи между двумяпеременными обычно пользуются парным коэффициентом корреляции />, если рассматриватьгенеральную совокупность, или его оценкой – выборочным парным коэффициентом />, если изучается выборочнаясовокупность. Парный коэффициент корреляции в случае линейной формы связивычисляют по формуле

/>,

а его выборочное значение – по формуле />

При малом числе наблюдений выборочный коэффициенткорреляции удобно вычислять по следующей формуле:

/>

Величина коэффициента корреляции изменяется винтервале />.

При /> междудвумя переменными существует функциональная связь, при /> - прямая функциональнаясвязь. Если />, то значение Х и У ввыборке некоррелированы; в случае, если система случайных величин /> имеет двумерное нормальноераспределение, то величины Х и У будут и независимыми.

Если коэффициент корреляции находится в интервале />, то между величинами Х и Усуществует обратная корреляционная связь. Это находит подтверждение и привизуальном анализе исходной информации. В этом случае отклонение величины У отсреднего значения взяты с обратным знаком.

Если каждая пара значений величин Х и У чаще всегоодновременно оказывается выше (ниже) соответствующих средних значений, то междувеличинами существует прямая корреляционная связь и коэффициент корреляциинаходится в интервале />.

Если же отклонение величины Х от среднего значенияодинаково часто вызывают отклонения величины У вниз от среднего значения и приэтом отклонения оказываются все время различными, то можно предполагать, чтозначение коэффициента корреляции стремится к нулю.

Следует отметить, что значение коэффициента корреляциине зависит от единиц измерения и выбора начала отсчета. Это означает, что еслипеременные Х и У уменьшить (увеличить) в К раз либо на одно и то же число С, токоэффициент корреляции не изменится.


Пакет анализа MicrosoftExcel

 

В состав Microsoft Excel входит набор средств анализаданных (так называемый пакет анализа), предназначенный для решения сложныхстатистических и инженерных задач. Для проведения анализа данных с помощью этихинструментов следует указать входные данные и выбрать параметры; анализ будетпроведен с помощью подходящей статистической или инженерной макрофункции, арезультат будет помещен в выходной диапазон. Другие средства позволяютпредставить результаты анализа в графическом виде.

Графические изображения используются прежде всего длянаглядного представления статистических данных, благодаря им существеннооблегчается их восприятие и понимание. Существенна их роль и тогда, когда речьидет о контроле полноты и достоверности исходного статистического материала,используемого для обработки и анализа.

Статистические данные приводятся в виде длинных и сложныхстатистических таблиц (см., например, табл.1), поэтому бывает весьма труднообнаружить в них имеющиеся неточности и ошибки.

Графическое же представление статистических данныхпомогает легко и быстро выявить ничем не оправданные пики и впадины, явно несоответствующие изображаемым статистическим данным, аномалии и отклонения. Награфике, построенном по данным таблицы 1 (рис.1),  наглядно показанораспределение курса биржевых ставок в зависимости от времени совершения сделкии цены сделки в рублях.

Графическое представление статистических данных являетсяне только средством иллюстрации статистических данных и контроля ихправильности и достоверности. Благодаря своим свойствам оно является важнымсредством толкования и анализа статистических данных, а в некоторых случаях — единственным и незаменимым способом их обобщения и познания. В частности, ононезаменимо при одновременном изучении нескольких взаимосвязанных экономических явлений,так как позволяет с первого взгляда установить существующие между нимисоотношения и связи, различие и подобие, а также выявить особенности ихизменений во времени.

Однако, чтобы эффективнее использовать графическиеизображения статистических данных, необходимо овладеть методикой и техникой ихпостроения. К этому следует добавить, что построенное  графическое изображениестатистических данных биржевых ставок в наибольшей степени соответствует характеру и содержанию изображаемых данных и поставленной задаче их анализа.


Время

Цена сделки
в рублях

11:16:45 99,45 11:21:53 99,4 11:23:09 99,31 11:23:37 99,31 11:24:49 99 11:24:57 99 11:48:40 98,61 11:49:45 98,99 11:53:51 98,66 11:55:05 98,65 11:55:24 98,7 11:58:18 98,8 11:58:18 98,8 11:58:24 98,65 11:58:35 98,8

Таблица 1. Выборка биржевых ставок относительновремени совершения сделки и цены сделки в рублях за один день работы биржи


/>

Рис.1 Распределение курса биржевых ставок в зависимости от времени совершения сделкии цены сделки в рублях.


Корреляция — один из инструментов пакета анализа Microsoft Excel.Используется для количественной оценки взаимосвязи двух наборов данных,представленных в безразмерном виде. Коэффициент корреляции выборки представляетсобой ковариацию двух наборов данных, деленную на произведение их стандартныхотклонений.

Корреляционный анализ дает возможность установитьассоциированы ли наборы данных по величине, то есть: большие значения из одногонабора данных связаны с большими значениями другого набора (положительнаякорреляция); или, наоборот, малые значения одного набора связаны с большимизначениями другого (отрицательная корреляция); или данные двух диапазонов никакне связаны (корреляция близка к нулю).

Регрессия также является инструментом пакета анализа данныхMicrosoft Excel… Линейный регрессионный анализзаключается в подборе графика для набора наблюдений с помощью метода наименьшихквадратов. Регрессия используется для анализа воздействия на отдельнуюзависимую переменную значений одной или более независимых переменных. Например,на курс биржевых ставок влияют несколько факторов, включая такие, как времясовершения сделки и  ее цена. Регрессия пропорционально распределяет мерукачества по этим двум факторам на основе данных функционирования курса биржевыхставок. Результаты регрессии могут быть использованы для предсказания качествновых, не совершенных еще биржевых сделок. Например, используя результатытаблицы 1, можно с помощью регрессии предсказать цены следующих сделок.

Наблюдение Предсказанная цена сделки в рублях Остатки 1 72,22015 27,22985 2 72,76796 26,63204 3 72,90313 26,40687 4 72,95293 26,35707 5 73,08099 25,91901 6 73,09522 25,90478 7 75,62617 22,98383 8 75,74178 23,24822 9 76,17932 22,48068 10 76,31094 22,33906 11 76,34473 22,35527 12 76,65421 22,14579 13 76,65421 22,14579 14 76,66488 21,98512 15 76,68444 22,11556

 

Табл.2.Предсказаннаяцена сделки в рублях


 

Заключение

 

Наиболее сложным этапом,завершающим регрессионный анализ, является интерпретация полученныхрезультатов, т.е. перевод их с языка статистики и математики на язык экономики.

Интерпретация моделей регрессии осуществляетсяметодами той отрасли знаний, к которой относятся исследуемые явления. Всякаяинтерпретация начинается со статистической оценки уравнения регрессии в целом иоценки значимости входящих в модель факторных признаков, т.е. с изучения, какони влияют на величину результативного признака. Чем больше величинакоэффициента регрессии, тем значительнее влияние данного признака намоделируемую обработку биржевых ставок. Особое значение при этом имеет знакперед коэффициентом регрессии. Знаки коэффициентов регрессии говорят охарактере влияния на результативный признак статистической обработки биржевыхставок. Если факторный признак имеет плюс, то с увеличением данного факторарезультативный признак возрастает; если факторный признак со знаком минус, то сего увеличением результативный признак уменьшается. Интерпретация этих знаковполностью определяется социально-экономическим содержанием моделируемогопризнака. Если его величина изменяется в сторону увеличения, то плюсовые знакифакторных признаков имеют положительное влияние. При изменении результативногопризнака в сторону снижения положительные значения имеют минусовые знакифакторных признаков. Если экономическая теория подсказывает, что факторныйпризнак должен иметь положительное значение, а он со знаком минус, тонеобходимо проверить расчеты параметров уравнения регрессии.

Корреляционный и регрессионный анализ позволяетопределить зависимость между факторами, а так же проследить влияниезадействованных факторов. Эти показатели имеют широкое применение в обработкестатистических данных для достижения наилучших показателей биржевых ставок.

Литература

1.        В.А. Колемаев, О.В. Староверов,В.Б. Турундаевский «Теория

 вероятностей и математическая сатистика»/ М., 1991.

2.        «Теория Статистики» под редакциейР.А. Шмойловой/ «ФиС», 1998.

3.        «Многомерный статистический анализна ЭBM  с использованием

пакета Microsoft Excel»/ М., 1997.

4.        А.А. Френкель, Е.В. Адамова«Корреляционно регрессионный

анализ в экономических приложениях»/ М., 1987.

5.        И.Д.Одинцов «Теория статистики»/М., 1998.

6.        А.Н. Кленин, К.К. Шевченко«Математическая статистика для

экономистов-статистиков»/ М., 1990.

еще рефераты
Еще работы по экономико-математическому моделированию