Реферат: Статистика вивчення продуктивності великої рогатої худоби

--PAGE_BREAK--1. Система показників статистики тваринництва


1.1 Методологія розрахунку основних показників статистики тваринництва в сегменті великої рогатої худоби (ВРХ)
Продукція тваринництва поділяється на дві групи:

1) продукція нормальної життєдіяльності тварин, реалізація якої для вживання за межами тваринництва не пов'язана з забоєм (ліквідуванням) самих тварин (молоко, вовна, яйця, мед і т. п.). У створенні цієї продукції тварини виступають в якості засобів праці;

2) продукція приплоду і приросту, або продукція вирощування тварин. Реалізація цієї продукції за межами тваринництва пропонує забій тварин. Використання цієї продукції вирощування тварин для відтворення стада пов'язано з подальшим його залишенням в сфері тваринництва. Таким чином, тварини, які ростуть чи відгодовуються, виступають як пов'язані у виробництві предмети праці, або інакше, незавершене виробництво м'ясного контингенту, а також тварин основного стада. Вирощена доросла худоба, племінна, представляє собою закінчену готову продукцію, яка використовується в ролі засобів праці.

Загальний обсяг продукції тваринництва визначається кількістю одержаного приплоду і обсягом приросту вирощеного за рік молодняка худоби, приросту дорослої худоби, одержаного в результаті її відгодівлі, а також кількості молока, вовни, яєць та іншої продукції тваринництва, одержаної у процесі господарського використання худоби та птиці, непов’язаної з її забоєм, облікованою у порівнянних цінах.

Виробництво молока характеризується фактично надоєним коров’ячим, овечим, козиним молоком, незалежно від того, чи було воно реалізовано, чи частина його використана у господарстві на випоювання телят і поросят. Молоко, яке висмоктане телятами при їх підсосному утриманні у виробництво молока не включається.

Середньорічний надій молока від однієї корови наводиться у розрахунку на поголів’я корів на початок року, незалежно від того, чи доїлась корова у даному періоді. У сільськогосподарських підприємствах при визначенні надою молока від однієї корови із загального поголів’я корів у господарстві виключаються корови, що перебувають на відгодівлі, корови м’ясного стада, а також корови, призначені для групового та підсосного утримання телят, якщо ці корови не доїлись.

Молочна продуктивність корів характеризується середньою удійністю корів. Обчислюють два показники: середній надій на одну дійну корову і середній надій від однієї корови молочного стада. Якщо середній надій на одну дійну корову характеризує середній рівень молочної продуктивності корів, то середній надій від однієї корови молочного стада визначає одночасно ступінь використання корів для виробництва молока та рівень їх молочної продуктивності.

До дійних корів належать корови, що за звітний період дали приплід та доїлися у звітному періоді. Ялові корови, що доїлися, до дійних не відносяться.

Основним показником продуктивності корів є другий показник – середньорічний надій молока від однієї корови молочного стада, який ї є основним показником вихідних даних у дійсній курсовій роботі.
1.2 Основні статистичні показники продуктивності ВРХ в Україні у 2006–2007 роках
В табл. 1.1 – 1.3 наведені основні показники тваринництва та продуктивності корів по надою молока в Україні за даними Державного комітету статистики України.




Таблиця 1.1. Тваринництво



Таблиця 1.2. Виробництво продукції тваринництва в Україні



Таблиця 1.3. Темпи виробництва валової продукції сільського господарстваза 2004–2006 роки
    продолжение
--PAGE_BREAK--


Таблиця 1.4. Виробництво основних продуктів тваринництваза січень-вересень 2007 року



Таблиця 1.5. Виробництво основних продуктів тваринництва за січень-грудень 2006 року



2. Статистичні угрупування результатів спостережень за продуктивністю ВРХ
2.1 Результативна та факторні ознаки досліджуємої статистичної вибірки
Другою стадією статистичного дослідження є статистичне зведення і групування, оскільки після збору даних, ми повинні їх звести, згрупувати для обробки.

Зведення – це комплекс послідовних операцій по узагальненню конкретних поодиноких факторів, які утворюють сукупність, для виявлення типових рис і закономірностей, що належать досліджуваному явищу в цілому. Зведення може бути просте і складне.

Просте зведення – це простий підрахунок підсумків первинних статистичних даних.

Складне зведення передбачає групування, види групувальної ознаки, встановлення меж групування, підрахунок групових і узагальнюючих підсумків, а також викладення результатів зведення у вигляді таблиць чи графіків.

Одним із найважливіших методів статистики є групування. Під групуванням в статистиці розуміють розподіл одиниць статистичної сукупності на групи, однорідні в якому-небудь суттєвому відношенні.

Тому в статистиці групування використовується для вирішення різних завдань, таких як, наприклад:

-          визначення і вивчення структури і структурних зрушень сукупності;

-          виявлення соціально-економічних типів явищ і процесів;

-          виявлення і характеризування зв'язків і залежностей між явищами та їх ознаками (таке дослідження має назву аналітичної функції групування).

Відповідно до цих трьох функцій розрізняють різні види групування: структурні, типологічні і аналітичні.

Групування, в результаті якого виділяють однорідні групи або типи явищ, як вираз конкретного суспільного процесу називаються типологічними.

Структурними групуваннями називаються групування, які характеризують розподіл одиниць однотипної сукупності за будь-якою ознакою. Типологічні і структурні групування дуже близькі один до одного: типологічні групування виділяють самі типи, а структурні – вказують питому вагу окремих типів у загальній масі.

Аналітичні групування – це групування, які визначають взаємозв'язок між різними ознаками одиниць статистичної сукупності. За допомогою такого групування можна виявити певні взаємозв'язки між факторними і результативними ознаками. Аналітичні групування є дуже складними і для того, щоб зрозуміти, як вони будуються, необхідно чітко виділити факторні і результативні ознаки в досліджуваному явищі.

Групування можуть бути прості і комбіновані. Прості групування – це такі групування, які здійснені на підставі однієї ознаки. Комбіновані групування – це групування, які здійснені за двома і більше ознаками.

Комбінаційні групування дають можливість комплексного характеризування досліджуваного явища чи процесу.

Для того, щоб зробити групування за кількісною ознакою, необхідно визначитися з кількістю груп та з інтервалом групування.

Величина інтервалу
<img width=«100» height=«43» src=«ref-1_1033374096-232.coolpic» v:shapes="_x0000_i1025">,
де xmax максимальне значення, xmin – мінімальне значення, n – кількість груп сукупності.


Таблиця 2.1. Ранжування вибірки за першою факторною ознакою Xi

<img width=«558» height=«743» src=«ref-1_1033374328-71804.coolpic» v:shapes="_x0000_s1026">



Таблиця 2.2. Ранжування вибірки за другою факторною ознакою Xj

<img width=«520» height=«705» src=«ref-1_1033446132-66479.coolpic» v:shapes="_x0000_i1026">



Таблиця 2.3. Ранжування вибірки за результативною ознакою Y

<img width=«550» height=«705» src=«ref-1_1033512611-71760.coolpic» v:shapes="_x0000_i1027">



<img width=«645» height=«377» src=«ref-1_1033584371-27973.coolpic» v:shapes="_x0000_i1028"><img width=«557» height=«323» src=«ref-1_1033612344-21561.coolpic» v:shapes="_x0000_i1029">

Рис. 2.1. – Попередній графічний аналіз функціональних зв’язків в ранжованих вибірках



2.2 Группування результативної та факторних ознак
Таблиця 2.4. Інтервальний варіаційний ряд розподілу результативної ознаки



Таблиця 2.6. Показники середніх величин інтервалів группування



Таблиця 2.5. Розподіл вибірки на групи за інтервалами результативної ознаки

<img width=«612» height=«852» src=«ref-1_1033633905-98935.coolpic» v:shapes="_x0000_s1027">



3
.
Статистична оцінка продуктивності ВРХ та факторів, що на неї впливають

3.1 Ряди розподілу та їх графічне зображення (огіва, кумулята, гістограма, полігон)
<img width=«531» height=«320» src=«ref-1_1033732840-20731.coolpic» v:shapes="_x0000_i1030">


Рис. 3.1. – Графічне зображення статистичних показників розподілу в групах ряду результативної ознаки Y
3.2 Узагальнюючі показники рядів розподілу, прості та зважені середні величини
Середня величина – це узагальнюючі показник, які характеризують рівень варіруючої ознаки в якісно однорідній сукупності.

Сукупність, яку ми збираємося характеризувати середньою величиною повинна бути:

1)      якісно однорідною, однотипною;

2)      складатися з багатьох одиниць.

Середні величини можуть бути абсолютними або відносними залежно від вихідної бази. Середні можуть бути прості і зважені.

Найбільш простим видом середніх величин є середньоарифметична проста:
<img width=«90» height=«50» src=«ref-1_1033753571-456.coolpic» v:shapes="_x0000_i1031">, (3.1)


де n – кількість одиниць сукупності,

x – варіруюча ознака.

Вона застосовується в тому випадку, коли у нас варіруюча арифметична ознака має різні значення, і є незгруповані дані.

Якщо ж ми маємо згруповані дані, або варіруюча ознака зустрічається декілька раз, то застосовується середня арифметична зважена.
<img width=«81» height=«53» src=«ref-1_1033754027-485.coolpic» v:shapes="_x0000_i1032">, (3.2)


де x – варіруюча ознака,

f – абсолютна кількість повторення варіруючої ознаки.

В табл. 3.1, використовуючи дані розрахунків табл. 2.4–2.5, наведені результати розрахунку середньозваженої середньої величини результативної ознаки Y – середньорічних надоїв молока на 1 корову.
Таблиця 3.1. Розрахунок зважених середніх, моди та медіани методом моментів



3.3 Мажорантність середніх показників та обчислення моди і медіани способом моментів
До середніх структурних відносяться дві величини, які називаються «мода» і «медіана».

Мода (модальна величина) ряду – це така величина, яка найбільш часто зустрічається в даному розподілі.
<img width=«207» height=«49» src=«ref-1_1033754512-631.coolpic» v:shapes="_x0000_i1033"> (3.3)


x0– це нижня межа модального інтервалу.

i – величина інтервалу.

f2 – частота модального інтервалу,

f1 – частота передмодального інтервалу (того, що передує

модальному)

f3 – частота позамодального інтервалу (того, що йде після модального

інтервалу)

Медіаною називається така величина, що займає серединне положення у варіаційному ряду, в якому варіанти розташовані в зростаючому або спадаючому порядку.


Для дискретного ряду: <img width=«77» height=«43» src=«ref-1_1033755143-316.coolpic» v:shapes="_x0000_i1034"> (3.4)

Для варіаційного ряду:<img width=«158» height=«71» src=«ref-1_1033755459-681.coolpic» v:shapes="_x0000_i1035"> (3.5)


x0– це нижня межа медіального інтервалу.

i – величина інтервалу.

Sm-1 – сума накопичених частот до медіанного інтервалу.

fm – частота медіанного інтервалу.

Структурні величини мода і медіана застосовуються для вивчення внутрішньої будови рядів розподілу, тобто їх структури.

В табл. 3.1 наведені результати розрахунків моди та медіани для вибірки результативної ознаки Y.

В табл. 3.2 наведені результати розрахунку показників рядів факторних та результативної ознаки за допомогою «електронних таблиць» Excel –2000 (вбудовані статистичні розрахунки).




Таблиця 3.2. Розрахунок показників рядів факторних та результативної ознаки за допомогою «електронних таблиць» Excel –2000 (вбудовані статистичні розрахунки)

<img width=«558» height=«460» src=«ref-1_1033756140-57430.coolpic» v:shapes="_x0000_i1036">
3.4 Зважені показники варіації рядів розподілу (<img width=«96» height=«29» src=«ref-1_1033813570-327.coolpic» v:shapes="_x0000_i1037">)
Для вимірювання та оцінки варіації використовують абсолютні та відносні характеристики. До абсолютних відносяться: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсія; відносні характеристики представлені низкою коефіцієнтів варіації.    

Варіаційний розмах характеризує діапазон варіації, це різниця між максимальним і мінімальним значеннями ознаки:
<img width=«103» height=«24» src=«ref-1_1033813897-191.coolpic» v:shapes="_x0000_i1038"> (3.6)


Узагальнюючою мірою варіації є середнє відхилення індивідуальних значень ознаки від центру розподілу.

Середня арифметична величина виборки розраховуэться як:
<img width=«73» height=«69» src=«ref-1_1033814088-345.coolpic» v:shapes="_x0000_i1039"> (3.7)
Середньозважене лінійне відхилення: <img width=«111» height=«55» src=«ref-1_1033814433-483.coolpic» v:shapes="_x0000_i1040"> (3.8)

Середнє квадратичне відхилення: <img width=«139» height=«56» src=«ref-1_1033814916-548.coolpic» v:shapes="_x0000_i1041"> (3.9)

Середній квадрат відхилень – дисперсія: <img width=«133» height=«51» src=«ref-1_1033815464-484.coolpic» v:shapes="_x0000_i1042">, (3.10)
де <img width=«16» height=«17» src=«ref-1_1033815948-88.coolpic» v:shapes="_x0000_i1043"> — середнє арифметичне інтервального ряду розподілу, f – частота.

Середнє лінійне та середнє квадратичне відхилення – іменовані числа (в одиницях вимірювання ознаки).

Порівнюючи варіації різних ознак або однієї ознаки у різних сукупнос-тях, використовують відносні характеристики варіації. Коефіцієнти варіації розраховуються як відношення абсолютних, іменованих характеристик до центру розподілу і часто виражаються процентами:
Лінійний коефіцієнт варіації: <img width=«92» height=«44» src=«ref-1_1033816036-251.coolpic» v:shapes="_x0000_i1044"> (3.11)

Квадратичний коефіцієнт варіації: <img width=«89» height=«43» src=«ref-1_1033816287-232.coolpic» v:shapes="_x0000_i1045"> (3.12)
В табл. 3.1 – 3.2 наведені результати розрахунків показників варіації, виконані методом моментів та автоматизованим розрахунком вбудованими алгоритмами статистичної обробки.

Середньозважена величина вибірки методом моментів розраховується на основі таблиць групування 2.4 -2.5, 3.1 по формулі:
<img width=«104» height=«39» src=«ref-1_1033816519-324.coolpic» v:shapes="_x0000_i1046"> (3.13)
де mi — момент першого порядку для групування i – груп вибірки

а – один із показників середніх величин інтервалів в вибірці, для

спрощення вибираємо показник на одному з кінцевих інтервалів
<img width=«147» height=«80» src=«ref-1_1033816843-610.coolpic» v:shapes="_x0000_i1047"> (3.14)


    продолжение
--PAGE_BREAK--4. Кореляційний аналіз продуктивності та факторів, що на неї впливають


4.1 Рангова кореляція – розрахунок коефіцієнта Спірмена (коефіцієнт кореляційних рангів)
Нехай <img width=«100» height=«28» src=«ref-1_1033817453-420.coolpic» v:shapes="_x0000_i1048"> і <img width=«111» height=«25» src=«ref-1_1033817873-358.coolpic» v:shapes="_x0000_i1049"> вибірки з безперервних розподілів (розподіл відмінний від нормального). Кожному значенню <img width=«19» height=«25» src=«ref-1_1033818231-102.coolpic» v:shapes="_x0000_i1050"> поставимо у відповідність його ранг <img width=«25» height=«27» src=«ref-1_1033818333-111.coolpic» v:shapes="_x0000_i1051"> у варіаційному рядові <img width=«73» height=«28» src=«ref-1_1033818444-287.coolpic» v:shapes="_x0000_i1052">. Аналогічно, кожному значенню <img width=«20» height=«25» src=«ref-1_1033818731-100.coolpic» v:shapes="_x0000_i1053"> поставимо у відповідність його ранг <img width=«29» height=«27» src=«ref-1_1033818831-121.coolpic» v:shapes="_x0000_i1054"> у варіаційному рядові <img width=«73» height=«28» src=«ref-1_1033818952-299.coolpic» v:shapes="_x0000_i1055">.

Ранговий коефіцієнт кореляції Спирмена <img width=«24» height=«25» src=«ref-1_1033819251-103.coolpic» v:shapes="_x0000_i1056">, як і звичайний коефіцієнт кореляції, характеризує залежність між вибірками випадкових величин. Вибірковим значенням рангового коефіцієнта кореляції Спирмена <img width=«24» height=«25» src=«ref-1_1033819251-103.coolpic» v:shapes="_x0000_i1057">називають величину
<img width=«172» height=«77» src=«ref-1_1033819457-806.coolpic» v:shapes="_x0000_i1058"> (4.1)
Коефіцієнт <img width=«17» height=«25» src=«ref-1_1033820263-94.coolpic» v:shapes="_x0000_i1059"> – непараметрична міра залежності між <img width=«15» height=«19» src=«ref-1_1033820357-90.coolpic» v:shapes="_x0000_i1060"> і <img width=«15» height=«19» src=«ref-1_1033820447-173.coolpic» v:shapes="_x0000_i1061">.

Гіпотеза <img width=«91» height=«25» src=«ref-1_1033820620-288.coolpic» v:shapes="_x0000_i1062"> при альтернативній гіпотезі <img width=«89» height=«25» src=«ref-1_1033820908-289.coolpic» v:shapes="_x0000_i1063"> перевіряється за допомогою статистики
<img width=«188» height=«60» src=«ref-1_1033821197-615.coolpic» v:shapes="_x0000_i1064"> (4.2)




Якщо <img width=«127» height=«28» src=«ref-1_1033821812-319.coolpic» v:shapes="_x0000_i1065">, то гіпотеза <img width=«91» height=«25» src=«ref-1_1033820620-288.coolpic» v:shapes="_x0000_i1066"> відхиляється (тобто між <img width=«15» height=«19» src=«ref-1_1033820357-90.coolpic» v:shapes="_x0000_i1067"> і <img width=«15» height=«19» src=«ref-1_1033820447-173.coolpic» v:shapes="_x0000_i1068"> існує рангова кореляційна залежність), і не відхиляється в противному випадку. Рівень значимості критерію <img width=«17» height=«16» src=«ref-1_1033822682-168.coolpic» v:shapes="_x0000_i1069">.

Порахуємо коефіцієнт Спирмена між Xi і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
<img width=«342» height=«52» src=«ref-1_1033822850-1865.coolpic» v:shapes="_x0000_i1070">

N – обсяг вибірок

Spearman R – коефіцієнт рангової кореляції Спирмена <img width=«17» height=«25» src=«ref-1_1033820263-94.coolpic» v:shapes="_x0000_i1071">

t (N‑2) – статистика <img width=«36» height=«25» src=«ref-1_1033824809-127.coolpic» v:shapes="_x0000_i1072"> для перевірки гіпотези <img width=«91» height=«25» src=«ref-1_1033820620-288.coolpic» v:shapes="_x0000_i1073">

p-level – р-уровень

Тому що <img width=«255» height=«27» src=«ref-1_1033825224-813.coolpic» v:shapes="_x0000_i1074">, то гіпотеза <img width=«91» height=«25» src=«ref-1_1033820620-288.coolpic» v:shapes="_x0000_i1075"> відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).

Ранговий кореляційний зв'язок між Xi і Y є значимим.

Порахуємо коефіцієнт Спирмена між Xj і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
<img width=«341» height=«51» src=«ref-1_1033826325-1797.coolpic» v:shapes="_x0000_i1076">
Тому що <img width=«253» height=«27» src=«ref-1_1033828122-791.coolpic» v:shapes="_x0000_i1077">, то гіпотеза <img width=«91» height=«25» src=«ref-1_1033820620-288.coolpic» v:shapes="_x0000_i1078"> відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).

Ранговий кореляційний зв'язок між Xj і Y є значимим.

На основі наведених даних спостережень будуються лінійна одновимірні Y=f(Xi) та багатовимірні Y=f (Xi, Xj) регресійні моделі, які встановлюютьє залежність результативної ознаки Y – середньорічного рівня надою молока від факторних ознак – Xi (кількості кормів на одну корову) та Xj (рівня приплоду телят на 100 корів) по 30 хазяйствам.

Одновимірна лінійна регресійна модель представляється як:
<img width=«139» height=«25» src=«ref-1_1033829201-263.coolpic» v:shapes="_x0000_i1079">, (4.3)
де <img width=«21» height=«25» src=«ref-1_1033829464-101.coolpic» v:shapes="_x0000_i1080"> – постійна складова доходу <img width=«20» height=«25» src=«ref-1_1033829565-106.coolpic» v:shapes="_x0000_i1081"> (початок відліку);

<img width=«19» height=«25» src=«ref-1_1033829671-99.coolpic» v:shapes="_x0000_i1082"> – коефіцієнт регресії;

<img width=«15» height=«25» src=«ref-1_1033829770-97.coolpic» alt="*" v:shapes="_x0000_i1083">      – відхилення фактичних значень надою <img width=«20» height=«25» src=«ref-1_1033829565-106.coolpic» v:shapes="_x0000_i1084"> від оцінки (математичного сподівання) <img width=«20» height=«25» src=«ref-1_1033829973-100.coolpic» v:shapes="_x0000_i1085"> середньої величини надою в і-тому хазяйстві.

Існують різні способи оцінювання параметрів регресії. Найпростішим, найуніверсальнішим є метод найменших квадратів [48]. За цим методом параметри визначаються виходячи з умови, що найкраще наближення, яке мають забезпечувати параметри регресії, досягається, коли сума квадратів різниць <img width=«15» height=«25» src=«ref-1_1033829770-97.coolpic» v:shapes="_x0000_i1086"> між фактичними значеннями доходу та його оцінками є мінімальною, що можна записати як
<img width=«103» height=«55» src=«ref-1_1033830170-467.coolpic» v:shapes="_x0000_i1087">. (4.4)
Відмітимо, що залишкова варіація (4.4) є функціоналом <img width=«73» height=«25» src=«ref-1_1033830637-323.coolpic» v:shapes="_x0000_i1088"> від параметрів регресійного рівняння:
<img width=«417» height=«55» src=«ref-1_1033830960-1255.coolpic» v:shapes="_x0000_i1089"> (4.5)
За методом найменших квадратів параметри регресії <img width=«21» height=«25» src=«ref-1_1033829464-101.coolpic» v:shapes="_x0000_i1090"> і <img width=«19» height=«25» src=«ref-1_1033829671-99.coolpic» v:shapes="_x0000_i1091"> є розв’язком системи двох нормальних рівнянь [48]:


<img width=«311» height=«55» src=«ref-1_1033832415-1115.coolpic» v:shapes="_x0000_i1092">, (4.6)

<img width=«292» height=«55» src=«ref-1_1033833530-1079.coolpic» v:shapes="_x0000_i1093">.
Розв’язок цієї системи має вигляд:
<img width=«205» height=«119» src=«ref-1_1033834609-1347.coolpic» v:shapes="_x0000_i1094">, (4.7)

<img width=«160» height=«79» src=«ref-1_1033835956-628.coolpic» v:shapes="_x0000_i1095">.
Середньоквадратична помилка регресії, знаходиться за формулою
<img width=«143» height=«83» src=«ref-1_1033836584-753.coolpic» v:shapes="_x0000_i1096">, (4.8)
Коефіцієнт детермінації для даної моделі
<img width=«141» height=«111» src=«ref-1_1033837337-868.coolpic» v:shapes="_x0000_i1097"> (4.9)




повинен дорівнювати: <img width=«25» height=«24» src=«ref-1_1033838205-112.coolpic» v:shapes="_x0000_i1098">>0,75 – сильний кореляційний зв’зок, 0,36><img width=«25» height=«24» src=«ref-1_1033838205-112.coolpic» v:shapes="_x0000_i1099">>0,75 – кореляційний зв’язок середньої щільності; <img width=«25» height=«24» src=«ref-1_1033838205-112.coolpic» v:shapes="_x0000_i1100"><0,36 – кореля-ційній зв’язок низької щільності [48].

Для характеристики кореляційного зв’язку між факторною і результативною ознаками побудуємо графік кореляційного поля та теоретичну лінію регресії, визначимо параметри лінійного рівняння регресії.

Для перевірки істотності зв’язку потрібно порівняти фактичне значення статистики Фішера (F-критерій) з його критичним (табличним) значенням, яке потрібно визначити з урахуванням умов аналітичного групування і заданого рівня істотності, скориставшись таблицею.

При виконанні процедури перевірки значущості коефіцієнта детермінації висувається нульова гіпотеза H0проти альтернативи H1, котрі полягають в наступному:

H0: істотної різниці між вибірковим коефіцієнтом детермінації та коефіцієнтом детермінації генеральної сукупності не існує. Ця гіпотеза рівносильна гіпотезі H0: b=0, тобто змінні X не впливають суттєво на залежну змінну Y. Для оцінки істотності коефіцієнта детермінації використовується статистика:
<img width=«113» height=«48» src=«ref-1_1033838541-491.coolpic» v:shapes="_x0000_i1101"> (4.10)
що має F-розподіл Фішера з f1=1 та f2=n‑2=30–2=28 ступенями вільності.

Значення статистики порівнюється з критичним значенням цієї статистики, знайденим за таблицею при заданому рівні значущості a=0,05 та відповідному числі ступенів вільності. Якщо F>F1,n-2,a, то обчислений коефіцієнт детермінації істотно відрізняється від нуля. Цей висновок забезпечується з ймовірністю 1-a
.
Рівень істотності a
=0,05.
Кількість ступенів вільності наступна: f1=1, f2=28.

Для лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона):
<img width=«309» height=«112» src=«ref-1_1033839032-1593.coolpic» v:shapes="_x0000_i1102"> (4.11)
який набуває значень у межах +-1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про зворотний.

Щільність зв’язку оцінюється індексом детермінації: R=<img width=«35» height=«25» src=«ref-1_1033840625-137.coolpic» v:shapes="_x0000_i1103">, проте інтерпретується тільки R2. Якщо коефіцієнт детермінації більше 0,6, то 60% варіації залежної величини пояснюється варіацією незалежного параметра кореляції і зв’язок є щільним.

На рис. 3.1 – 3.4 наведені лінійні та нелінійні регресійні одномірні моделі кореляційного зв’язку Y=F(Xi) та Y=f(Xj).Як видно з графіків рис. 3.1 – 3.2 коефіцієнт детермінації R2 для лінійної кореляції знаходиться в діапазоні 0,35 – 0,5, тобто лінійний одномірний кореляційний зв’язок є слабої сили. При побудові нелінійних одномірних рівнянь регресії (рис. 3.3 – 3.4) коефіцієнт детермінації R2 для нелінійної кореляції знаходиться в діапазоні 0,5 – 0,7, тобто нелінійний одномірний кореляційний зв’язок є сильним.




<img width=«511» height=«331» src=«ref-1_1033840762-20319.coolpic» v:shapes="_x0000_i1104">


Рис. 3.1. – Побудова лінійної одномірної регресії Y=f(Xi) з використанням «електронних таблиць» Excel-2000
<img width=«521» height=«290» src=«ref-1_1033861081-18063.coolpic» v:shapes="_x0000_i1105">

Рис. 3.2. – Побудова лінійної одномірної регресії Y=f(Xj) з використанням «електронних таблиць» Excel-2000




<img width=«492» height=«337» src=«ref-1_1033879144-21987.coolpic» v:shapes="_x0000_i1106">

Рис. 3.3. – Побудова нелінійної одномірної регресії Y=f(Xi) з використанням «електронних таблиць» Excel-2000
<img width=«531» height=«325» src=«ref-1_1033901131-22100.coolpic» v:shapes="_x0000_i1107">

Рис. 3.4. – Побудова нелінійної одномірної регресії Y=f(Xj) з використанням «електронних таблиць» Excel-2000




4.2 Аналіз множинної кореляції
4.2.1 Перевірка передумови проведення кореляційного аналізу

Лінійна багатовимірна модель (ЛБМ) Y=f (X1, X2) має такий вигляд [68]


y=β0+ β1x1+ … + βpxp                        (4.12)


y – залежна змінна – ендогенна змінна

x1, x2…xp – залежні змінні – екзогенні змінні.

У зв’язку з тим, що економетрична модель обов’язково має випадкову помилку, модель (3.21) переписується у вигляді (4.13)


y=β0+ β1x1+ … + βpxp+ε         (4.13)
де ε – випадкова помилка або перешкода.

Якщо після необхідних обчислень визначені чисельні значення коефіцієнтів β, то кажуть, що ми отримали оцінку коефіцієнтів моделі:<img width=«57» height=«33» src=«ref-1_1033923231-293.coolpic» v:shapes="_x0000_i1108">, тобто оцінкою коефіцієнта β є його чисельне значення b=<img width=«21» height=«33» src=«ref-1_1033923524-216.coolpic» v:shapes="_x0000_i1109">.

Якщо замінити у виразі (4.13) коефіцієнти моделі оцінками, то ми отримаємо такий вираз
<img width=«168» height=«63» src=«ref-1_1033923740-719.coolpic» v:shapes="_x0000_i1110">     (4.14)
Основними передумовами використання моделі (4.12–4.13), а такі моделі ще називаються регресійними багатовимірними моделями, є наступне:

1)           M (ε)=0 математичне сподівання відхилення равно 0;

2)           відхилення взаємонезалежні із змінними cov (xi,<img width=«12» height=«19» src=«ref-1_1033924459-87.coolpic» v:shapes="_x0000_i1111">)=0

3)           для 2‑х визначень відхилень коефіцієнтів коваріації між ними також дорівнює 0 – cov<img width=«76» height=«25» src=«ref-1_1033924546-288.coolpic» v:shapes="_x0000_i1112">

4)           відхилення ε нормально розподілена величина з параметрами (0; 1)


ε=N (ε, 0; 1)
5)           від виміру до виміру дисперсія відхилення не змінюється

<img width=«60» height=«27» src=«ref-1_1033924834-180.coolpic» v:shapes="_x0000_i1113">

П’ята властивість. носить спеціальну назву: гомоскедастичність (одно-рідність). Якщо умова 5) не виконана, то кажуть, що дисперсія має властивість гетероскедастичності.

Чисельний аналіз регресійної моделі починають з того, що визначають значення регресійних коефіцієнтів β1… βрта коефіцієнтів β0, який має спеціальну назву – вільний член.

Регресійні коефіцієнти визначають за допомогою методів найменших квадратів.
<img width=«354» height=«49» src=«ref-1_1033925014-982.coolpic» v:shapes="_x0000_i1114">     (4.15)
Візьмемо частичні похідні по кожному з виразів, дорівняти їх і отримаємо систему рівнянь

<img width=«201» height=«57» src=«ref-1_1033925996-800.coolpic» v:shapes="_x0000_i1115">

Ця система рівнянь має спеціальну назву – нормальна система.
<img width=«348» height=«110» src=«ref-1_1033926796-2127.coolpic» v:shapes="_x0000_i1116"> (4.16)


Невідомі у системі (4.16) – це коефіцієнти в0, в1…

х1, y1– ми маємо внаслідок спостережень

в0, в1– це коефіцієнти, які ми повинні визначити

n – кількість спостережень, вони нам завжди відомі.
4.2.2 Побудова множинного лінійного кореляційного рівняння, розрахунок коефіцієнтів регресії, перевірка суттєвості та визначення парних коефіцієнтів кореляції

Використовуючи таблицю вихідних даних (Додаток А), розраховуємо багатовимірну лінійну регресійну модель за допомогою «електронних таблиць» EXCEL-2000. Результати розрахунків наведені в табл. 4.1

Як видно з даних розрахунків табл. 4.1 – 4.2, лінійні багатовимірні рівняння регресії описують наступні статистичні процеси:

1. Рівняння багатовимірної лінійної регресії:

а) 2‑параметрична модель з «нульовим» вільним членом (n=30).

Y=0,6358*Xi+0,1293*Xj

б) 2‑параметрична модель з значущим вільним членом (n=30).

Y=-19,5974+0,6488*Xi+0,3335*Xj

2. Коефіцієнт детермінації для даних моделей:

а) Коефіцієнт детермінації R2 (2-параметрична модель з «нульовим» вільним членом) = 0,6076 (n=30), сила регресійного зв’язка – середньої щільності (0,36><img width=«25» height=«24» src=«ref-1_1033838205-112.coolpic» v:shapes="_x0000_i1117">>0,75).

б) Коефіцієнт детермінації R2 (2-параметрична модель з значущим вільним членом (n=30).) = 0,6497 (n=30), сила регресійного зв’язка – середньої щільності (0,36><img width=«25» height=«24» src=«ref-1_1033838205-112.coolpic» v:shapes="_x0000_i1118">>0,75).

Згідно з таблицями критичних значень критерія Фішера:

– для багатовимірної (і=2) лінійної вибірки з n‑1=29 величин табличне значення Fтабл = 1,93 при рівні довірчої ймовірності Р=0,95 [48].

Як видно з даних розрахунків (табл. 4.1 –4.2), проведених за допомогою «електронних таблиць» EXCEL-2000, фактичні значення критерія Фішера для багатовимірних вибірок (і=2) з n‑1=29 величин становлять:

а) F (2‑параметрична модель з «нульовим» вільним членом) = 21,6829 (n=30)> 3,33 (табл. критерій Фішера);



Таблиця 4.1. Результати розрахунків багатовимірної лінійної регресійної моделі Y=f (Xi, Xj) за допомогою «електронних таблиць» EXCEL-2000 (варіант з «нульовим» вільним членом)

<img width=«572» height=«695» src=«ref-1_1033929147-87784.coolpic» v:shapes="_x0000_i1119">



Таблиця 4.2. Результати розрахунків багатовимірної лінійної регресійної моделі Y=f (Xi, Xj) за допомогою «електронних таблиць» EXCEL-2000 (варіант з значущим вільним членом)

<img width=«579» height=«773» src=«ref-1_1034016931-99554.coolpic» v:shapes="_x0000_i1120">


б) F (2‑параметрична модель з значущим вільним членом) = 25,038 (n=30)> 3,33 (табл. критерій Фішера);

Тобто набагато перевищують мінімально-критеріальні значення по Фішеру і отримані регресійні багатовимірні рівняння є значущими.


Парні кореляції кореляції Пирсона обчислюються по формулі (наприклад для <img width=«47» height=«23» src=«ref-1_1034116485-241.coolpic» v:shapes="_x0000_i1121">):
<img width=«325» height=«96» src=«ref-1_1034116726-1561.coolpic» v:shapes="_x0000_i1122"> (4.17)
Для перевірки значимості коефіцієнтів кореляції використовують <img width=«25» height=«17» src=«ref-1_1034118287-97.coolpic» v:shapes="_x0000_i1123">критерій. Коефіцієнт кореляції характеризує тісноту лінійного зв'язку між перемінними. Для цього знаходять <img width=«25» height=«17» src=«ref-1_1034118287-97.coolpic» v:shapes="_x0000_i1124">статистику:
<img width=«143» height=«52» src=«ref-1_1034118481-415.coolpic» v:shapes="_x0000_i1125"> (4.18)
Якщо <img width=«92» height=«29» src=«ref-1_1034118896-233.coolpic» v:shapes="_x0000_i1126">, то коефіцієнт кореляції значимий, у противному випадку – немає.

p – р-рівень, що відповідає <img width=«25» height=«17» src=«ref-1_1034118287-97.coolpic» v:shapes="_x0000_i1127">статистиці

Якщо р>0,05, то гіпотеза <img width=«28» height=«25» src=«ref-1_1034119226-117.coolpic» v:shapes="_x0000_i1128">: <img width=«13» height=«15» src=«ref-1_1034119343-86.coolpic» v:shapes="_x0000_i1129"> не значимий не відхиляється.

Якщо р<0,05, то гіпотеза <img width=«28» height=«25» src=«ref-1_1034119226-117.coolpic» v:shapes="_x0000_i1130">: <img width=«13» height=«15» src=«ref-1_1034119343-86.coolpic» v:shapes="_x0000_i1131"> не значимий відхиляється (коефіцієнт кореляції значимий).

Якщо <img width=«44» height=«28» src=«ref-1_1034119632-183.coolpic» v:shapes="_x0000_i1132">, то зв'язок строго функціональний

Якщо <img width=«85» height=«28» src=«ref-1_1034119815-404.coolpic» v:shapes="_x0000_i1133">, то зв'язок сильний (щильний)

Якщо <img width=«101» height=«28» src=«ref-1_1034120219-471.coolpic» v:shapes="_x0000_i1134">, то зв'язок середній

Якщо <img width=«100» height=«28» src=«ref-1_1034120690-474.coolpic» v:shapes="_x0000_i1135">, то зв'язок помірний

Якщо <img width=«87» height=«28» src=«ref-1_1034121164-426.coolpic» v:shapes="_x0000_i1136">, то зв'язок слабкий

Якщо <img width=«47» height=«28» src=«ref-1_1034121590-246.coolpic» v:shapes="_x0000_i1137">, то зв'язок відсутній (x, y некорелльовані)

Розрахунки, виконані спеціалізованою програмою «Статистика» дають наступні характеристики парних коефіцієнтів кореляції:
<img width=«252» height=«170» src=«ref-1_1034121836-12448.coolpic» v:shapes="_x0000_i1138">
Для пари (Xi, Xj) коефіцієнт кореляції дорівнює r (Xi, Xj)=0,37,

p=0,044<0,05, отже, коефіцієнт кореляції значимий.

Для пари (Xi, Y) коефіцієнт кореляції дорівнює r (Xi, Y)=0,7467, p=0,000<0,05, отже, коефіцієнт кореляції значимий.

Для пари (Xj, Y) коефіцієнт кореляції дорівнює r (Xj, Y)=0,5583, p=0,001<0,05, отже, коефіцієнт кореляції значимий.

Множинний коефіцієнт кореляції розраховується за допомогою парних коефіцієнтів кореляції за формулою:
<img width=«401» height=«129» src=«ref-1_1034134284-3218.coolpic» v:shapes="_x0000_i1139"> (4.19)
Що відповідає результатам програмних розрахунків, наведених в табл. 4.2.


4.2.3 Визначення множинного індексу кореляції, мажорантності парних та часткових коефіцієнтів, розрахунок коефіцієнта детермінації, часткових коефіцієнтів детермінації

Коефіцієнт детермінації показує частку розсіювання <img width=«20» height=«25» src=«ref-1_1033829973-100.coolpic» v:shapes="_x0000_i1140"> відносно <img width=«16» height=«23» src=«ref-1_1034137602-100.coolpic» v:shapes="_x0000_i1141">, що порозумівається побудованою регресією. Це коефіцієнт кореляції в квадраті.
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по мировой экономике