Реферат: Зведення та групування даних

--PAGE_BREAK--<shape id="_x0000_i1043" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image037.wmz» o:><img width=«324» height=«42» src=«dopb177934.zip» v:shapes="_x0000_i1043">.
5. Податкова дисципліна підприємств різних видів діяльності характеризується даними:
Таблиці 12.
Вид діяльності
Кількість підприємців, які сплачують податки
Всього, чол.
% до всіх зареєстрованих
Виробнича
18
60
Торгівельна
28
70
Посередницька
44
55
Визначити у середньому за всіма видами діяльності частку підприємців, які сплачують податки.
Розв’язання. Запишемо логічну формулу: <shape id="_x0000_i1044" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image039.wmz» o:><img width=«525» height=«60» src=«dopb177935.zip» v:shapes="_x0000_i1044">
Але ми не маємо даних щодо загальної чисельності підприємців. Тобто використати середню арифметичну ми не можемо. В цьому випадку потрібно застосувати формулу середньої гармонічної:<shape id="_x0000_i1045" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image041.wmz» o:><img width=«80» height=«61» src=«dopb177936.zip» v:shapes="_x0000_i1045"> або <shape id="_x0000_i1046" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image043.wmz» o:><img width=«83» height=«65» src=«dopb177937.zip» v:shapes="_x0000_i1046">.
<shape id="_x0000_i1047" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image045.wmz» o:><img width=«187» height=«53» src=«dopb177938.zip» v:shapes="_x0000_i1047">
6. У таблиці наведений розподіл населення України за рівнем середньодушового сукупного доходу у 1998 р.
Таблиця 13.
Усе населення, млн.
50,3
У тому числі із середньодушовим доходом на місяць, грн.
До 30,0
0,6
30,1 – 60,0
7,3
60,1 – 90,0
14,2
90,1 – 120,0
12,0
120,1 – 150,0
7,0
150,1 – 180,0
3,9
180,1 – 210,0
2,3
210,1 – 240,0
1,1
240,1 – 270,0
0,8
270,1 – 300,0
0,4
Понад 300,0
0,7
Обчислити показники, що характеризують центр розподілу: середній рівень доходу, модальний та медіанний дохід.
Розв’язання.
Обчислення середньої арифметичної інтервального ряду розподілу:
1.           якщо варіаційний інтервальний ряд розподілу має відкриті інтервали, то, перш за все, їх треба закрити за розмірами інтервалів, розташованих поруч.
2.           знаходимо середину інтервалів: до нижньої границі інтервалу додаємо верхню і ділимо на 2.
3.           знаходимо середню, використовуючи замість середньої величини за кожною групою середину інтервалу.

Таблиця 14.
Середина інтервалу
Чисельність населення, млн.
Сукупний дохід, млн. грн.
Кумулятивна частота
15,05
0,6
9,03
0,6
45,05
7,3
328,865
7,9
75,05
14,2
1065,71
22,1
105,05
12
1260,6
34,1
135,05
7
945,35
41,1
165,05
3,9
643,695
45
195,05
2,3
448,615
47,3
225,05
1,1
247,555
48,4
255,05
0,8
204,04
49,2
285,05
0,4
114,02
49,6
315,05
0,7
220,535
50,3
Разом
50,3
5488

Середній рівень доходу: <shape id="_x0000_i1048" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image047.wmz» o:><img width=«115» height=«35» src=«dopb177939.zip» v:shapes="_x0000_i1048">
Модальний дохід: <shape id="_x0000_i1049" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image049.wmz» o:><img width=«298» height=«37» src=«dopb177940.zip» v:shapes="_x0000_i1049">
          Медіанний дохід: <shape id="_x0000_i1050" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image051.wmz» o:><img width=«228» height=«39» src=«dopb177941.zip» v:shapes="_x0000_i1050">   
Модальний інтервал — ( 60,1 – 90,1 ), медіанний інтервал –
                        ( 90,1 – 120,1 ). Середньодушовий дохід складає 109,11 грн., переважна частина населення мала дохід на душу населення 82,77 грн., а половина  всього населення мала середньодушовий дохід менший 90,35 грн.
 Показники варіації
Кредитні ставки комерційних банків під короткострокові позики становили:
Таблиця 15.
За кожний квартал визначити середню кредитну ставку, середнє лінійне відхилення, дисперсію та середньоквадратичне відхилення.
Порівняти варіацію кредитної ставки комерційних банків в I та II кварталі.
Розв’язання.
Наведемо необхідні для розрахунку формули:
Середня арифметична <shape id="_x0000_i1051" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image053.wmz» o:><img width=«77» height=«65» src=«dopb177942.zip» v:shapes="_x0000_i1051"> або <shape id="_x0000_i1052" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image055.wmz» o:><img width=«92» height=«88» src=«dopb177943.zip» v:shapes="_x0000_i1052"> середнє лінійне відхилення <shape id="_x0000_i1053" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image057.wmz» o:><img width=«90» height=«64» src=«dopb177944.zip» v:shapes="_x0000_i1053"> або  <shape id="_x0000_i1054" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image059.wmz» o:><img width=«108» height=«88» src=«dopb177945.zip» v:shapes="_x0000_i1054"> дисперсія <shape id="_x0000_i1055" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image061.wmz» o:><img width=«104» height=«58» src=«dopb177946.zip» v:shapes="_x0000_i1055">  або <shape id="_x0000_i1056" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image063.wmz» o:><img width=«133» height=«88» src=«dopb177947.zip» v:shapes="_x0000_i1056"> середньоквадратичне відхилення<shape id="_x0000_i1057" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image065.wmz» o:><img width=«67» height=«28» src=«dopb177948.zip» v:shapes="_x0000_i1057">коефіцієнт варіації <shape id="_x0000_i1058" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image067.wmz» o:><img width=«77» height=«35» src=«dopb177949.zip» v:shapes="_x0000_i1058">
Таблиця 16.
I квартал
II квартал
Кредитна ставка, %
Сума наданих кредитів, млн. гр. од.
fi
Кредитна ставка, %
Середня кредитна ставка, %
xi
xifi
|xi –x |fi
(xi –x)2fi
Кредитна ставка, %
Сума наданих кредитів, млн. гр. од.
fi
Кредитна ставка, %
Середня кредитна ставка, %
xi
xifi
|xi –x |fi
(xi –x)2fi
Гр. 1
Гр. 2
Гр. 3
Гр. 4
Гр. 5 = гр. 2 .гр. 4
Гр. 6
Гр. 7
Гр. 8
Гр. 9
Гр. 10
Гр. 11
Гр. 12 = гр. 9 .гр. 11
Гр. 13
Гр. 14
До 35
11
25-35
30
330,00
143,00
1859,00
До 35
6
25-35
30
180,00
92,00
1410,67
35 – 45
5
35-45
40
200,00
15,00
45,00
35 – 45
8
35-45
40
320,00
42,67
227,56
45 – 55
8
45-55
50
400,00
56,00
392,00
45 – 55
10
45-55
50
500,00
46,67
217,78
55 і більше
6
55-65
60
360,00
102,00
1734,00
55 і більше
6
55-65
60
360,00
88,00
1290,67
Разом
30


1290,00
316,00
4030,00
Разом
30


1360,00
269,33
3146,67
I квартал: <shape id="_x0000_i1059" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image069.wmz» o:><img width=«203» height=«79» src=«dopb177950.zip» v:shapes="_x0000_i1059"> <shape id="_x0000_i1060" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image071.wmz» o:><img width=«213» height=«81» src=«dopb177951.zip» v:shapes="_x0000_i1060">
<shape id="_x0000_i1061" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image073.wmz» o:><img width=«237» height=«80» src=«dopb177952.zip» v:shapes="_x0000_i1061"><shape id="_x0000_i1062" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image075.wmz» o:><img width=«179» height=«26» src=«dopb177953.zip» v:shapes="_x0000_i1062"><shape id="_x0000_i1063" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image077.wmz» o:><img width=«215» height=«39» src=«dopb177954.zip» v:shapes="_x0000_i1063">
II квартал: <shape id="_x0000_i1064" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image079.wmz» o:><img width=«208» height=«79» src=«dopb177955.zip» v:shapes="_x0000_i1064"> <shape id="_x0000_i1065" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image081.wmz» o:><img width=«211» height=«81» src=«dopb177956.zip» v:shapes="_x0000_i1065">
<shape id="_x0000_i1066" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image083.wmz» o:><img width=«240» height=«80» src=«dopb177957.zip» v:shapes="_x0000_i1066"><shape id="_x0000_i1067" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image085.wmz» o:><img width=«184» height=«26» src=«dopb177958.zip» v:shapes="_x0000_i1067"><shape id="_x0000_i1068" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image087.wmz» o:><img width=«220» height=«39» src=«dopb177959.zip» v:shapes="_x0000_i1068">
Варіація кредитної ставки в II кварталі менша, оскільки значення коефіцієнта варіації в II кварталі менше.
Вибіркове спостереження 1. За результатами обстеження 100 зареєстрованих безробітних ( 2 % вибірка ), з яких 40 проходять перенавчання за новою професією, середня тривалість перерви в роботі становить 3 місяці, а дисперсія дорівнює 2,25. Визначити довірчий інтервал середньої тривалості перерви в роботі та частки безробітних, які проходять перенавчання за новою професією та відносні похибки цих показників.
 Розв’язання.
Визначимо межі середньої тривалості перерви в роботі з імовірністю 0,954 ( t = 2).
Гранична похибка <shape id="_x0000_i1069" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image089.wmz» o:><img width=«61» height=«24» src=«dopb177960.zip» v:shapes="_x0000_i1069">, де <shape id="_x0000_i1070" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image091.wmz» o:><img width=«77» height=«48» src=«dopb177961.zip» v:shapes="_x0000_i1070"> <shape id="_x0000_i1071" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image093.wmz» o:><img width=«203» height=«41» src=«dopb177962.zip» v:shapes="_x0000_i1071">Довірчий інтервал <shape id="_x0000_i1072" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image095.wmz» o:><img width=«131» height=«25» src=«dopb177963.zip» v:shapes="_x0000_i1072"> , тобто <shape id="_x0000_i1073" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image097.wmz» o:><img width=«115» height=«23» src=«dopb177964.zip» v:shapes="_x0000_i1073">
Це дає підставу стверджувати з імовірністю 0,954, що середня тривалість перерви в роботі становить не менш як 2,7 і не більш як 3,3 місяця.
Для того, щоб визначити граничну похибку частки безробітних, які перенавчаються, обчислимо дисперсію частки: σ2= 0,4(1-0,4)=0,24. Частка р = 40 / 100 = 0,4.
Гранична похибка <shape id="_x0000_i1074" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image099.wmz» o:><img width=«249» height=«41» src=«dopb177965.zip» v:shapes="_x0000_i1074">Довірчий інтервал <shape id="_x0000_i1075" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image101.wmz» o:><img width=«174» height=«22» src=«dopb177966.zip» v:shapes="_x0000_i1075">
Отже, з такою самою імовірністю можна стверджувати, що частка безробітних, які перенавчаються, у генеральній сукупності становить не менше як 20,2 % і не більш як 39,8 %.
Відносна похибка середньої тривалості перерви в роботі <shape id="_x0000_i1076" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image103.wmz» o:><img width=«157» height=«37» src=«dopb177967.zip» v:shapes="_x0000_i1076">
Відносна похибка частки безробітних, які перенавчаються, становить <shape id="_x0000_i1077" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image105.wmz» o:><img width=«182» height=«40» src=«dopb177968.zip» v:shapes="_x0000_i1077"> Таким чином, відносна похибка частки більш ніж в два рази перевищує похибку середньої перерви в роботі.
2. На лісовому масиві в 400 га передбачається визначити  загальний запас деревини. Пробні площі становлять 0,1 га. За даними попередніх обстежень дисперсія виходу деревини з 0,1 га становила 9. Скільки пробних площ необхідно обстежити, щоб похибка вибірки з імовірністю 0,954 не перевищила 1 м3?
Розв’язання.
Всього на даному масиві 4000 ділянок. Достатній обсяг вибірки пробних ділянок визначимо, виразивши з формули граничної похибки невідомий показник: <shape id="_x0000_i1078" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image107.wmz» o:><img width=«382» height=«41» src=«dopb177969.zip» v:shapes="_x0000_i1078"> 
Методи аналізу взаємозв’язків 1. Маємо дані щодо кредитового обороту обласних філій банку та кількості їх клієнтів. Керівництво банку вважає, що між цими показниками існує певна залежність, і хоче знати, як функціонально кредитовий оборот філії залежить від кількості клієнтів банку.  Потрібно перевірити, чи лінійною є залежність між даними показниками, побудувати модель лінійної парної регресії, яка б характеризувала дану залежність, а також:
а) виконати перевірку статистичної значимості оцінок параметрів, знайдених за методом найменших квадратів, та знайти інтервали довіри для параметрів b,b1;
б) знайти коефіцієнти еластичності, пояснити їх зміст;
в) знайти коефіцієнти кореляції та детермінації, за допомогою знайдених коефіцієнтів описати вплив розглядуваного фактору на результат;
г) виконати перевірку моделі на адекватність;
д) знайти інтервальні прогнози індивідуального значення для будь-якого значення незалежної змінної. 
Для десяти філій маємо зафіксовані значення показників y, x:
                                                                                                     Таблиця 17.
Обласні філіїї банку
Кредитовий оборот, млн. грн., у
Чисельність клієнтів банку,  х
1
7,4
6
2
7,2
5
3
8,6
7
4
9,5
8
5
4,6
4
6
7,3
5
7
8,6
7
8
9,8
7
9
7
4
10
4,8
3
Розв'язання.
Важливою задачею є вибір раціонального типу регресійної моделі. Конкретна аналітична форма зв’язку між економічними показниками згідно з простою регресійною моделлю вибирається на підставі змістовного тлумачення цього зв’язку.
Якщо регресійна модель вимірює зв’язок між двома змінними, то кожну пару спостережень над цими змінними можна зобразити у двовимірній системі координат:
<shape id="_x0000_i1079" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image109.wmz» o:><img width=«327» height=«152» src=«dopb177970.zip» v:shapes="_x0000_i1079">\s
Аналіз зображеної множини точок дозволяє зробити висновок про наявність лінійного зв’язку між кількістю клієнтів банку та кредитовим оборотом, тобто для характеристики даної залежності варто обрати лінійну функцію.
Нехай залежність між кредитовим оборотом та чисельністю клієнтів банку  описується  простою лінійною моделлю y=β0+β1x+u, деy- кредитовий оборот; х -  чисельність клієнтів банку; u – стохастична складова, яка вводиться до моделі з метою урахувати наявність впливу факторів, які не входять до моделі, β0 β1 параметри моделі.
Згідно з гіпотезою про лінійний зв’язок через кореляційне поле точок можна провести принаймні кілька прямих ліній, які різняться своїми параметрами bтаb1. Щоб певна пряма адекватно описувала фактичну залежність, необхідно обрати такий метод оцінювання параметрів моделі, щоб відхилення фактичних значень від розрахункових били мінімальними.
У цьому разі мінімізації підлягає сума квадратів відхилень: <shape id="_x0000_i1080" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image111.wmz» o:><img width=«124» height=«39» src=«dopb177971.zip» v:shapes="_x0000_i1080"> Це є сутністю методу найменших квадратів.
Розрахункові значення кредитового обороту можна знайти, скориставшись такою моделлю парної лінійної регресії: <shape id="_x0000_i1081" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image113.wmz» o:><img width=«12» height=«19» src=«dopb177972.zip» v:shapes="_x0000_i1081">=b+b1x.
Щоб оцінити параметри моделі bта b1методом 1МНК, запишемо систему нормальних рівнянь
<shape id="_x0000_i1082" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image115.wmz» o:><img width=«175» height=«90» src=«dopb177973.zip» v:shapes="_x0000_i1082">
          Параметри регресії розраховуються за формулами:
<shape id="_x0000_i1083" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image117.wmz» o:><img width=«154» height=«84» src=«dopb177974.zip» v:shapes="_x0000_i1083">,  <shape id="_x0000_i1084" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image119.wmz» o:><img width=«79» height=«21» src=«dopb177975.zip» v:shapes="_x0000_i1084">
Параметр b1  вказує на скільки одиниць у середньому зміниться у зі зміною х на одиницю, а параметр b– чому дорівнює у, якщо х=0 ( при умові, що змінна х може набувати нульових  значень ).
Необхідні розрахунки:
Таблиця 18.
Обласні філіїбанку
Кредитовий оборот, млн. грн., у
Чисельність клієнтів банку,  х
х*у
х2
урозр.
(y-yрозр.)2
(x-xсер)2
(y-yсер.)2
(x-xсер)(у-усер)
(yрозр.-yсер.)2
1
7,4
6
44,4
36
7,8705
0,221363
0,16
0,0064
-0,032
0,15249025
2
7,2
5
36
25
6,8943
0,093476
0,36
0,0784
0,168
0,34304449
3
8,6
7
60,2
49
8,8467
0,060871
1,96
1,2544
1,568
1,86786889
4
9,5
8
76
64
9,823
0,104297
5,76
4,0804
4,848
5,489649
5
4,6
4
18,4
16
5,918
1,73721
2,56
8,2944
4,608
2,439844
6
7,3
5
36,5
25
6,8943
0,164623
0,36
0,0324
0,108
0,34304449
7
8,6
7
60,2
49
8,8467
0,060871
1,96
1,2544
1,568
1,86786889
8
9,8
7
68,6
49
8,8467
0,90874
1,96
5,3824
3,248
1,86786889
9
7
4
28
16
5,918
1,170653
2,56
0,2304
0,768
2,439844
10
4,8
3
14,4
9
4,9418
0,020108
6,76
7,1824
6,968
6,44245924
Сума
74,8
56
442,7
338
4,542213
24,4
27,796
23,82
23,25398214
Маємо: <shape id="_x0000_i1085" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image121.wmz» o:><img width=«292» height=«34» src=«dopb177976.zip» v:shapes="_x0000_i1085">
Модель лінійної парної регресії має вигляд: у=0,98х+2. Оскільки вільний член b0=2≠0, то величина кредитового обороту не є строго пропорційною до кількості клієнтів банку. Кількісна оцінка параметра b1=0,98показує, що граничне збільшення кредитового обороту при зростанні чисельності клієнтів банку на одного становить 0,98 млн. грн.
Еластичність кредитового обороту щодо кількості клієнтів банку визначається коефіцієнтом еластичності <shape id="_x0000_i1086" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image123.wmz» o:><img width=«185» height=«36» src=«dopb177977.zip» v:shapes="_x0000_i1086">
Значення цього коефіцієнта слід тлумачити так: при збільшенні кількості клієнтів банку на 1% кредитовий оборот гранично зросте на 0,73 %.
Параметри регресії у невеликих за обсягом сукупностях здатні до випадкових коливань. Тому здійснимо перевірку їх істотності або статистичної значимості за допомогою t –критерію Стьюдента:
<shape id="_x0000_i1087" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image125.wmz» o:><img width=«552» height=«98» src=«dopb177978.zip» v:shapes="_x0000_i1087">
де <shape id="_x0000_i1088" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image127.wmz» o:><img width=«68» height=«22» src=«dopb177979.zip» v:shapes="_x0000_i1088">оцінки дисперсій помилок та параметрів відповідно; <shape id="_x0000_i1089" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image129.wmz» o:><img width=«45» height=«21» src=«dopb177980.zip» v:shapes="_x0000_i1089">значення критерію для кожного з параметрів.
Критичне значення критерію Стьюдента для рівня значимості α=0,05 ( задається дослідником ) та n-k=10-2 ступенів вільності ( k – кількість параметрів ) знаходимо за допомогою таблиць t – розподілу Стьюдента. Оскільки tкр .< tфак., то коефіцієнт регресії вважається статистично значимим, тобто з ймовірністю 0, 95 вплив чисельності клієнтів банку на кредитовий оборот визнається істотним.
 Для перетину bкритичне значення більше  фактичного значення критерію Стьюдента, тобто оцінка перетину статистично не значима.
Для того, щоб визначити, як оцінки параметрів  пов’язані з параметрами, потрібно побудувати інтервали довіри для параметрів узагальненої регресійної моделі, тобто інтервали в які з заданою ймовірністю потрапляють їхні оцінки.
Довірчі межі коефіцієнта регресії: <shape id="_x0000_i1090" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image131.wmz» o:><img width=«280» height=«21» src=«dopb177981.zip» v:shapes="_x0000_i1090">зі ймовірністю 0,95.
Довірчі межі вільного члена: <shape id="_x0000_i1091" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image133.wmz» o:><img width=«272» height=«23» src=«dopb177982.zip» v:shapes="_x0000_i1091"> зі ймовірністю 0,95.
Щоб відповісти на питання наскільки значним є вплив змінної х на у, знайдемо значення коефіцієнта кореляції, значення якого знаходиться між –1 та +1:
<shape id="_x0000_i1092" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image135.wmz» o:><img width=«282» height=«65» src=«dopb177983.zip» v:shapes="_x0000_i1092">
Значення лінійного коефіцієнта кореляції  0,91 близьке до одиниці, тому можна зробити висновок про досить тісний прямий ( r>0) зв’язок між кількістю клієнтів банку та величиною кредитового обороту.
Загальну дисперсію результативної ознаки можна розкласти на дві частини — дисперсію, що пояснює регресію, та дисперсію помилок:
<shape id="_x0000_i1093" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image137.wmz» o:><img width=«100» height=«21» src=«dopb177984.zip» v:shapes="_x0000_i1093">
Поділивши обидві частини на загальну дисперсію, отримаємо:
<shape id="_x0000_i1094" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image139.wmz» o:><img width=«95» height=«44» src=«dopb177985.zip» v:shapes="_x0000_i1094">
Перша частина цього виразу являє собою частину дисперсії, яку не можна пояснити через регресійний зв’язок, друга — частину дисперсії, яку можна пояснити, виходячи з регресії. Вона називається коефіцієнтом детермінації і використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної:
    продолжение
--PAGE_BREAK--<shape id="_x0000_i1095" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image141.wmz» o:><img width=«291» height=«72» src=«dopb177986.zip» v:shapes="_x0000_i1095">
Постільки значення коефіцієнта детермінації близьке до одиниці, то можна вважати, що побудована модель адекватна тобто зв’язок між кредитовим оборотом та чисельністю клієнтів банку істотний. (<shape id="_x0000_i1096" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image143.wmz» o:><img width=«47» height=«18» src=«dopb177987.zip» v:shapes="_x0000_i1096"> ).
Інший критерій істотності зв’язку – критерій Фішера. Він використовується найчастіше і дає відповідь на питання щодо адекватності моделі, коли значення коефіцієнта детермінації має не явно виражене граничне значення, наприклад, 0,5: 0,45: 0,44 і ін.
Перевірка моделі на адекватність за F критерієм Фішера складається з таких етапів:
1.                Розраховуємо величину  F критерію: <shape id="_x0000_i1097" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image145.wmz» o:><img width=«245» height=«37» src=«dopb177988.zip» v:shapes="_x0000_i1097">
      В цій формулі  n, k  кількість спостережень та кількість параметрів відповідно.
2.                Задаємо рівень значимості, наприклад, α =0,05. Тобто, ми вважаємо, що можлива помилка для нас становить 0,05, це означає, що ми можемо помилитися не більш, ніж у 5%випадків, а в 95% випадків наші висновки будуть правильними.
3.                На цьому етапі за статистичними таблицями  F розподілу Фішера з ( k-1, n-k) ступенями вільності та рівнем значимості 100(1-α)% знаходимо критичне значення: Fкр=5,32,
4.                Оскільки, Fкр<Fфакт, то зі ймовірністю 0,95 ми стверджуємо, що побудована нами модель є адекватною тобто зв’язок істотний.
2.                За даними про рівень ефективності економіки та надійність ділового партнерства для семи країн східної Європи оцінити щільність зв’язку між цими ознаками.
Таблиця 19.
Країна
A
B
C
D
K
M
P
Інтегральні показники
Ефективність економіки ( max= 10 )
5,9
7,1
4,2
3,4
4,9
2,7
2,9
Надійність ділового партнерства ( max = 100 )
54,9
54,8
45,3
36,9
35,8
26,4
24,8
Розв’язання.
Для оцінки щільності зв'язку між ознаками порядкової (рангової) шкали використовують коефіцієнт рангової кореляції r, який за змістом ідентичний лінійному коефіцієнту кореляції. Найбільш поширена формула Спірмена
<shape id="_x0000_i1098" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image147.wmz» o:><img width=«84» height=«59» src=«dopb177989.zip» v:shapes="_x0000_i1098">, де dj — відхилення рангів факторної (Rx) та результативної (Ry) ознак; n — кількість рангів.
Визначимо для кожної країни значення рангів таким чином, щоб ранг країни з найменшим значенням показника був присвоєний найнижчий ранг і т. д. В нашому випадку сума квадратів відхилень рангів становить <shape id="_x0000_i1099" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image149.wmz» o:><img width=«60» height=«41» src=«dopb177990.zip» v:shapes="_x0000_i1099">, а коефіцієнт рангової кореляції
<shape id="_x0000_i1100" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image151.wmz» o:><img width=«150» height=«31» src=«dopb177991.zip» v:shapes="_x0000_i1100">
Таблиця 20.
Країна
Інтегральні показники.
Ранги показників
Відхилення рангів, dj
<shape id="_x0000_i1101" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image153.wmz» o:><img width=«17» height=«22» src=«dopb177992.zip» v:shapes="_x0000_i1101">
Ефективності економіки (max = 10 )
Надійності ділового партнерства (mах = 100 )
Rx
Ry
А
5,9
54,9
6
7
1
1
В
7,1
54,8
7
6
1
1
С
4,2
45,3
4
5
-1
1
D
3,4
36,9
3
4
-1
1
К
4,9
35,8
5
3
2
4
М
2,7
26,4
1
2
-1
1
Р
2,9
24,8
2
1
1
1
Разом




0
10
Значення коефіцієнта рангової кореляції свідчить про наявність прямого і досить помітного зв'язку між зазначеними параметрами ризику іноземного інвестування економіки. Критичне значення коефіцієнта рангової кореляції для α =0,05 та n=7 становить <shape id="_x0000_i1102" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image155.wmz» o:><img width=«78» height=«19» src=«dopb177993.zip» v:shapes="_x0000_i1102">, що значно менше фактичного. Отже, істотність зв'язку доведена з імовірністю 0,95.
3. За даними опитування 200 інвесторів побудовано комбінаційний розподіл респондентів за віком та схильністю до ризику. До групи ризикових віднесено респондентів, які мають намір придбати цінні папери, незважаючи на ризик, обережні не уявляють ризику без гарантій, не ризикові уникають ризику взагалі.
Таблиця 21.
Вік, років
Тип інвестора
Разом
Ризиковий
Обережний
Не ризиковий
До 30
24
12
4
40
30 – 50
20
50
30
100
50 і старші
6
18
36
60
Разом
50
80
70
200
Проаналізувати комбінаційний розподіл робітників, оцінити щільність зв’язку між віком інвесторів та схильністю до ризику за допомогою коефіцієнта взаємної спряженості. Перевірити істотність зв’язку з імовірністю 0,95, зробити висновок.
Розв’язання.
Концентрація частот навколо діагоналі з верхнього лівого кута у правий нижній свідчить про наявність стохастичного зв’язку.
Для оцінки щільності зв’язку обчислимо коефіцієнт спряженості Чупрова, тому що кількість груп за факторною ознакою – віком та результативною – тип інвестора щодо схильності до ризику однакова: mx  = 3, my = 3. Обчислимо значення квадратичної спряженості Пірсона <shape id="_x0000_i1103" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image157.wmz» o:><img width=«23» height=«23» src=«dopb177994.zip» v:shapes="_x0000_i1103">:
<shape id="_x0000_i1104" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image159.wmz» o:><img width=«489» height=«85» src=«dopb177995.zip» v:shapes="_x0000_i1104">
Фактичне значення показника значно перевищує критичне, яке ми знайдемо за таблицями для заданої імовірності 0,95 та числа ступенів свободи
k = ( mx– 1 )( my – 1 ) = ( 3 – 1 )( 3 – 1 ) = 4 <shape id="_x0000_i1105" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image161.wmz» o:><img width=«77» height=«20» src=«dopb177996.zip» v:shapes="_x0000_i1105"> Отже, істотність зв’язку між віком респондентів та схильністю їх до ризику доведена з імовірністю 0,95.
Коефіцієнт взаємної спряженості: <shape id="_x0000_i1106" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image163.wmz» o:><img width=«128» height=«39» src=«dopb177997.zip» v:shapes="_x0000_i1106"> тобто зв’язок між ознаками помірний.
Ряди динаміки 1. Вивантаження вагонів за відділенням залізниці (тис. ум. ваг.) характеризується даними:
Таблиця 22.
Місяці
Вивантажено
Місяці
Вивантажено
Січень
40,4
Липень
40,8
Лютий
36,3
Серпень
44,8
Березень
40,6
Вересень
49,4
Квітень
38,0
Жовтень
48,9
Травень
42,2
Листопад
46,4
Червень
48,5
Грудень
40,2
Провести згладжування ряду динаміки методом тричленної та чотиричленної плинної середньої. Зробити висновок про тенденцію обсягів вивантаження вагонів за відділенням залізниці.
Розв’язання.
Тенденція — деякий загальний напрямок розвитку. Очевидно, що в окремі місяці вивантаження вагонів зменшувалося в порівнянні з раніше досягнутим рівнем.
Для виявлення загальної тенденції розвитку іноді використовують так звані плинні середні, тобто середні укрупнених інтервалів, утворених шляхом послідовного виключення початкового члена інтервалу і заміни його черговим членом ряду динаміки.
Рухливі тричленні середні вивантаження вагонів за відділенням залізниці ( тис. ум. ваг. ):
Таблиця 23.
Місяці
Вивантажено
Плинна тримісячна сума
Плинна середня
Січень
40,4


Лютий
36,3
117,3
39,1
Березень
40,6
114,9
38,3
Квітень
38
120,8
40,3
Травень
42,2
128,7
42,9
Червень
48,5
131,5
43,8
Липень
40,8
134,1
44,7
Серпень
44,8
135
45,0
Вересень
49,4
142,1
47,4
Жовтень
47,9
143,7
47,9
Листопад
46,4
139,5
46,5
Грудень
45,2


У даному прикладі як укрупнений інтервал узятий період у три місяці. Перша рухлива середня розрахована з даних про вивантаження вагонів за січень, лютий, березень, друга — з даних за лютий, березень, квітень і т. д. Конкретні значення рухливих середніх відносять до середини інтервалу. Новий ряд динаміки чітко показує, що обсяг вивантаження вагонів поступово збільшується, чого не можна було сказати на основі місячних даних.
Місяці
Вивантажено
Плинні чотиричленні суми
Плинні чотиричленні середні
Центровані плинні середні
Січень
40,4



Лютий
36,3



Березень
40,6
155,3
38,8
39,1
Квітень
38,0
157,1
39,3
40,8
Травень
42,2
169,3
42,3
42,4
Червень
48,5
169,5
42,4
43,2
Липень
40,8
176,3
44,1
45,0
Серпень
44,8
183,5
45,9
45,8
Вересень
49,4
182,9
45,7
46,4
Жовтень
47,9
188,5
47,1
47,2
Листопад
46,4
188,9
47,2

Грудень
45,2



Таблиця 24.
При парному числі членів ряду, що входять в укрупнений інтервал, середина його не збігається з конкретним  періодом чи датою. Так, при чотиричленному інтервалі середина першого буде знаходитися між другим і третім членами ряду, середина другого між третім і четвертим і т.д.
При розрахунку рухливих середніх з парного числа членів ряду виконується  так зване центрування рухливих середніх, тобто віднесення їх до визначеного періоду чи дати. З цією метою з рухливих середніх обчислюються у свою чергу рухливі двочленні середні. Середина цього нового інтервалу, що охоплює первинні рухливі середні, обчислені з парного числа членів ряду динаміки, завжди збігається з конкретним періодом чи датою.
В цьому випадку новий ряд динаміки також показує, що обсяг вивантаження вагонів поступово збільшується.
2. Динаміка експорту цукру ( тис. т ) характеризується даними:
Таблиця 25.
Рік
1999
2000
2001
2002
2003
Експорт, тис. т
37
39
43
48
52
a)                 описати тенденцію зростання експорту цукру лінійним трендом, пояснити зміст параметрів трендового рівняння;
b)                припустивши, що виявлена тенденція збережеться, визначити очікувані обсяги експорту в 2004 році;
c)                 з імовірністю 0,95 визначити довірчі інтервали прогнозного рівня.
Розв’язання.
Більш вживаним прийомом вивчення загальної тенденції в рядах динаміки є аналітичне вирівнювання. При вивченні загальної тенденції методом аналітичного вирівнювання виходять з того, що зміни рівнів ряду динаміки можуть бути з тим чи іншим ступенем точності наближення виражені визначеними математичними функціями. В нашому прикладі ми побудуємо лінійний тренд, який характеризуватиме тенденцію зміни експорту цукру.
Лінійний тренд має вигляд уt=a+bt, де уt — рівні ряду, звільнені від коливань, вирівняні по прямій; а — початковий рівень ряду в момент чи  період, прийнятий за початок відліку часу; b — середній абсолютний приріст (середня зміна за одиницю часу), константа тренда.
Розраховуються параметри трендових рівнянь методом найменших квадратів. Для лінійної функції параметри знаходять із системи рівнянь:
<shape id="_x0000_i1107" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image165.wmz» o:><img width=«89» height=«22» src=«dopb177998.zip» v:shapes="_x0000_i1107"> , <shape id="_x0000_i1108" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image167.wmz» o:><img width=«127» height=«21» src=«dopb177999.zip» v:shapes="_x0000_i1108">.
Система рівнянь спрощується, якщо початок відліку часу (t =0) перенести в середину динамічного ряду. Тоді значення t, розміщені вище середини, будуть негативними, а нижче — позитивними. При непарному числі членів ряду змінної t присвоюється значення з інтервалом одиниця: -2, -1, 0, 1, 2; при парному — з інтервалом два: -5, -3, -1, 1, 3, 5. В розглядуваному прикладі п’ять рівнів ряду, тому маємо наступні розрахунки:
Таблиця 26.
Рік
Експорт, тис. т
t
tyt
yрозр.t
( yt — yрозр.t )2
1999
37
-2
-74
36
1
2000
39
-1
-39
39,9
0,81
2001
43
0
0
43,8
0,64
2002
48
1
48
47,7
0,09
2003
52
2
104
51,6
0,16
Сума
219
0
39
219
2,7
В обох випадках åt = 0, а система рівнянь приймає вид: <shape id="_x0000_i1109" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image169.wmz» o:><img width=«53» height=«18» src=«dopb178000.zip» v:shapes="_x0000_i1109"> , <shape id="_x0000_i1110" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image171.wmz» o:><img width=«75» height=«20» src=«dopb178001.zip» v:shapes="_x0000_i1110"> .
Значення <shape id="_x0000_i1111" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image173.wmz» o:><img width=«34» height=«25» src=«dopb178002.zip» v:shapes="_x0000_i1111"> можна визначити за формулою для непарної кількості членів ряду
<shape id="_x0000_i1112" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image175.wmz» o:><img width=«177» height=«34» src=«dopb178003.zip» v:shapes="_x0000_i1112">  Звідси, <shape id="_x0000_i1113" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image177.wmz» o:><img width=«126» height=«37» src=«dopb178004.zip» v:shapes="_x0000_i1113">, <shape id="_x0000_i1114" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image179.wmz» o:><img width=«114» height=«43» src=«dopb178005.zip» v:shapes="_x0000_i1114">
Отже, <shape id="_x0000_i1115" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image181.wmz» o:><img width=«88» height=«20» src=«dopb178006.zip» v:shapes="_x0000_i1115"> тобто середній рівень експорту цукру становив 43,8 тис. т. Щорічно експорт цукру зростає у середньому на 3,9 тис. т. За умови, що комплекс причин, який формує тенденцію, ближчим часом не зміниться, можна продовжити тенденцію за межі динамічного ряду. Очікуваний обсяг експорту цукру в 2004 році становить у2004 = 43,8 + 3,9. 3 = 55,5 тис. т.
Це точкова оцінка прогнозу. Інтервальна оцінка прогнозу, тобто довірчі інтервали, визначаються з деякою імовірністю за формулою <shape id="_x0000_i1116" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image183.wmz» o:><img width=«26» height=«22» src=«dopb178007.zip» v:shapes="_x0000_i1116"> ± tsp, де sp — помилка прогнозу, t — довірче число (відношення Стьюдента), v — період випередження.
Помилка прогнозу для обсягу експорту цукру в 2004 році: <shape id="_x0000_i1117" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image185.wmz» o:><img width=«390» height=«46» src=«dopb178008.zip» v:shapes="_x0000_i1117">,
де <shape id="_x0000_i1118" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image187.wmz» o:><img width=«244» height=«45» src=«dopb178009.zip» v:shapes="_x0000_i1118"> — оцінка дисперсії залишків, n — кількість спостережень, k — кількість параметрів рівняння.
Критичне значення двостороннього t – критерію для імовірності 0,95 та числа ступенів свободи ( n – 2 ) = 5 – 2 = 3 становить <shape id="_x0000_i1119" type="#_x0000_t75" o:ole=""><imagedata src=«37375.files/image189.wmz» o:><img width=«51» height=«20» src=«dopb178010.zip» v:shapes="_x0000_i1119">
 tsp= 3,18. 1,38 = 4,39 і довірчий інтервал прогнозного рівня 55,5 ± 4,39 тис. т. Це означає, що в 2004 році можна з імовірністю 0,95 очікувати обсяг експорту цукру не менше 51,11 тис. т але не більше 59,89 тис. т.
Індекси 1. Маємо дані за споживчим ринком міста про середні ціни та обсяги реалізації продукції:

Таблиця 27.
Місяць
Товар А
Товар В
Ціна за одиницю, грн.
Кількість проданого товару, кг
Ціна за одиницю, грн.
Кількість проданого товару, кг
Березень
1,5
5000
3,8
4000
Квітень
1,4
6000
3,9
4500
Обчислити:
a)                 індивідуальні індекси цін на кожний товар;
b)                загальні індекси цін, обсягів та товарообігу на всі товари в цілому, причому перші два за схемами індексів Пааше та Ласпейреса;
c)                 показати взаємозв’язок індексів;
d)                абсолютний приріст товарообігу в цілому та за рахунок факторів: рівня цін та обсягів реалізованих товарів.
Розв’язання.
Для розвязання задачі перенесемо дані таблицю 17 в таблицю 18. Туди ж записуватимемо розрахункові дані, необхідні для обчислення індексів.
     Таблиця 28.
Товар
Ціна за одиницю, грн.
Кількість проданого товару, кг
p0q0
p1q1
p0q1
p1q
Березень
Квітень
Березень
Квітень
p0
p1
q0
q1
Гр. 1
Гр. 2
Гр. 3
Гр. 4
Гр. 5
Гр. 6 = гр. 2 .гр. 4
Гр. 7 = гр. 3 .гр. 5
Гр. 8 = гр. 2 .гр. 5
Гр. 9 = гр. 3 .гр. 4
А
1,5
1,4
5000
6000
7500
8400
9000
7000
В
3,8
3,9
4000
4500
15200
17550
17100
15600
Всього


9000
10500
22700
25950
26100
22600
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по математике