Реферат: Тести Чоу


ТестиЧоу


Зміст

Вступ

Застосуваннятесту

Реалізація тестуЧоу

Тести настійкість

Тест Чоу наневдачу прогнозу

Приклад

F-тест настабільність коефіцієнтів

Приклад

Висновок

Література


Вступ

Нерідко напрактиці ми стикаємося всього лише з двома групами даних. Наприклад, важливовизначити значущість структурних зрушень між двома періодами часу, або жзначущість відмінностей у виробничих функціях для двох галузей, або жзначущість відмінностей між споживчими функціями у двох країнах [НАК, c. 196].

Доти, докикількість спостережень у кожній групі перевищує кількість оцінюванихпараметрів, запропонований підхід можна застосувати безпосередньо. Якщо ж водній із груп кількість спостережень менше кількості параметрів, то цей випадокпотребує особливого дослідження, яке виконав Г. Чоу (незалежно від нього – Ф.Фішер).

Нехай маємосукупність спостережень, яка містить дві групи даних, що різняться між собоюпевними якісними ознаками. Постають такі запитання:

1. Чи можемо миоб'єднати ці групи для побудови економетричної моделі за всією сукупністюспостережень?

2. Яквідрізняються вільні члени моделей, побудованих окремо за двома групами даних?

3. Чи однаковіоцінки параметрів моделі, що характеризують вплив пояснювальної змінної назалежну?

Якщо йдеться лишепро відмінності вільних членів, то групи спостережень можна об'єднати в однусукупність і скоригувати вільний член введенням до моделі фіктивних змінних.

Часто трапляєтьсятак, що окремі чинники, які ви хотіли б ввести в регресійну модель, є якіснимиза своєю природою і, отже, не вимірюються в числовій шкалі. Наведемо декількаприкладів [ДОУ, с. 262].

1. Досліджуєтьсязалежність між тривалістю здобутої освіти і доходом, і у вибірці представленіособи як чоловічої, так і жіночої статі. Потрібно з'ясувати, чи обумовлює статьвідмінність в результатах.

2. Досліджуєтьсязалежність між доходом і споживанням, і вибірка включає як україномовні сім'ї,так і сім'ї, що розмовляють російською. Потрібно з'ясувати, чи має істотнезначення ця етнічна відмінність.

3. Досліджуютьсячинники, що визначають інфляцію, і в деякі роки періоду спостережень урядпроводив політику регулювання доходів. Потрібно перевірити, чи надало цеякий-небудь вплив на досліджувану залежність.

У кожному з цихприкладів одним з можливих рішень було б оцінювання окремих регресій для двохвказаних категорій з подальшим з'ясуванням, чи розрізняються одержанікоефіцієнти. Інший можливий підхід до рішення полягає в оцінюванні єдиноїрегресії з використанням всієї сукупності спостережень і вимірюванням ступенявпливу якісного чинника за допомогою введення так званої фіктивної змінної.Другий підхід володіє двома важливими перевагами: по-перше, є простий спосібперевірки, чи є дія якісного чинника значущим; по-друге, за умови виконанняпевних припущень регресійні оцінки виявляються ефективнішими.


Застосуваннятесту

Тест Чоу дозволяєоцінити значущість поліпшення регресійної моделі після розділення початковоївибірки на частини. Це модифікація однопараметричної експоненціальної моделі зкорекцією коефіцієнта лінійного тренда. У методі Чоу відбувається адаптаціяпараметра до змін в діанаміке ряду.

Прикладомвикористання даного критерію може служити завдання, яке вирішував Чоу. Вінтестував свій метод на рядах місячних даних про операції на різні видипродукції: рукавички, змащувальні матеріали, сальники, підшипники і т.д. Данібули різноманітними зразками поведінки економічних тимчасових рядів, включаючициклічний рух. У 59 випадків з 60 пропонований метод показав переваги передстандартною процедурою і в одному випадку результати були майже однакові.

Проілюструємометод використання фіктивних змінних на прикладі регресійного аналізу основнихчинників, що впливають на вагу новонароджених немовлят. Якщо ви думаєте, що цятема не представляє достатнього інтересу для економіста, то помиляєтеся.Типовий економіст, що працює в прикладній сфері, не витрачає увесь свій час настворення макроекономічних моделей. Значно вірогідніше, що він бере участь вроботі, що має більш безпосереднє відношення до практики, наприклад, займаєтьсяаналізом використання ресурсів в якій-небудь конкретній сфері. Оскільки вбільшості країн на медичне обслуговування прямує достатньо велика частинаособистих і суспільних ресурсів, цілком виправданий інтерес до нього з бокуекономістів; на цю тему є обширна економічна література, причому об'єм їїпостійно зростає. Не зважаючи на те, що найбільшою увагою засобів масовоїінформації звичайно користується невідкладна медична допомога, найважливішими зпогляду витрат є акушерськая допомога, догляд за літніми і турбота про осіб, щомають психічні захворювання.

Оскількивартісний вираз результатів медичної допомоги звичайно є вельми спірнимпредметом, неможливо провести задовільний порівняльний аналіз витрат ірезультатів по більшості видів витрат на медицину. Натомість широковикористовується наступний підхід: береться який-небудь показник успіху (абоневдачі), визначаються основні чинники, його що обумовлюють, і потім робитьсяспроба знайти найбільш ефективний шлях досягнення заданої мети, вираженої цимпоказником.

У принципізавдання виявлення основних чинників, що формують значення цільового показника,повинна розв'язуватися фахівцями у області медичної статистики, а завданняякнайкращого розподілу ресурсів – економістами; але в охороні здоров'я, як і вінших галузях прикладної економіки, високопрофесійним економістам частодоводиться виходити за безпосередні рамки своєї дисципліни і проводити такийстатистичний аналіз, перш ніж взятися до своєї основної роботи. У областіакушерської допомоги двома головними показниками є дитяча смертність і вагановонароджених. Оскільки коефіцієнт смертності новонароджених для більшостікраїн дуже низький, для дослідження визначальних його чинників потрібні вибіркивеликого об'єму, і тому вага новонароджених у багатьох випадках є практичнішимальтернативним показником.

Реалізаціятесту Чоу

Іноді вибіркаспостережень складається з двох або більше підвибірок, і важко встановити, числід оцінювати одну об’єднану регресію або окремі регресії для кожноїпідвибірки [ДОУ, с. 282]. На практиці проблема вибору стоїть звичайно не такжорстко, оскільки можуть бути деякі можливості об'єднання підвибірок привикористанні відповідних фіктивних змінних і фіктивних змінних для коефіцієнтанахилу, щоб зробити менш строгим припущення про те, що всі коефіцієнти повиннібути однаковими для кожної підвибірки. До цього питання ми ще повернемося.

Припустимо, що євибірка, що складається з двох підвибірок, і що виникає питання, чи слідоб'єднати їх для оцінювання загальної регресії P або оцінити окремі регресії Аі В. Позначимо суми квадратів залишків для регресій підвибірок UA іUB. Хай UPA і UPB – сумиквадратів залишків в об'єднаній регресії для спостережень, що відносяться додвох даних підвибірок. Оскільки окремі регресії для підвибірок повиннівідповідати спостереженням щонайменше так само добре, якщо не краще, ніжоб'єднана регресія, то UA < UPA і UB< UPB. Отже, (UA + UB) < UP,де загальна сума квадратів залишків в об'єднаній регресії UP рівнасумі UPA і UPB .

Це пояснюється намалюнку.

/>

Припустимо, що єдані тимчасового ряду по двох змінним і що в період вибірки відбуласяструктурна зміна, що розділяє спостереження на підвибірки А і В. На мал. Брегресії для підвибірок забезпечують цілком адекватну відповідність даним,обумовлюючи низькі значення UA і UB. Якби потрібно булооцінити об'єднану регресію, як на мал. А, то залишки в обох підвибірках вцілому були б значно більше.

Рівність між UPі (UA + UB) матиме місце тільки при збігу коефіцієнтіврегресії для об'єднаної регресії і регресій підвибірок. У загальному випадкупри розділенні вибірки спостерігатиметься поліпшення якості рівняння, що можнапредставити як (UP – UA – UB). Це має свою ціну:використовуються (k + 1) додаткових ступенів свободи, оскільки замість (k + 1)параметрів для однієї об'єднаної регресії ми тепер повинні оцінити в сумі (2k +2) параметрів (k – число пояснюючих змінних, одиниця відповідає постійному члену).Проте, після розділення вибірки залишається непояснена сума квадратів залишків(UA + UB) і, крім того (n – 2k – 2) ступенів свободи.

Тепер ми можемовизначити, чи є значущим поліпшення якості рівняння після розділення вибірки.Для цього використовується F-статистика:

Покращення якості рівняння / Використані ступені свободи =

/>

Непояснена дисперсія / Число решти ступенів свободи

яка розподілена з(k + 1) і (n – 2k – 2) ступенями свободи.

Тепер, наприклад,давайте повернемося до випадку парної регресійної залежності вагиновонароджених від інтенсивності куріння їх матерів, і хай ми ще не вирішили,чи слід об'єднувати підвибірки, включаючих 584 матері, яка раніше ненароджувала, і 380 матерів, які раніше народжували. Оцінювання об'єднаноїрегресії і регресій для підвибірок дає результати, показані в таблиці.

Вибірка Оцінене рівняння

R2

Сума квадратів залишків Об’єднана вибірка y = 3418 – 7,2x (1) 0,012

158,6 ∙ 106

Первістки y = 3363 – 4,0x (2) 0,004

91,2 ∙ 106

Непервістки y = 3506 – 12,1x (3) 0,039

63,5 ∙ 106

ВідповіднаF-статистика, отже, рівна:

/>

Критичне значенняF з 2 і 960 мірами свободи складає 6,91 (при рівні значущості в 0,1%), тому миробимо висновок, що не слід оцінювати об'єднану регресію.

Регресії дляпідвибірок ідентичні регресіям, представленим співвідношеннями (2) і (3), і цене простий збіг. У основній регресії (1) складова, не пов'язана з фіктивноюзмінною, включає постійний член і показник залежності від інтенсивностікуріння. До цього додаються фіктивна змінна, що дозволяє розрізняти значенняпостійного члена для первістків і дітей, що народилися не першими, і фіктивназмінна для коефіцієнта нахилу, що також дозволяє розрізняти коефіцієнти припоказнику інтенсивності куріння для двох даних підвибірок. Отже, в (1) ми незадаємо наперед який-небудь коефіцієнт однаковим для обох підвибірок і, такимчином, одержуємо такі ж оцінки коефіцієнтів, як і в окремих регресіях дляпідвибірок.

Розглядаючи лишеспіввідношення (1), ми можемо перевірити, чи виправдана ця гнучкість,з'ясувавши, чи вносять вказані фіктивні змінні, як група, значущий внесок впояснюючу здатність рівняння. Сума квадратів залишків, якщо фіктивні змінні невключені в рівняння, складає 158,6 ∙ 106, а коли вони включенів рівняння, ця сума рівна 154,7 ∙ 106. Отже, F-статистика дляперевірки пояснюючої здатності фіктивних змінних як групи має вигляд:

/>

тобто вона вточності така ж, як в тесті Чоу.

Можна показати,що це загальний результат. Вибір між використанням розглянутої процедури тестуЧоу або оцінюванням складної регресії з фіктивними змінними на основіспіввідношення (1) залежатиме від цілей, які ставить перед собою дослідник.Тест Чоу виконується швидше, і він достатній, якщо потрібно тільки встановити,що залежності в підвибірках в деякій мірі розрізняються. Оцінювання регресії зфіктивними змінними більш інформативно в тому відношенні, що воно дозволяєвиконувати F-тесты з розглядом внеску кожної фіктивної змінної, а також всієїгрупи в цілому і може привести до компромісу, в якому дослідник припускає, щодеякі коефіцієнти однакові в обох підвибірках, і використовує фіктивні зміннідля диференціації значень решти коефіцієнтів.


Тестина стійкість

Тести настійкість для регресійної моделі призначені для оцінки того, наскількиповедінка моделі в послявибірковому періоді порівнянна з її поведінкою в періодвибірки, на якій вона була одержана. У основі організації тестів на стійкістьможуть лежати два принципи. Один підхід – зосередитися на передбачаючійздатності моделі; інший підхід – оцінити, чи відбувається зрушення параметрів вперіод прогнозу.

ТестЧоу на невдачу прогнозу

Як ми бачили впопередньому розділі, помилку прогнозу можна розрахувати, додавши набірфіктивних змінних для спостережень періоду прогнозу. Тепер цілком природновизначити, чи істотно помилка прогнозу відрізняється від нуля, і ми можемозробити це за допомогою F-тесту на сумісну пояснюючу здатність фіктивнихзмінних. Сумістивши період вибірки і період прогнозу, ми оцінимо рівняннярегресії спочатку без набору фіктивних змінних, а потім – разом з цим набором.Позначимо одержані суми квадратів відхилень як RSST+m і RSSDT+m,де нижній індекс показує число спостережень в регресії, а верхній індекс «D»означає включення в рівняння фіктивних змінних. За допомогою F-тесту, описаногов розділі, ми можемо визначити, чи було істотним поліпшення якості рівнянняпісля додавання набору фіктивних змінних. Його можна представити у вигляді (RSST+m– RSSDT+m); число фіктивних змінних рівне m; сумаквадратов відхилень після включення фіктивних змінних складає RSSDT+m;число мір свободи, що залишається, рівне числу спостережень в суміщеній вибірці(T + m) за вирахуванням числа оцінених параметрів (k + m + 1). У результатізначення F-статистики складе:

/>

Насправді дляреалізації тесту навіть не потрібно оцінювати рівняння регресії з фіктивнимизмінними, оскільки значення RSSDT+m рівно значенню RSST– сумі квадратів відхилень для рівняння регресії, оціненого на періодівибірки. Якість цієї регресії в точності таке ж, як і у регресії для перших Tспостережень в рівнянні з фіктивними змінними, і відхилення тут ті ж самі. Дляостанніх m спостережень в рівнянні з фіктивними змінними немає відхилень,оскільки включення спеціальної фіктивної змінної для кожного спостереженнягарантує точність рівняння для цих спостережень. У результаті значення RSSDT+mу точності таке ж, як і значення RSST, і F-статистика може бутипереписана як

/>

Цей тест відомийяк тест Чоу і був названий так на ім'я свого творця Г. Чоу (Chow, 1960),інтерпретація тесту, що проте приводиться тут, була запропонована дещо пізнішеX. Песараном, Р. Смітом і С. Ео.

Приклад

Функція попиту напродукти харчування спочатку була оцінена на даних за період 1959-1979 рр., і RSST= 0,0052, а потім – на даних за період 1959-1983 рр., RSST+m =0,0070. Як наслідок значення F-статистики рівне:

/>

Критичне значенняF-статистики з 4 і 18 мірами свободи при 5-процентному рівні значущості рівне2,93, тому ми не відкидаємо нульову гіпотезу про стабільність коефіцієнтіврівняння регресії.

F-тестна стабільність коефіцієнтів

Якщо є прийнятніспостереження за період прогнозу, то можна провести F-тест на наявністьструктурного перелому, описаний в розділі, і оцінити, чи значущо розрізняютьсякоефіцієнти періоду вибірки і періоду прогнозу. Для реалізації цього тестуспочатку необхідно оцінити роздільно рівняння регресії для періоду вибірки іперіоду прогнозу, а потім – спільно для цих двох періодів. Після цього потрібноперевірити, чи значущо поліпшується якість рівняння при розділенні загальногоперіоду оцінки регресії на період вибірки і період прогнозу. Підтвердження цієїгіпотези може служити свідчення того, що коефіцієнти регресії нестабільні.

 Приклад

При оцінюванніфункції попиту на продукти харчування з використанням спостережень за 1959-1979рр. як період вибірки, а за 1980-1983 рр. – як період прогнозу, суми квадратіввідхилень для періоду вибірки, періоду прогнозу і суміщеного періодудорівнювали 0,0052; 0,0002 і 0,0070 відповідно. Оцінка окремих рівнянь регресіїдля двох періодів призводить до втрати трьох мір свободи, і число мір свободи,що залишається після оцінювання шести параметрів (двох постійних членів, двох коефіцієнтівпри logx, двох коефіцієнтів при logp), рівне 19. У результаті ми одержуємонаступну F-статистику, розподілену з 3 і 19 мірами свободи:

/>

Критичне значенняt-статистики з таким числом мір свободи при 5-процентному рівні значущостірівне 3,13, що дозволяє нам зробити висновок про відсутність явноїнестабільності коефіцієнтів.


Висновок

Побудоварегресійних моделей на сьогодні, поза сумнівом, є найбільш широко вживанимметодом багатовимірного статистичного аналізу соціологічних даних. За останнідекілька років більше половини статей, що аналізують емпіричні дані, заснованіна використанні регресійних моделей.

Достатньопоширені регресійні методи і серед російських соціологів, фахівців, щовикористовують дослідні методики. Разом з тим багато особливостей і обмеженнярегресійних моделей звичайно залишаються поза сферою уваги дослідників, що,часом, призводить до неточних, або просто помилкових результатів.

Традиційна модельмножинного лінійного регресійного аналізу має на увазі пошук показників (щопозначаються X), що визначають значення окремої кількісної змінної, щопозначається Y. Структура зв'язку в даній моделі передбачається лінійною.Іншими словами, шукається наступна форма залежності:

Y = B0+ B1X1 + B2X2 +… +BnXn+ U,

де U – так званийзалишковий член, що фіксує ту частину інформації Y, яка не пояснюється іксами.

Регресійнийаналіз показує, по-перше, якість моделі, тобто ступінь того, наскільки дана сукупністьіксів пояснює Y. Показник якості називається коефіцієнтом детерміації R2і показує, який відсоток інформації Y можна пояснити поведінкою іксів.По-друге, регресійний аналіз обчислює значення коефіцієнтів В, тобто визначає,з якою силою кожний з Х впливає на Y.

Методологічнимнедоліком такого підходу є те, що дана залежність шукається єдиною для всієїсукупності опитаних респондентів. Іншими словами, ми припускаємо, що для всіхлюдей характер залежності Y від іксів єдиний. У тому випадку, коли вибірковасукупність достатньо однорідна, такого роду допущення має під собою певніпідстави. Проте, якщо аналізуються, скажімо, детермінанти електоральних перевагна основі даних всеросійської вибірки, допущення про однорідність цихдетермінантів для чукотського оленяря і для московського професора виглядає недуже переконливим.

Єдина формарівняння в цій ситуації сильно огрублює реальну залежність, якість моделінеминуче виявляється вельми низькою, а сенс регресійних коефіцієнтів, щофіксують ступінь впливу іксів на Y, можна прирівняти до горезвісного показника«середньої температури по лікарні».

Цілком очевидно,що набагато розумніше будувати окремі моделі для груп респондентів, що істотнорозрізняються між собою. Проте доведення такого підходу до логічного завершеннячревате небезпекою повного релятивізму. Дійсно, завжди можна знайти більш-меншпереконливі аргументи на користь того, що з аналізованої проблеми механізмиформування оцінок різні у жінок і чоловіків, у городян і сільських жителів, уінженерів і робочих і т.д. і т.п. Отже, для кожної групи необхідно будуватисвою модель, що не дуже конструктивно, оскільки кількість таких моделейобмежується лише фантазією соціолога по розбиттю всієї сукупності на окремігрупи.

Виявляється,проте, що є певні формальні критерії, що дозволяють визначати межі груп, дляяких діють однакові, або різні механізми.

Отже, мирозглянули статистичний тест, що дозволяє оцінити значущість поліпшеннярегресійної моделі після розділення початкової вибірки на частини. Одним зобмежень лінійної регресії є те, що для різних інтервалів значень незалежноїзмінної характер її зв'язку з вихідною змінною може мінятися. Наприклад, іззбільшенням віком клієнта його кредитний рейтинг може збільшуватися. Але даназакономірність не справедлива для всіх віків. Після певного віку (50–55 років),люди частіше хворіють, їм складніше знайти роботу і т.д., тому після, скажімо,50 років спостерігається зворотна залежність.

Очевидно, щобудь-яка модель, яка апроксимує таку закономірність єдиною лінійною залежністю,навряд чи буде точною. Виходом з ситуації є розділення діапазону значеньвхідної змінної на два, в межах кожного з яких залежність між нею і вихіднійзмінній монотонна і побудова рівняння регресії для кожного одержаногопіддіапазону. Виникає питання: як розбити початкову множину так, щоб одержанерозбиття забезпечило кращу апроксимацію? Для цього звичайно будують безлічрозбиття, для кожного визначають значущість поліпшення моделі і вибирають те,яке забезпечило велику значущість. Для оцінки такої значущості івикористовується тест Чоу.


Література

1.  Елисеева И. И. Эконометрика. М.: ФиС.– 2004, 344 ст. [ЕЛИ]

2.  Кремер Н.Ш., Путко Б.А. Эконометрика:Учебник для вузов. – М.: ЮНИТИ-ДАНА, 2005. – 311 с. [КРЕ]

3.  Лещинський О. Л. Економетрія. –К.: МАУП 2003. – 208 с. [ЛЕЩ]

4.  Лук’яненко І. Г., Краснікова Л. П. –Економетрика. – К.: Знання 1998. – 494 с. [ЛУК]

5.  Наконечний C. І., Терещенко Т. О.Економетрія. – К.: КНЕУ, 2006. – 528 с. [НАК]

еще рефераты
Еще работы по экономико-математическому моделированию