Реферат: Методические указания и задачи для самостоятельной работы студентов по дисциплине «Математическая статистика» для студентов специальностей 060800 («Экономика и управления на предприятии апк») и 060500 («Бухгалтерский учет, анализ и аудит»)

Министерство сельского хозяйства РФ
Федеральное Государственное образовательное учреждение

высшего профессионального образования

«Пермская государственная сельскохозяйственная академия

им. академика Д.Н. Прянишникова»


Кафедра статистики,
анализа и финансов


Методические указания и задачи


для самостоятельной работы студентов


по дисциплине «Математическая статистика»

для студентов специальностей

060800 («Экономика и управления на предприятии АПК»)

и 060500 («Бухгалтерский учет, анализ и аудит»)

очной и заочной формы обучения


Пермь, 2004

Методические указания подготовлены ст. преподавателем кафедры статистики, анализа и финансов Бодряковой З.П.

Методические указания соответствуют требованиям образовательного стандарта Министерства образования РФ. Предназначены студентам экономического факультета очного и заочного обучения.

Рекомендовано к изданию методической комиссией экономического факультета. Протокол № 12 от 10 февраля 2004 г.

Отпечатано множительным центром академии тиражом 75 экз.


Общие положения


Математическая статистика взаимосвязана с теорией вероятностей и общей теорией статистики.

Математическая статистика изучает закономерности развития массовых социально-экономических явлений с помощью методов теории вероятностей.

Современная математическая статистика разрабатывает методы сбора и обработки статистических данных для получения научных и практических выводов, необходимых для принятия управленческих решений.

Основная цель учебного пособия – выработать у студентов творческий подход к применению методов математической статистики.

Методические указания могут быть использованы студентами для самостоятельной работы по изучению соответствующих разделов курса «Математическая статистика» и преподавателями для контроля знаний студентов.


Тема 1. Ряды распределения. Нормальное распределение.


Ряд распределения – это упорядоченное распределение единиц совокупности на группы по варьирующему признаку. Следовательно, ряд распределения – результат группировки. Различают атрибутивные (по качественному признаку) и вариационные ряды распределения (по количественному признаку).

Вариационный ряд состоит из элементов: вариантов и частот. Варианта - конкретное значение варьирующего признака.

Частота – показатель повторяемости отдельных вариантов (группы). Сумма всех частот равна объему совокупности. Частостями называются частоты выраженные в процентах. Различают локальные и накопленные частоты и частости.

По характеру вариации признака различают дискретные и интервальные вариационные ряды. Вариация количественных признаков может быть дискретной (прерывной) или непрерывной.

В случае дискретной вариации количественный признак принимает только целые значения. При непрерывной вариации величина признака может принимать любые дробные значения в определенных пределах. В этом случае целесообразно построение интервального ряда. Интервальный ряд – ряд с непрерывной вариацией распределения признака, в котором значения признака представлены в виде интервалов.

Для анализа вариационных рядов, изучения формы распределения, применяется графический метод.

Ранжированный ряд изображается графически в виде огивы Гальтона. По оси абсцисс откладываются ранги, по оси ординат – значения варьирующего признака в масштабе.

Наглядное представление о характере изменения частот ряда распределения дают полигон и гистограмма.

Гистограмма применяется для изображения интервального вариационного ряда. На оси абсцисс откладываются интервальные значения признака, а частоты по оси ординат.

Полигон используется при изображении дискретных вариационных рядов. По оси абсцисс откладываются в масштабе ранжированные значения признака, а по оси ординат – частоты.

Кумулятивный ряд представляет собой ряд накопленных частот. При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты, а по оси ординат – накопленные частоты или частости.

Статистические совокупности могут быть расчленены по одному признаку (одномерные ряды распределения) или одновременно по двум и более признакам (двумерные и многомерные распределения).

Ряды распределения анализируют с помощью системы статистических характеристик:

характеристики центральной тенденции;

показатели вариации;

характеристики формы распределения.

Показатели центральной тенденции включают степенные и структурные средние. Из степенных средних наиболее часто применяется средняя арифметическая:

1) простая ; 2) взвешенная , где хi- отдельные значения признака – варианты, f i– веса (повторяемость) значений признака.

Для интервальных рядов находят центры (середины) интервалов, которые умножают на веса (взвешенное произведение). Произведения суммируют и делят на сумму весов.

Средняя арифметическая обладает аналитическими свойствами, что позволяет значительно упростить ее расчеты. Из структурных средних широко применяются мода и медиана.

Мода – наиболее часто встречающееся значение признака. Мода в вариационном ряду – это варианта с наибольшей частотой или частостью. В интервальном ряду с неравными интервалами – интервал с наибольшей плотностью.

Для интервального ряда с равными интервалами мода исчисляется по формуле: , где

Хо – начальная (нижняя) граница модального интервала;

i – величина интервала;

f1 – частота интервала, предшествующего модальному;

f2 – частота модального интервала;

f3 – частота постмодального интервала.

Медиана – значение признака, приходящееся на середину ранжированного ряда. В медианном интервале накопленная частота превышает половину объема совокупности.

Медиана определяется способом интерполяции по формуле:

, где 0,5 ∑ƒ – порядковый номер медианы;

ƒΜе -1 - накопленная частота интервала, предшествующего медианному.

Структурные средние, следовательно, можно определить двояко:

расчетным путем (по формуле);

на графике мода определяется на полигоне и гистограмме, меридиана – на огиве Гальтона, - кумулятивной кривой.

Практическое значение моды: продукция (товар), пользующийся наибольшим спросом, например, модальные размеры одежды и обуви; модальные цены на рынке – наиболее типичные цены.

Свойство медианы практически используется, например, при размещении таких объектов, как телефонов-автоматов, бензоколонок, школ, станций ТО и др.

Структурными характеристиками вариационных рядов выступают квартили, делящие ряд на 4 равные части, децили на 10 частей и перцентили – на 100 равных частей.

Показатели вариации, характеризующие меру колеблем ости признака в совокупности, отражают:

максимальную вариацию признака (показатель размаха вариации);

среднюю вариацию признака относительно средней арифметической величины в абсолютных единицах (показатели: среднее линейное отклонение

и среднее квадратичное отклонение ;

среднюю меру колеблемости признака относительно средней в относительных единицах (процентах)- (через показатель – коэффициент вариации

);

квадрат среднего отклонения индивидуальных значений признака от средней в абсолютном выражении (показатель – дисперсия признака ) .

Дисперсия обладает аналитическими свойствами. Применение свойств позволяет упростить расчеты дисперсии.

Для подробного описания особенностей распределения используют дополнительные характеристики – моменты распределения.

Моментом «К» – го порядка называют среднюю из «К» – х степеней отклонений вариантов «Х» от некоторой постоянной величины «А»:

∑(хi– А)к fi

М к = ———————

∑f i

где А – величина, от которой определяются отклонения;

К – степень отклонения (порядок момента).

В зависимости от того, что принимается за величину «А», различают 3 вида моментов: начальные моменты получают при А = 0 :

∑хiк fi

М к = ——————

∑fi

центральные моменты получают при А = :

∑ (хi - )кfi

М 'к = ——————

∑f i

условные моменты получают при А = х и отличной от нуля:

∑ (хi – А)к

м * = ——————

∑f i

В статистической практике пользуются моментами первого, второго, третьего и четвертого порядков.

Начальный момент первого порядка М1 представляет собой среднюю арифметическую и используется как показатель центра распределения.

Центральный момент первого порядка (нулевое свойство средней арифметической) всегда равен нулю: М '1 = 0.

Центральный момент второго порядка представляет собой дисперсию и служит основной мерой колеблемости признака: М '2 = σ2 .

Центральный момент третьего порядка равен нулю в симметричном распределении и используется для определения показателя асимметрии. Центральный момент четвертого порядка М'4 применяется при вычислении показателя эксцесса.

Все перечисленные характеристики играют важную роль в анализе вариационных рядов и определении типа кривой распределения и при выравнивании вариационных рядов.

Число наблюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из изучаемой генеральной совокупности. С увеличением числа наблюдений и одновременным уменьшением величины интервалов зигзаги полигона сглаживаются и ломаная линия в пределе превращается в плавную кривую, которая называется кривой распределения.

Кривая распределения характеризует теоретическое распределение, закономерность распределения частот внутри однокачественной совокупности явлений. Изучение закономерности (или формы) распределения включает решение задач:

выяснение общего характера распределения;

выравнивание эмпирического распределения, которое состоит в том, что на основании эмпирического распределения строится кривая у = f (х) с заданной формой;

проверка соответствия найденного теоретического распределения эмпирическому.

Кривые распределения могут быть различных типов. В практике социально-экономических исследований широко используется, прежде всего, кривая нормального распределения.

Нормальным называют распределение вероятностей случайной непрерывной величины Х, плотность которого имеет вид:

1

Ф (х) = ——— ℓ- (х – а)2 /2σ2



где а – математическое ожидание;

σ – среднее квадратичное отклонение Х.

Отсюда видно, что нормальное распределение определяется двумя параметрами: а и σ. Достаточно знать эти параметры, чтобы задать нормальное распределение.

Кривая нормального распределения представляет собой симметричную куполообразную фигуру, где вправо и влево симметрично убывают, приближаясь к оси абсцисс.

Симметричным является такое распределение, в котором частоты двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений характерно равенство средней арифметической, моды и медианы.

Асимметрия, эксцесс, мода и медиана соответственно равны:
А s= 0; E x= 0; M o= a; M e= a, где а = М (Х). В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разность между средними ( – Мо), тем больше асимметрия ряда. Показатель асимметрии: - Мо А s= ——— . σ Для симметричных распределений вычисляют показатель эксцесса (островершинности), основанный на использовании центрального момента четвертого порядка: М '4
Е х = —— – 3 .

σ

Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения, где отношение М 4 /σ4 = 3.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения. Свойства кривой нормального распределения:

Функция нормального распределения Ф (t) – четная, т.е. Ф (-t) = Ф(+t). Следовательно, кривая симметрична относительно максимальной ординаты, которая соответствует = М о = М е; ее величина равна 1/ √2 π σ.

Функция имеет бесконечно малые значения при t = ± ∞ . Это означает, что кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. При этом, чем больше значения отклоняются от , тем реже они встречаются.

Функция имеет максимум при t = 0. Следовательно, кривая достигает модального значения при t = 0 или при х = . Величина максимума составляет 1/ √2 π.

При t = ±1 функция дает две точки перегиба, находящиеся на расстоянии ± σ от .

В пределах х ± σ (при t = 1) находятся 68,3 всех частот; в пределах ± 2σ (при t = 2) – 95,4% и в пределах ± 3σ (при t = 3) – 99,7 % (правило трех сигм).

Если случайная величина представляет сумму двух независимых случайных величин, следующих каждая нормальному закону, то она тоже следует нормальному закону.

Площадь между кривой и осью 0t равна единице, как интеграла Пуассона.

Нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных причин. Если при достаточно большом количестве случайных величин варьирование вызвано массовыми случайными факторами, то такая совокупность должна соответствовать нормальному распределению. Если распределение существенно отличается от нормального, то на результат повлияли какие-то неслучайные факторы. Эти положения широко используются при проведении выборочных наблюдений и оценки достоверности выборочных данных при определении численности выборки и величины ошибки выборки.

^ Задачи для самостоятельного решения:

1. Имеются данные о продуктивности коров за год (ц):

30, 32, 29, 38, 27, 31, 36, 34, 34, 26, 32, 28, 35, 40, 37, 28, 35, 37, 34, 39, 31, 29, 33, 27, 35, 30, 32, 27, 34, 32, 28, 37, 34, 27, 36, 41, 30, 33.

Постройте интервальный вариационный ряд распределения коров по продуктивности и рассчитайте основные характеристики этого ряда.


2. Имеются данные о среднем настриге шерсти в хозяйствах от 1 овцы (кг): 2,2; 2,0; 2,4; 2,7; 4,0; 4,6; 3,3; 4,1; 2,5; 5,5; 4,9; 4,0; 4,4; 2,7; 2,8; 3,5; 2,0; 2,9; 5,6; 5,2; 2,2; 5,4; 2,8; 2,0; 3,9.

Постройте интервальный вариационный ряд распределения хозяйств по среднему настригу шерсти от одной овцы и рассчитайте основные характеристики этого ряда.

3. Имеются данные по хозяйствам о расходе кормов на одну среднегодовую голову коров (ц к. ед.): 35, 34, 34, 43, 32, 35, 37, 36, 40, 39, 38, 32, 35, 33, 41, 48, 42, 38, 34, 45, 40, 34, 32, 38, 35, 37, 44, 34, 39, 37.

Постройте интервальный вариационный ряд распределения хозяйств по расходу кормов на среднегодовую корову и рассчитайте основные характеристики этого ряда.

4. Постройте интервальный ряд распределения хозяйств по расходу кормов на одну голову поросенка на стадии выращивания до отъема (ц. к.ед.): 2,0; 2,5; 2,1; 1,7; 2,5; 2,1; 1,7; 2,5; 1,9; 1,6; 1,9; 2,0; 2,4; 1,7; 2,3; 2,2; 2,3; 1,6; 2,0; 1,8; 2,2; 1,9; 2,3; 2,2; 2,1; 2,3; 2,2; 2,4; 2,1; 2,0; 1,9; 2,2.

Рассчитайте основные характеристики этого ряда.

5. Интервальный вариационный ряд распределения хозяйств по стоимости произведенной продукции сельского хозяйства для удобства расчетов был преобразован, опираясь на свойства средних величин. Определите среднюю стоимость произведенной продукции на 1 хозяйство, если известно, что длина интервала в ряду равна 0,2 млн. руб., значение признака, принятое за условное начало – 1,5 млн. руб., а преобразованная средняя равна 2,1 млн. руб.

6. Постройте кумуляту по следующим данным:

Интервалы по стоимости продукции, млн. руб. Число хозяйств

1,0 – 1,5 19

1,5 – 2,0 31

2,0 – 2,5 42

2,5 – 3,0 27

3,0 – 3,5 8

7. Определите среднюю арифметическую, моду и медиану в интервальном ряду распределения механизаторов по выработке на 1 эталонный трактор.

Группы механизаторов по выработке Число механизаторов

усл. э.т., га

150-170 4

170-190 9

190-210 19

210-230 28

6

8. Имеются следующие данные контрольного взвешивания нагульного гурта молодняка:

Интервалы по живой массе, кг Количество голов в группе

19

221-240 28

241-260 13

Определите модальное значение массы одной головы.

9. Имеются данные об удое на среднегодовую корову по молочному стаду коров:

Интервалы по удою на Число коров

1 среднегодовую корову, ц

23-25 90

25-27 160

27-29 250

29-31 400

31-33 550

33-35 450

35-38 320

38-41 190

Определите медианное значение удоя.

10. Определите среднюю арифметическую, модальное и медианное значение урожайности зерновых культур по следующим данным:

№ участка Урожайность, ц с 1 га Площадь, га

1 25 300

2 30 1000

3 40 800

4 45 400

11. Определите модальное значение и среднюю массу одного корнеплода по следующим данным:

Вес 1 корнеплода, кг Число корнеплодов

0,50 20

0,60 30

0,70 100

0,80 50

12. Определите модальное значение и средний прирост живой массы молодняка крупного рогатого скота по данным:

Прирост живой массы в сутки, г: 500 600 700

Число животных : 40 100 30

13. Построить форму графика вариационного ряда распределения хозяйств по урожайности зерновых культур, если модальное значение равно 15,0, медиана равна 17,0, средняя арифметическая равна 18,0.

14. В распределении средняя арифметическая равна 20, мода – 35. Определите медиану признака и охарактеризуйте распределение.

15. В распределении признака медиана равна 10, средняя арифметическая – 15.

Определите моду и охарактеризуйте распределение.

16. В статистической совокупности с группами численностью 5, 12, 23, 8 единиц модальный интервал значений признака составляет от 15 до 17. Определите моду распределения.

17. По исходным данным задачи 20 определите медиану признака, если известно, что совокупность разбита на группы с равными интервалами.

18. Совокупность 36 единиц разбита на 4 равночисленные группы с групповыми средними альтернативного признака I – 0; II - 0; III – 0,2; IV – 0,3. Определите средние групповые и среднюю арифметическую по совокупности после укрупнения групп I и II, III и IV.

19. По исходным данным значений признака:

2, 5, 3, 7, 5, 10, 3, 10, 3, 7

определите модальное и медианное значение признака.

20. По данным интервального ряда распределения

Интервалы значений Число единиц

признака в группе

2-4 7

4-6 13

6-8 25

12

определите моду и медиану интерполяционным способом.

21. Имеются данные о производстве молока в хозяйствах различного производственного направления:

Производственное Число Поголовье Удой на Жирность

направление хозяйств коров, гол 1 корову, ц молока %

Молочное 6 12000 26 4,0

Молочно-мясное 11 14200 23 3,6

Молочно- картофеле- 4 4800 31 4,3

водческое

Определите среднее поголовье коров на 1 хозяйство, средний удой на 1 корову в год, среднюю жирность молока.

22. Имеются следующие данные о жирности молока на разных месяцах лактации коров:

Месяц лактации Средний удой, кг Жирность молока, %

I 675 4,0

II 695 4,0

III 670 3,7

IV 665 3,8

V 600 3,8

VI 540 3,9

VII 500 4,5

VIII 475 4,6

Определите среднюю жирность молока, среднее квадратическое отклонение и коэффициент вариации жирности молока.


23. Имеются следующие данные о среднегодовых удоях коров различного возраста (в лактациях):

Группы коров Число коров Средний удой, Среднее квадратичес-

по возрасту ц кое отклонение удоя

(в лактациях) в группе, ц

1-2 34 26 2

3-4 46 28 1

5-6 31 31 3

Определите общую и межгрупповую дисперсии продуктивности коров.


24.Определите средние затраты труда на 1 ц зерна по следующим данным:

№ бригады Затраты труда на 1 ц Валовый сбор зерна, ц

зерна, чел.-ч

1 0,5 3000

2 0,6 3600

3 0,7 3500

4 0,8 3200

25. Определите среднюю обеспеченность хозяйств тракторами по следующим данным:

№ группы Приходится тракторов Число хозяйств

на 1000 га пашни

1 до 10 2

2 10-12 10

3 12-14 14

4 14-16 12

5 16-18 4

6 св. 18 3

Вычислите характеристики вариации признака по группам.

26. Определите модальное и медианное значение урожайности зерновых культур по следующим данным:

Группы по урожайности Число хозяйств

зерновых, ц/га

18-20 2

20-22 6

22-24 10

24-26 15

26-28 19

28-30 22

18


27. Определите среднюю урожайность капусты и дисперсию по следующим данным: № Урожайность Площадь посадки га

п/п капусты, ц/га

1 396 200

2 398 100

3 400 400

4 406 300

29. Определите среднее значение и среднее квадратическое отклонение денежного дохода.

Группы хозяйств по денеж- Число хозяйств

ному доходу, тыс. руб. в группе

1000-1200 3

1200-1400 4

1400-1600 8

1600-1800 6

1800-2000 4

30. Используя свойства средней арифметической, рассчитайте среднее значение и коэффициент вариации урожайности кормовых корнеплодов по следующим данным:

№ п/п Урожайность, ц/га Площадь, га

1 285 100

2 398 125

3 400 625

4 430 300

31. Имеются следующие данные о затратах труда на 1 га вспашки по 10 трактористам:

№ трактора Затраты труда на 1 га

вспашки, чел.-ч

1 0,7

2 0,7

3 0,8

4 0,8

5 0,9

6 1,0

7 1,0

8 1,2

9 1,3

10 1,4

Определить среднее значение признака, медиану и коэффициент вариации.

32. Имеются данные о количестве произведенной продукции и затратах труда на ее производство в хозяйствах района:

№ хозяйства Валовое производство Затраты на производство

зерна, тыс. ц зерна, тыс. чел.-ч

1 200 240

2 170 164

3 195 296

4 210 236

5 180 156

Определить средние затраты труда на 1ц зерна в хозяйствах не квадратическое отклонение и коэффициент вариации затрат труда на 1ц зерна.

33. Совокупность единиц разбита по двум признакам:

Группы по первому Группы по второму

признаку признаку

40-60 60-80 80-100

100-200 Численности в группах

200-300 5 2 1

300-400 7 10 5

10 25 30

Определите: а) групповые средние по первому признаку;

б) групповые средние по второму признаку

в) среднюю арифметическую по совокупности.

34. Совокупность единиц представлена следующими данными:

№ группы Значение признака в группе

2,3,2,5,3,2,4,43,4,5

10,7,8,10,8,8,9,10,8,8

Определите: а) групповые средние; б) среднюю арифметическую по совокупности – через индивидуальные значения признака совокупности и через групповые средние.

35. Групповые средние по совокупности равны 25, 100, 250 при равночисленных группах 200 единиц. Определите среднюю арифметическую по совокупности, применив математические свойства средней.

36. Совокупность разбита на 4 группы:

Показатель

Группа

По совокупности в целом

1

2

3

4

Средняя арифметическая

Число единиц в группе

3

10

7

12

15

5





20

35

Определите среднюю арифметическую в 4 группе.

37. Совокупность 36 единиц разбита на 4 равночисленные группы с групповыми средними альтернативного признака I – 0; II - 0; III – 0,2; IV – 0,3. Определите средние групповые и среднюю арифметическую по совокупности после укрупнения групп I и II, III и IV.

38. Определите среднюю арифметическую по совокупности с альтернативным признаком, если известно; что совокупность разбита на 3 группы и групповая средняя в 1 группе больше групповой средней во второй группе в 2 раза и больше групповой средней в 2 группе в 3 раза при равных численностях групп.

39. В двух совокупностях значения признака имеют следующие значения:

Совокупность Значение признака

1 1,1,2,2,3,3,4,4,5,5

2 1,2,3,4,5,6,7,8,9,10.

Определите, на какую величину различаются дисперсии признака.

40. По следующему распределению:

Интервал признака Частота

2-4 3

4-6 5

6-8 2

1

Определите: 1) размах вариации; 2)среднее линейное отклонение; 3)дисперсию признака; 4) среднее квадратичное отклонение; 5)коэффициент вариации.

41. По исходным данным задачи 40 определите дисперсию признака, преобразовав значения признака способом отсчета от условного начала.

42. По наблюдениям получены следующие данные:
Цвет Повторности
1 2 3 4

Красный

Белый

1 1 0 1

0 0 1 0

Определите средний размер вариации красного цвета в совокупности.

43. Значения признака в совокупности следующие:

1, 3, 1, 2, 3, 2, 1, 2, 2, 1.

Определите среднюю относительную меру колеблемости признака совокупности.

44. По распределению единиц

Значение признака Число единиц

395 1000

408 2000

400 1000

1000

Определите среднее квадратическое отклонение, применив свойства показателей вариации.

45. По ряду распределения альтернативного признака численностью 40 единиц известно, что средняя арифметическая равна 10. Определите дисперсию признака.

46. Определите дисперсию признака по распределению альтернативного признака, если известно, что соотношение средней и дисперсии 2:1.

47. В нормально распределенной совокупности численностью 1000 единиц среднее квадратичное отклонение равно 20. Определите размах вариации признака.

48. По исходным данным

№ группы Значение признака в группе

1 2,3,4

2 7,8,6

3 10,12,11

Определите общий объем вариации и дисперсию признака совокупности.

49. По следующим данным определите, в какой совокупности мера колеблемости выше:

Совокупность Средняя арифметическая Среднее отклонение

1 20 2

2 496 35

50. По исходным данным

№ группы Значение признака в группе

1 2, 4, 3

2 10, 11, 12

3 25, 26, 24

Определите межгрупповую вариацию и дисперсию признака.

51. По исходным данным задачи 50 определите внутригрупповой объем вариации и дисперсию признака.

52. По исходным данным задачи 50 определите общий объем вариации и дисперсию признака.

Проанализировав решения задач 50-52 проверьте закон сложения дисперсий и правило сложения объемов вариации признака.

53. По следующим данным

Групповые средние Число единиц в группе

10 5

17 8

3

Определите межгрупповую вариацию признака.

54. Рассчитайте общую дисперсию признака по совокупности 24 единиц, если известно, что совокупность разбита на разночисленные группы со средними арифметическими 2,4,12 и внутригрупповыми вариациями 1,3,2.

55. Совокупность разбита на группы по трем признакам:

г р у п п ы

Первый признак Второй признак Третий признак

а б

(число единиц)

1 1 2 3

2 7 10

2 1 15 20

2 31 37

Определите внутригрупповые объемы вариации.

56. По исходным данным задачи 55 определите межгрупповую дисперсию признака.

57. По исходным данным задачи 55 определите общий объем вариации признака.

58. По совокупности численностью 45 единиц известно, что межгрупповая дисперсия признака равна 70 и значения по группам составляют


№ группы Средняя Число единиц

1 5 10

2 15 25

3 … …

Определите параметры 3 группы.

59. По исходным данным интервального ряда определите начальные и центральные моменты первых четырех порядков и проанализируйте полученные показатели

Интервалы Частота

2-4 5

4-6 20

6-8 25

10

60. По исходным данным задачи 59 определите центральные моменты первых четырех порядков: 1)используя соотношения начальных и центральных моментов и 2) преобразовывая значения признака и частоту в группах способом отсчета от условного начала.

61. Ряд распределений имеет следующие характеристики: коэффициент асимметрии равен +1, коэффициент эксцесса «–1.» Постройте график распределения, отражающий тип данного распределения.

62. Определите среднюю колеблемость признака совокупности если коэффициент эксцесса и коэффициент асимметрии равны нулю а начальный момент четвертого порядка равен 100.

63. По исходным данным ряда распределения
^ Интервалы Частота
20-40 100

40-60 200

60-80 400

80-100 200

100-120 100

Определите центральный момент второго порядка, используя


Тема 2. Генеральная и выборочная совокупности.

Статистическая оценка параметров распределения.


Объемом совокупности (выборочной или генеральной) называют число, объектов совокупности. Генеральной совокупностью называется совокупность объектов, из которых формируется выборка. Выборочной совокупностью (выборкой) является совокупность случайно отобранных объектов. Выборочным называется такое наблюдение, которое дает характеристику всей совокупности на основе обследования некоторой ее части.

Область применения. Применяется выборочное наблюдение за деятельностью малых предприятий. Для изучения бюджетов домохозяйств, качества продукции, пассажиро – потока, проблем занятости, миграции, явлений в сфере коммерции, предпринимательства и бизнеса.

Выборки различаются по видам отбора: повторный и бесповторный; по методам: индивидуальный, групповой и комбинированный; по способом организации: случайный, типический, серийный, механический, многофазный, взаимопроникающий и другие; по степени охвата: большие и малые выборки.

Основное требование к выборке: репрезентативность (представительность). Простой случайный отбор – отбор, не требующий расчленения генеральной совокупности на части.

Случайный отбор означает отбор наугад, бессистемно, например, жеребьевка, таблица случайных чисел.

Механический отбор применяется, когда генеральная совокупность каким – либо образом упорядочена (списки избирателей, табельные номера работников, номера домов и квартир). Устанавливается пропорция отбора.

Типическая выборка. Все единицы генеральной совокупности разбивают на несколько типических групп. Например, при обследовании предприятий группами могут быть отрасли и подотрасли, формы собственности; при обследовании населения – районы, социальные группы, возрастные или группы по уровню образования. Затем из каждой типической группы отбирают единицы случайным или механическим способом.

Серийная выборка применяется, когда единицы совокупности объединены в небольшие группы или серии. В качестве подобных серий могут быть партии товара, бригады, студенческие группы. Серии отбирают случайным или механическим отбором, а внутри серий проводится сплошное обследование единиц.

Комбинированная выборка – это комбинация нескольких способов отбора. Например, когда серии отбираются из нескольких типических групп. Сочетают также серийный и случайный отбор: единицы внутри серии отбираются в случайном порядке. Ошибка такой выборки обусловлена многоступенчатостью отбора.

Многоступенчатый отбор – из генеральной совокупности сначала отбирают укрупненные группы, потом более мелкие до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофазная выборка: на каждой последующей стадии отброра программа обследования расширяется.

Статистическая оценка параметров генеральной совокупности производится на основе обследования части генеральной совокупности (выборки), отобранной на научных принципах. Статистической оценкой неизвестного параметра теоретического распределения в математической статистике называют функцию от наблюдаемых случайных величин.

Параметры выборки близки к характеристикам генеральной совокупности, но отличаются от них на величину средней ошибки. Ее величина прямопропорциональна вариации признака в генеральной совокупности и обратнопропорциональна корню из численности выборки. Следовательно, средняя ошибка выборки тем больше, чем выше колеблемость признака в генеральной совокупности, и тем меньше, чем больше численность выборки.

В зависимости от вида и способа отбора различаются формулы, применяемые для определения средней ошибки выборки.


Формулы для определения средней ошибки выборки

(при расчете средней)


Способы

Виды выборки

Собственно – случайная выборка

Типическая

Серийная

Повторная







Бесповторная








Где σ2 – дисперсия признака в генеральной или выборочной совокупности;

σ2 – средняя из выборочных дисперсий типических групп;

σs2 – межсерийная дисперсия;

s – число выборочных серий;

S – число равных серий в генеральной совокупности.

Необходимая численность случайной повторной выборки определяется по формуле: .

При случайном бесповторном отборе по формуле: .


Задача статистической оценки параметров распределения может быть решена двояко: во-1) охарактеризовать неизвестный параметр одним числом (точкой); или во-2) указать интервал, в котором с определенной вероятностью может находиться искомый параметр.

В связи с этим различают два метода статистической оценки:

точечная оценка;

интервальная оценка.

Точечная оценка неизвестного параметра: за наилучшее приближение к истинному значению параметра генеральной совокупности (θ) принимается конкретное числовое значение выборочной оценки. А так как при использовании выборочного метода существует риск допустить ошибку, то числовое значение выборочного параметра обязательно дополняется показателем средней ошибки этого выборочного параметра: θ = θ при mθ, где mθ – средняя ошибка выборочного параметра.

Интервальная оценка параметров генеральной совокупности производят путем определения интервала, в котором с заданным уровнем вероятности находится параметр генеральной совокупности. При этом в качестве измерителя длины интервала используют нормированное отклонение tα.

Интервальное оценивание особенно необходимо при малом числе наблюдений, когда точечная оценка мало надежна. При вычислении доверительного интервала определяют его максимальное значение при заданном уровне вероятности, т.е. определяют предельную ошибку выборки по формуле: . Величина предельной ошибки вычисляется при заданном уровне вероятности (Р), с которым функционально связано нормиванное отклонение (t).

Чем меньше доверительный интервал, тем точнее оценка неизвестного параметра, и наоборот, если интервал велик, то оценка, выполненная с его помощью, мало пригодна для анализа. Границы генеральной средней (доверительным интервал) определяются по формуле: .

Несмещенной называют статистическую оценку θ, математическое ожидание которой равно оцениваемому параметру θ при любом объеме выборки, т.е. М (θ) = θ.

Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.

Эффективной называют статистическую оценку, которая при заданном объеме выборки «n» имеет наименьшую возможную дисперсию.

Состоятельной называют статистическую оценку, которая при n → ∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n → ∞ стремится к нулю, то такая оценка оказывается и состоятельной.

В случае, если требуется дать статистическую оценку доли признака в генеральной совокупности, то при расчете средней и предельной ошибок выборочной доли (ω) следует дисперсию доли исчислять по формуле: σ2доли = ω (1 – ω), где ω – доля значения признака в выборочной совокупности.


Задачи для самостоятельного решения.


Для определения всхожести зерна из каждого мешка массой 50 кг. взята проба зерна массой 100 г. Определить с вероятностью Р = 0,95 всхожесть зерна во всей партии, если по выборке средней процент всхожести зерна составил 80%.

Для определения степени поражения виноградника вредителями методом случайного отбора из 1000 кустов отобрали 500 кустов. В результате выборки установлено, что виноградник поражен в среднем на 13%. Определить среднюю степень поражения вредителями всего виноградника с вероятностью 0,95.

Для определения урожайности пшеницы на корню предполагается наложить 200 метровок на участке в 250 га. Колеблемость урожайности равна 4 ц с гектара. Определить вероятность того, что ошибка средней урожайности, определенная с помощью случайной
еще рефераты
Еще работы по разное