Реферат: Основные понятия статистики
ТЕМА 1.4. Законы распределенияслучайных величин, наиболее часто используемые в экономических приложениях, и ихчисловые характеристики
1. Основные распределения дискретных случайныхвеличин: биномиальное распределение, распределение Пуассона.
2. Основные распределения непрерывных случайныхвеличин: равномерное распределение, показательное распределение, нормальноераспределение.
3. Критериальные случайные величины. РаспределениеСтьюдента, Пирсона, Фишера — Снедекора.
1. Основные распределения дискретныхслучайных величин: биномиальное распределение, распределение Пуассона.
1.1 Биноминальноераспределение
Дискретная случайная величина Х имеетбиноминальный закон распределение, если она принимает значения 0, 1, 2, …m… n с вероятностями
/>,
0< p <1, q = 1– p, m = 0, 1, 2, …n
Как видно, вероятность значенийнаходится по формуле Бернулли. Следовательно, биноминальный закон распределенияпредставляет собой распределение числа Х = m, количества событий А, произошедших в n испытаниях. Бернулли, в каждом изкоторых событие A происходит с вероятностью p, а противоположное событие /> с вероятностью 1- p… Закон распределениябиноминальной случайной величины Х в развёрнутом форме имеет вид:
/>
— верхняя строчка — это совокупностьчисловых значений, которые может принимать случайная величина;
— нижняя строчка — вероятностьсобытия, что случайная величина примет эти значения.
Определение биноминального законакорректно, так как основное свойство ряда распределения /> выполнено, ибо />, как было отмечено выше, есть сумма всех членовразложения бинома Ньютона:
/>
Отсюда и название закона –биноминальный.
Числовые характеристикибиноминального распределения:
1. М(Х) = np
2. D(X) = npq
1.2 Закон распределенияПуассона
Дискретная случайная величина Х имеетзакон распределение Пуассона, если она принимает значения 0, 1, 2, …m,… (бесконечное, но счётное множествозначений) с вероятностями
/>,
где m = 0, 1, 2, …
Числовые характеристики распределенияПуассона:
3. М(Х) = λ
4. D(X) = λ
2. Основныераспределения непрерывных случайных величин
Отметим рядособенностей свойств непрерывных случайных величин.
1. Множество значений непрерывной случайнойвеличины есть совокупность всех точек числовой оси.
2. Функция распределения непрерывнойслучайной величины./>является непрерывной.
3. Найдем вероятность того, что врезультате испытаний случайная величина X примет значение a, где a — произвольное действительное число:
/>
В случае непрерывной случайнойвеличины мы сталкиваемся с ситуацией, когда событие принципиально можетпроизойти в результате испытания, но имеет вероятность равную 0. Это надотрактовать так, что распределения непрерывных случайных величин дают нам значениявероятности р = f(x) не для данного значения х случайной величины, а дляинтервала значений Δ х, примыкающего к х. Поэтому возможно такоеопределение
Определение. Случайная величина Xназывается непрерывной, если ее пространством элементарных событий является всячисловая ось (либо отрезок (отрезки) числовой оси), а вероятность наступлениялюбого элементарного события равна нулю.
Естественны следствия такогоопределения.
1.F(b)-F(a) = P(a£ X< b) = P(a£ X £b)
2.Неотрицательнаячисловая функция f(x) действительного аргумента x называется плотностьювероятности, и существует в точке x, если в этой точке существует предел:
/>
Свойства плотностивероятности.
а). /> />
/>
d)./>/>
Следствие: Если пространствомэлементарных событий является отрезок числовой оси, то пространствоэлементарных событий формально можно распространить на всю числовую ось,положив вне отрезка значение плотности вероятности равное 0.
Примеры непрерывныхраспределений.
2.1 Равномерное распределение
/>
/>
х
Найдём константу с :
/>
т.к. />.
Функция распределения равномерногораспределения:
/>
Математическое ожидание: М(Х)=(а+в)/2, дисперсия D(X) = (b — a)2/12
/>
x
2.2 Показательный закон распределения
/>
f(x)
/>
x
/>
Функция распределения показательного распределения:
/>
Математическое ожидание: М(Х) = 1/λ, дисперсия D(X) =1/ λ2
2.3 Нормальноераспределение – распределение Гаусса
Случайная величина имеет нормальноераспределение (распределение Гаусса) и называется нормально распределенной,если ее плотность вероятности
/>
По определению функция распределения:
/>
Определение функция плотностираспределения корректно, т.к. основное свойство распределения /> = 1 выполнено,поскольку интеграл
/>
/>
С нормальнымраспределением тесно связана функция Лапласа
Функцией Лапласа называется функциявида
/>
Функция Лапласа при z >0определяет вероятность попадания стандартной нормальной случайной величины (M(X) = 0, D(X) =1) в интервал (0, z)
Вероятность того, что значениянормальной случайной величины лежат в интервале (a, b) определяется следующимвыражением:.
/>
где />
3. Критериальные случайныевеличины. Распределение Стьюдента, Пирсона, Фишера — Снедекора
Случайные величины t – Стьюдента, χ2– Пирсона, F – Фишера – Снедекора задаются табличным способом ииспользуются в качестве критериальных в статистике
Контрольные вопросы
1.Дайте определение биномиальному распределению.Каковы его свойства и основные характеристики?
2. Дайте определение распределениюПуассона? Каковы его свойства и основные характеристики?
3. Какоераспределение называется равномерным? Каковы его свойства и основные характеристики?
4. Какоераспределение называется нормальным? Каковы его свойства и основные характеристики?
5. Напишите функциюраспределения нормально распределенной случайной величины X, если M(Х) =3, D(X) =σ2= 16.
6. Задана случайнаявеличина X, распределенная нормально с параметрами
M(Х) = 0 и σ = 2.
Найдитевероятность того, что эта случайная величина принимает значение
а) из отрезка[-1,2]; б) меньшее -1; в) большее 2; г) отличное от своего среднего значения поабсолютной величине не больше, чем на 1.
7. Заданадискретная случайная величина Z – индикатор испытаний: Z =1, если всоответствующем испытании событие А появилось и Z = 0 впротивоположном случае. Закон распределения имеет вид:
Z 1 P q pНайтиматематическое ожидание и дисперсию Z.
8. Дискретнаяпуассоновская случайная величина X p имеетраспределение:
/>
Вычислитематематическое ожидание и дисперсию дискретной пуассоновской случайной величины
9. Заданаравномерно распределённая на отрезке [a;b] непрерывнаяслучайная величина Х:
/>
Вычислите математическоеожидание и дисперсию случайной величины Х.
10. Задананепрерывная случайная величина Y, имеющая показательное распределение:
/>
Вычислите математическоеожидание и дисперсию случайной величины Y.
11. Задана непрерывнаяслучайная величина X, имеющая нормальное распределение:
/>
Вычислите математическоеожидание и дисперсию случайной величины X.
Тема 1.5. Системы случайных величин
1. Закон распределения, функция распределения системыслучайных величин, их свойства.
2. Условные законы распределения, условные числовые характеристики системыслучайных величин, условие независимости случайных величин.
3. Функцией регрессии. Линейная регрессия.
4. Корреляция, свойство коэффициента корреляции. Линейная корреляция
1. Закон распределения, функцияраспределения системы случайных величин, их свойства
Рассмотренные выше случайные величины былиодномерными, т.е. определялись одним числом, однако, существуют также случайныевеличины, которые определяются двумя, тремя и т.д. числами. Такие случайныевеличины называются двумерными, трехмерными и т.д.
В зависимости от типа, входящих в систему случайныхвеличин, системы могут быть дискретными, непрерывными или смешанными, если всистему входят различные типы случайных величин.
Более подробно рассмотрим системы двух случайныхвеличин.
Определение. Законом распределения системы случайныхвеличин называется соотношение, устанавливающее связь между областями возможныхзначений системы случайных величин и вероятностями появления системы в этихобластях.
Определение. Функцией распределения системы двухслучайных величин называется функция двух аргументов F(x, y), равнаявероятности совместного выполнения двух неравенств X<x, Y<y.
/>
Отметим следующие свойства функции распределениясистемы двух случайных величин:
1) Если один из аргументов стремится к плюсбесконечности, то функция распределения системы стремится к функции распределенияодной случайной величины, соответствующей другому аргументу.
/>
2) Если оба аргумента стремятся к бесконечности, тофункция распределения системы стремится к единице.
/>
3) При стремлении одного или обоих аргументов к минусбесконечности функция распределения стремится к нулю.
/>
4) Функция распределения является неубывающей функциейпо каждому аргументу.
5) Вероятность попадания случайной точки (X, Y) в произвольныйпрямоугольник со сторонами, параллельными координатным осям, вычисляется поформуле:
/>
Плотность распределения системы двух случайныхвеличин./>
Определение. Плотностью совместного распределения вероятностейдвумерной случайной величины (X, Y) называетсявторая смешанная частная производная от функции распределения.
/>
Если известна плотность распределения, то функцияраспределения может быть легко найдена по формуле:
/>
Двумерная плотность распределения неотрицательна идвойной интеграл с бесконечными пределами от двумерной плотности равен единице.
/>
По известной плотности совместного распределения можнонайти плотности распределения каждой из составляющих двумерной случайнойвеличины.
/>
/>; />;
2. Условные законы распределения, условные числовыехарактеристики системы случайных величин, условие независимости случайныхвеличин
Условные законы распределения./>
Как было показано выше, зная совместный законраспределения можно легко найти законы распределения каждой случайной величины,входящей в систему.
Однако, на практике чаще стоит обратная задача – поизвестным законам распределения случайных величин найти их совместный законраспределения.
В общем случае эта задача является неразрешимой, т.к.закон распределения случайной величины ничего не говорит о связи этой величиныс другими случайными величинами.
Кроме того, если случайные величины зависимы междусобой, то закон распределения не может быть выражен через законы распределениясоставляющих, т.к. должен устанавливать связь между составляющими.
Все это приводит к необходимости рассмотрения условныхзаконов распределения.
Определение. Распределение одной случайной величины,входящей в систему, найденное при условии, что другая случайная величинаприняла определенное значение, называется условным законом распределения.
Условный закон распределения можно задавать как функциейраспределения так и плотностью распределения.
Условная плотность распределения вычисляется поформулам:
/>
/>
Условная плотность распределения обладает всемисвойствами плотности распределения одной случайной величины.
Условное математическое ожидание./>
Определение. Условным математическим ожиданиемдискретной случайной величины Y при X = x (х – определенноевозможное значение Х) называется произведение всех возможных значений Y на их условныевероятности.
/>
Для непрерывных случайных величин:
/>,
где f(y/x) – условнаяплотность случайной величины Y при X=x.
3. Функцией регрессии. Линейная регрессия
Условное математическое ожидание M(Y/x)=f(x) являетсяфункцией от х и называется функцией регрессии Х на Y.
Пример. Найти условное математическое ожиданиесоставляющей Y при
X= x1=1 для дискретнойдвумерной случайной величины, заданной таблицей:
Y X x1=1 x2=3 x3=4 x4=8 y1=3 0,15 0,06 0,25 0,04 y2=6 0,30 0,10 0,03 0,07/>
/>
/>
/>
Аналогично определяются условная дисперсия и условныемоменты системы случайных величин.
Зависимые и независимые случайные величины./>
Случайные величины называются независимыми, если законраспределения одной из них не зависит от того какое значение принимает другаяслучайная величина.
Понятие зависимости случайных величин является оченьважным в теории вероятностей.
Условные распределения независимых случайных величинравны их безусловным распределениям.
Определим необходимые и достаточные условиянезависимости случайных величин.
Теорема. Для того, чтобы случайные величины Х и Y были независимы,необходимо и достаточно, чтобы функция распределения системы (X, Y) была равнапроизведению функций распределения составляющих.
/>
Аналогичную теорему можно сформулировать и дляплотности распределения:
Теорема. Для того, чтобы случайные величины Х и Y были независимы,необходимо и достаточно, чтобы плотность совместного распределения системы (X, Y) была равнапроизведению плотностей распределения составляющих.
/>
4. Корреляция, свойство коэффициента корреляции.Линейная корреляция
Определение. Корреляционным моментом mxy случайных величин Х и Y называетсяматематическое ожидание произведения отклонений этих величин.
/>
Практически используются формулы:
Для дискретных случайных величин:
/>
Для непрерывных случайных величин:
/>
Корреляционный момент служит для того, чтобыохарактеризовать связь между случайными величинами. Если случайные величинынезависимы, то их корреляционный момент равен нулю.
Корреляционный момент имеет размерность, равнуюпроизведению размерностей случайных величин Х и Y. Этот фактявляется недостатком этой числовой характеристики, т.к. при различных единицахизмерения получаются различные корреляционные моменты, что затрудняет сравнениекорреляционных моментов различных случайных величин.
Для того, чтобы устранить этот недостаток применятсядругая характеристика – коэффициент корреляции.
Определение. Коэффициентом корреляции rxy случайных величинХ и Y называется отношение корреляционного момента кпроизведению средних квадратических отклонений этих величин.
/>
Коэффициент корреляции является безразмерной величиной. Коэффициенткорреляции независимых случайных величин равен нулю.
Свойство: Абсолютная величина корреляционногомомента двух случайных величин Х и Y не превышает среднего геометрического их дисперсий.
/>
Свойство: Абсолютная величина коэффициента корреляциине превышает единицы.
/>
Случайные величины называются коррелированными, еслиих корреляционный момент отличен от нуля, и некоррелированными, если ихкорреляционный момент равен нулю.
Если случайные величины независимы, то они инекоррелированы, но из некоррелированности нельзя сделать вывод о ихнезависимости.
Если две величины зависимы, то они могут быть каккоррелированными, так и некоррелированными.
Часто по заданной плотности распределения системы случайныхвеличин можно определить зависимость или независимость этих величин.
Наряду с коэффициентом корреляции степень зависимостислучайных величин можно охарактеризовать и другой величиной, которая называетсякоэффициентом ковариации. Коэффициент ковариации определяется формулой:
/>
Пример. Задана плотность распределения системыслучайных величин Х и Y.
/>
/>
Выяснить являются ли независимыми случайные величины Хи Y.
Для решения этой задачи преобразуем плотностьраспределения:
/>
Таким образом, плотность распределения удалосьпредставить в виде произведения двух функций, одна из которых зависит только отх, а другая – только от у. Т.е. случайные величины Х и Y независимы. Разумеется,они также будут и некоррелированы.
Линейная регрессия./>
Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимыеслучайные величины.
Представим приближенно одну случайную величину какфункцию другой. Точное соответствие невозможно. Будем считать, что эта функциялинейная.
/>
Для определения этой функции остается только найти постоянные величины a и b.
Определение. Функция g(X) называетсянаилучшим приближением случайной величины Y в смысле методанаименьших квадратов, если математическое ожидание
/> принимает наименьшее возможноезначение. Также функция g(x) называется среднеквадратическойрегрессией Y на X.
Теорема. Линейная средняя квадратическая регрессия Y на Х вычисляетсяпо формуле:
/>
в этой формуле
mx=M(X), my=M(Y), /> коэффициенткорреляции величин Х и Y.
Величина /> называется коэффициентом регрессииY на Х.
Прямая, уравнение которой
/>,
называется прямой сренеквадратической регрессии Y на Х.
Величина /> называется остаточной дисперсиейслучайной величины Y относительно случайной величины Х. Эта величинахарактеризует величину ошибки, образующейся при замене случайной величины Y линейной функцией g(X)=aХ + b.
Видно, что если r=±1, то остаточная дисперсия равна нулю, и, следовательно,ошибка равна нулю и случайная величина Y точнопредставляется линейной функцией от случайной величины Х.
Прямая среднеквадратичной регрессии Х на Y определяетсяаналогично по формуле:
/>
Прямые среднеквадратичной регрессии пересекаются вточке (тх, ту), которую называют центром совместного распределения случайныхвеличин Х и Y.
Линейная корреляция./>
Если две случайные величины Х и Y имеют в отношениидруг друга линейные функции регрессии, то говорят, что величины Х и Y связаны линейнойкорреляционной зависимостью.
Теорема. Если двумерная случайная величина (X, Y) распределенанормально, то Х и Y связаны линейной корреляционной зависимостью.
Контрольные вопросы:
1. Дайте определение законараспределения, функцией распределения системы случайных величин.
2. Что такое условные законыраспределения, условные числовые характеристики системы случайных величин?
3. Что такое функция регрессиямежду случайными величинами ?
4. Что такое корреляционная связьмежду случайными величинами?
5. Найти условное математическое ожидание составляющейY при
X= x2=3 и Х= х3=4 длядискретной двумерной случайной величины, заданной таблицей: