Реферат: Понятие о статистике и краткие сведения из ее истории

--PAGE_BREAK--Закон вариации средних величин
.
  Вариация средних величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах:<img width=«77» height=«66» src=«ref-2_1324831406-500.coolpic» v:shapes="_x0000_i1146">, где n– число единиц.
3. Моменты. Ассиметрия и эксцесс

Моменты – обобщающие характеристики, определяющие характер распределения.

<img width=«263» height=«321» src=«ref-2_1324831906-2875.coolpic» v:shapes="_x0000_s1050 _x0000_s1051 _x0000_s1052 _x0000_s1053 _x0000_s1054 _x0000_s1055 _x0000_s1056 _x0000_s1057 _x0000_s1058 _x0000_s1059 _x0000_s1060 _x0000_s1061 _x0000_s1062 _x0000_s1063 _x0000_s1064 _x0000_s1065 _x0000_s1066 _x0000_s1067 _x0000_s1068 _x0000_s1069">Различают начальные, начальные относительно <img width=«17» height=«24» src=«ref-2_1324817387-93.coolpic» v:shapes="_x0000_i1147"> (условные), и центральные моменты. Начальные моменты <img width=«25» height=«24» src=«ref-2_1324834874-117.coolpic» v:shapes="_x0000_i1148">: <img width=«84» height=«49» src=«ref-2_1324834991-284.coolpic» v:shapes="_x0000_i1149">. Центральные моменты (<img width=«20» height=«24» src=«ref-2_1324835275-101.coolpic» v:shapes="_x0000_i1150">): <img width=«169» height=«55» src=«ref-2_1324835376-634.coolpic» v:shapes="_x0000_i1151">. Центральный момент <img width=«20» height=«24» src=«ref-2_1324836010-100.coolpic» v:shapes="_x0000_i1152">используется для числового измерения ассиметрии <img width=«19» height=«24» src=«ref-2_1324836110-102.coolpic» v:shapes="_x0000_i1153">, которая определяется как отношение: <img width=«19» height=«24» src=«ref-2_1324836110-102.coolpic» v:shapes="_x0000_i1154">=<img width=«29» height=«48» src=«ref-2_1324836314-267.coolpic» v:shapes="_x0000_i1155">. Ассиметрия характеризует «скошенность» распределения. Величина показателя <img width=«24» height=«30» src=«ref-2_1324836581-109.coolpic» v:shapes="_x0000_i1156"> может быть положительной (рис.3 б) и отрицательной (рис.3 а).

<img width=«350» height=«150» src=«ref-2_1324836690-1937.coolpic» v:shapes="_x0000_s1070 _x0000_s1071 _x0000_s1072 _x0000_s1073 _x0000_s1074 _x0000_s1075 _x0000_s1076 _x0000_s1077 _x0000_s1078 _x0000_s1079 _x0000_s1080 _x0000_s1081 _x0000_s1082 _x0000_s1083 _x0000_s1084 _x0000_s1085 _x0000_s1086 _x0000_s1087 _x0000_s1088 _x0000_s1089 _x0000_s1090"> (островершинности).

Для симметричных распределений рассчитывается показатель эксцесса Эксцессом называется величина: <img width=«71» height=«50» src=«ref-2_1324838627-343.coolpic» v:shapes="_x0000_i1157">-3, которая характеризует островершинность или плосковершинность  распределения, так называемую «крутость».

Для нормального закона <img width=«25» height=«41» src=«ref-2_1324838970-142.coolpic» v:shapes="_x0000_i1158">=3, таким образом <img width=«20» height=«24» src=«ref-2_1324839112-101.coolpic» v:shapes="_x0000_i1159">=0.  Распределения более островершинные, чем нормальное, обладают положительным эксцессом, более плосковершинные – отрицательным эксцессом. На рис. 4 представлены островершинное (величина эксцесса положительная) и плосковершинное (величина эксцесса отрицательная) распределения.



4. Законы распределения

Законы распределения являются обобщающей характеристикой вариации в однородной совокупности.

Нормальное распределение. Распределение признака в совокупности называется нормальным, если этот признак представляет собой результат воздействия многочисленных и многообразных факторов, которые мало связаны друг с другом и влияние каждого из них незначительно по сравнению с общим  влиянием всех факторов. Аналитически нормальное распределение описывается следующим образом: <img width=«140» height=«60» src=«ref-2_1324839213-656.coolpic» v:shapes="_x0000_i1160">.

1. 
Понятие выборочного наблюдения, его задачи


 
Выборочное наблюдение —
такое несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются не все единицы изучаемой совокупности, а лишь часть, отобранная в определенном порядке. Наблюдение организовано таким образом, что эта часть отобранных единиц в уменьшаемом масштабе репрезентирует (представляет) всю совокупность.

     Преимущества выборочного наблюдения:  экономия времени и средств в результате сокращения объема работы; сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения и т.п.); достижение большей точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.

Выборочное наблюдение следует проводить в строгом соответствии с научными принципами теории выборочного метода. Такими принципами являются: обеспечение случайности (равной возможности попадания в выборку) отбора единиц и достаточного их числа. Соблюдение этих принципов позволит получить достаточную гарантию репрезентативности полученной выборочной совокупности. Понятие репрезентативности отобранной совокупности означает: ее представительство в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

Основная задача выборочного наблюдениясостоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности.

Однако, при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.

Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, т.к. не имеют преимущественного направления в сторону преувеличения или снижения значения изучаемого показателя. Систематические ошибки направлены в одну сторону, вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их избегают при правильной организации и проведении наблюдения.

Ошибки репрезентативностиприсущи только выборочному наблюдению и возникают вследствие того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между величинами выборочных и соответствующих генеральных показателей.

Характеристики генеральной и выборочной совокупностей.Совокупность отобранных единиц называют выборочной совокупностью, а совокупность единиц, из которых производится отбор, — генеральной совокупностью.

Генеральная и выборочная совокупности характеризуются своими показателями: долей, средним размером признака, дисперсией и др. Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается p. Выборочная доля обозначается через w. Выборочная доля называется также частостью.

Средний размер в генеральной совокупности называют генеральной средней и обозначают <img width=«21» height=«25» src=«ref-2_1324839869-172.coolpic» v:shapes="_x0000_i1161">, средний размер в выборочной совокупности – выборочной средней, обозначаемой <img width=«20» height=«25» src=«ref-2_1324840041-182.coolpic» v:shapes="_x0000_i1162">.

С определенной вероятностью можно судить о величине разности между генеральными и выборочными характеристиками на основе предельных теорем.  Предельные теоремы исходят из нормального распределения величин. Нормальное распределение показывает, что большая часть величин сосредотачивается около генеральной средней. Около 68,3% численности выборочных средних не будет выходить за пределы <img width=«28» height=«17» src=«ref-2_1324840223-106.coolpic» v:shapes="_x0000_i1163"> генеральной средней; 95,4% этой численности будет заключено в пределах <img width=«36» height=«19» src=«ref-2_1324840329-120.coolpic» v:shapes="_x0000_i1164"> и 99,7% их не выйдет за пределы <img width=«36» height=«19» src=«ref-2_1324840449-119.coolpic» v:shapes="_x0000_i1165">. Нормальное распределение имеет довольно общий характер и показывает частоту появления ошибок данного размера средней.

2.    
Определение ошибок выборочного наблюдения при различных видах выборки


Расхождение между выборочной средней и генеральной средней
.Теорема Чебышева-Ляпунова
.
Расхождения между выборочными и генеральными характеристиками называют ошибками.

Теорема Чебышева применительно к выборочному наблюдению утверждает, что ошибка репрезентативности – разность между выборочной средней и генеральной средней – при достаточно большом числе наблюдений будет сколь угодно малой, т.е. <img width=«145» height=«41» src=«ref-2_1324840568-362.coolpic» v:shapes="_x0000_i1166">,

где <img width=«47» height=«29» src=«ref-2_1324840930-155.coolpic» v:shapes="_x0000_i1167">  — абсолютная величина расхождения между генеральной средней и выборочной средней, составляющая ошибку репрезентативности;

<img width=«16» height=«17» src=«ref-2_1324841085-92.coolpic» alt="*" v:shapes="_x0000_i1168">  — среднее квадратическое отклонение вариантов выборочной средней от генеральной средней (средняя ошибка выборки). Оно зависит от колеблемости признака в генеральной совокупности <img width=«16» height=«15» src=«ref-2_1324841177-89.coolpic» v:shapes="_x0000_i1169"> и числа отобранных единиц n: <img width=«56» height=«44» src=«ref-2_1324841266-184.coolpic» v:shapes="_x0000_i1170">. Эта запись показывает, что о величине расхождения можно судить лишь с определенной вероятностью, которая зависит от коэффициента доверия t. Если выбратьt=2, то вероятность того, что это расхождение не превысит <img width=«24» height=«21» src=«ref-2_1324841450-108.coolpic» v:shapes="_x0000_i1171">, будет не меньше чем 0,75, если  t=3, то вероятность превысит 0,89 и т.д.

Теорема была доказана П.Л. Чебышевым только для независимых событий, т.е. производстве повторной выборки. Позднее академиком А.А. Марковым было доказано сохранение этого условия для зависимых событий (бесповторной выборки).

Академик А.М. Ляпунов доказал, что вероятность отклонений выборочной средней от генеральной средней при достаточно большом числе отобранных единиц подчиняется закону нормального распределения. Из теоремы Ляпунова следует, что вероятность этих отклонений при разных значениях tможет определяться по формуле: <img width=«147» height=«54» src=«ref-2_1324841558-520.coolpic» v:shapes="_x0000_i1172">

Значения этого интеграла при разных значениях tтабулированы и даются в специальных таблицах. Вероятность для некоторых t(из таблицы):

при t=1 F(t)=0,683, при t=1,5 F(t)=0,866,

при t=2 F(t)=0,954, при t=2,5 F(t)=0,988,

при t=3 F(t)=0,997, при t=3,5 F(t)=0,999.

Доверительное число tуказывает, что расхождение не превысит кратную ему среднюю ошибку выборки <img width=«16» height=«17» src=«ref-2_1324841085-92.coolpic» v:shapes="_x0000_i1173">. Если  t=1, то расхождение между выборочной средней и генеральной средней не превысит <img width=«21» height=«21» src=«ref-2_1324842170-104.coolpic» v:shapes="_x0000_i1174">. Это может быть прочитано и так: с вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средними не превысит одной величины средней ошибки выборки. Другими словами, в 683 случаях из 1000 ошибка репрезентативности не выйдет за пределы <img width=«33» height=«21» src=«ref-2_1324842274-122.coolpic» v:shapes="_x0000_i1175">. С вероятностью 0,997 (довольно близкой к единице) можно ожидать, что разность между выборочной и генеральной средними не превзойдет трехкратной средней ошибки выборки.

Средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Величина <img width=«20» height=«19» src=«ref-2_1324842396-101.coolpic» v:shapes="_x0000_i1176">, обозначаемая <img width=«15» height=«17» src=«ref-2_1324842497-91.coolpic» v:shapes="_x0000_i1177">, называется предельной ошибкой выборки, которая определяется формулой <img width=«53» height=«25» src=«ref-2_1324842588-274.coolpic» v:shapes="_x0000_i1178">. С увеличением tувеличивается вероятность и величина ошибки.

Предельная ошибка выборкипозволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности и их доверительные интервалы:  <img width=«142» height=«24» src=«ref-2_1324842862-503.coolpic» v:shapes="_x0000_i1179">           

Генеральная  средняя (<img width=«15» height=«17» src=«ref-2_1324843365-88.coolpic» v:shapes="_x0000_i1180">) отличается от выборочной средней (<img width=«15» height=«19» src=«ref-2_1324843453-90.coolpic» v:shapes="_x0000_i1181">) на   величину предельной ошибки выборки:  <img width=«120» height=«23» src=«ref-2_1324843543-335.coolpic» v:shapes="_x0000_i1182">

 Это означает: с заданной вероятностью можно утверждать, что значение генеральной средней можно ожидать в пределаxот <img width=«58» height=«27» src=«ref-2_1324843878-277.coolpic» v:shapes="_x0000_i1183"> до <img width=«60» height=«28» src=«ref-2_1324844155-291.coolpic» v:shapes="_x0000_i1184">, то есть что доверительные интервал (<img width=«96» height=«26» src=«ref-2_1324844446-358.coolpic» v:shapes="_x0000_i1185">) с заданной вероятностью заключает в себе генеральную среднюю.

Расхождение между частостью и долей. Теорема Бернулли рассматривает ошибку выборки для альтернативного признака, т.е. признака, у которого возможны только два исхода: наличие признака (1) и его отсутствие (0). Т.е. при достаточно большом объеме выборки по мере его увеличения вероятность расхождения между долей признака в выборочной совокупности wи долей признака в генеральной совокупности pбудет стремиться к единице. Математически теорема Бернулли выглядит следующим образом: <img width=«124» height=«27» src=«ref-2_1324844804-290.coolpic» v:shapes="_x0000_i1186">

Иными словами: с вероятностью, сколько угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки частость признака (выборочная доля) сколько угодно мало отличается от его вероятности (доли в генеральной совокупности).

Поскольку <img width=«56» height=«44» src=«ref-2_1324841266-184.coolpic» v:shapes="_x0000_i1187">, а среднее квадратическое отклонение в генеральной совокупности для альтернативного признака равно <img width=«36» height=«27» src=«ref-2_1324845278-144.coolpic» v:shapes="_x0000_i1188">, где q=1–p, то средняя ошибка выборки для альтернативного признака выражается следующей формулой: <img width=«67» height=«47» src=«ref-2_1324845422-236.coolpic» v:shapes="_x0000_i1189">

Поскольку дисперсия доли признака генеральной совокупности (pq) неизвестна, то дисперсию альтернативного признака принимают за w(1–w), тогда формула средней ошибки выборки: <img width=«100» height=«47» src=«ref-2_1324845658-305.coolpic» v:shapes="_x0000_i1190">

Предельная величина разности между частостью и долей называется предельной ошибкой выборочной доли. О ее величине можно судить, некоторой вероятностью, определив ее по формуле: <img width=«56» height=«26» src=«ref-2_1324845963-283.coolpic» v:shapes="_x0000_i1191">.

Зная выборочную долю признака (w) и предельную ошибку выборки (<img width=«15» height=«17» src=«ref-2_1324842497-91.coolpic» v:shapes="_x0000_i1192">), можно определить границы, в которых заключена генеральная доля p:

<img width=«135» height=«24» src=«ref-2_1324846337-248.coolpic» v:shapes="_x0000_i1193">.

Средняя ошибка случайной выборки: а) повторный отбор  <img width=«116» height=«54» src=«ref-2_1324846585-340.coolpic» v:shapes="_x0000_i1194"> 

б) бесповторный отбор  <img width=«136» height=«55» src=«ref-2_1324846925-431.coolpic» v:shapes="_x0000_i1195">


где N– число единиц в генеральной совокупности

     n–число единиц в выборочной совокупности

При механическом отборе ошибка выборки рассматривается по формуле собственно-случайной бесповторного отбора.

Средняя ошибкапропорциональнойтипической выборки определяется по формулам:

а) повторный отбор: <img width=«69» height=«55» src=«ref-2_1324847356-258.coolpic» v:shapes="_x0000_i1196">; б) бесповторный отбор:  <img width=«132» height=«58» src=«ref-2_1324847614-437.coolpic» v:shapes="_x0000_i1197">,

где  <img width=«23» height=«25» src=«ref-2_1324848051-108.coolpic» v:shapes="_x0000_i1198">  — средняя из внутригрупповых дисперсий в выборочной совокупности.

Средняя ошибка серийной выборки:

а) повторный отбор: <img width=«83» height=«66» src=«ref-2_1324848159-458.coolpic» v:shapes="_x0000_i1199">;   б) бесповторный отбор: <img width=«142» height=«62» src=«ref-2_1324848617-491.coolpic» v:shapes="_x0000_i1200">,

гдеR–общее число серий в генеральной совокупности

     <img width=«12» height=«13» src=«ref-2_1324849108-82.coolpic» v:shapes="_x0000_i1201">  — число отобранных серий;

Межсерийная дисперсия вычисляется по формуле: <img width=«133» height=«53» src=«ref-2_1324849190-521.coolpic» v:shapes="_x0000_i1202">

<img width=«19» height=«17» src=«ref-2_1324849711-94.coolpic» v:shapes="_x0000_i1203"> — групповые дисперсии,   <img width=«15» height=«17» src=«ref-2_1324843365-88.coolpic» v:shapes="_x0000_i1204"> — общая средняя

3. Методы и способы отбора

Систему организации отбора единиц из генеральной совокупности называют способом отбора.

Различают методы отбора: повторный и бесповторный.

Повторным называется такой метод отбора, при котором отобранная однажды единица возвращается обратно в генеральную совокупность и снова участвует в выборке. При повторном отборе сохраняется постоянной вероятность попасть в выборку для всех единиц отбора.

Бесповторнымназывается такой метод отбора, при котором отобранная однажды единица в совокупность, из которых производится отбор, обратно не возвращается. При отборе каждой новой единицы вероятность попасть в выборку изменяется (увеличивается).

По  виду отбора различают: 1) индивидуальный – отбор единиц совокупности; 2) групповой – отбор групп единиц; 3) комбинированный – комбинация первого и второго видов.

Различные виды отбора могут осуществляться разными способами проведения выборки. По способуотбора различают следующие виды выборочного наблюдения:случайная выборка, механическая выборка, типическая выборка, серийная выборка, комбинированная выборка.

При собственно-случайной выборкегенеральную совокупность строго подразделяют на единицы отбора, а затем в случайном повторном  или бесповторном порядке отбирается достаточное число единиц (случайный порядок – порядок равносильный жеребьевке).

Механическая выборка заключается в отборе единиц из генеральной совокупности, производимом в каком-либо механическом порядке, например в отборе каждой пятой, десятой, пятнадцатой и т.д. единицы, при определенном расположении единиц в генеральной совокупности.

Под типической выборкой понимается такая выборка, когда перед ее проведением генеральная совокупность делится на группы по какому-либо типическому признаку (на типические группы), а затем внутри каждой группы производится случайная выборка. Из всех типических групп можно отбирать число единиц, пропорциональное их численностям и непропорциональное. В зависимости от этого различают пропорциональный и непропорциональный типический отбор. Типическая выборка может быть также повторной и бесповторной.

Сущность серийной выборки заключается в том, что вместо случайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд). Внутри отобранных серий производится сплошное наблюдение.

Серийная выборка может проводиться в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими.
    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по маркетингу