Реферат: Статистика
Предмет и метод статистической науки.
1. Предмет статистики. Актуальность иместо этой науки в современных условиях.
2. Основные категории статистики.
3. Метод статистики.
4. Задачи статистической науки.
1. Предмет статистики.Актуальность и место этой науки в современных условиях.
Статистика как наука сформировалась в результатеслияния двух самостоятельных направлений: немецкого описательногогосударствоведения и английской политической арифметики. С немецкой стороны основатели: Шлецер, Ахенваль и с английской стороны В. Петти (17-18 века).
Значительный вклад в развитие статистики внес Адольф Кетле (первая половина 19 века). Он соединил в одно две ветви. Во второйполовине 19 века — земские статисты.
Начало 20 века – активное внедрение математики встатистику.
Статистикакак наука изучает количественную сторону массовых социально-экономическихявлений в неразрывной связи с их качеством.
Существуют два вида количественных закономерностей:
— Динамические закономерности – характеризуют однозначнуюзависимость между причиной и следствием (характерно для естественных наук);
— Статистические закономерности – характеризуют неоднозначные зависимости междупричиной и следствием. Они проявляются только как тенденция в массовыхявлениях.
Статистика как наука неразрывно связана с другимиобщественными науками (экономической теорией, финансами и кредитом, экономикойпредприятий и т.д.). Она заимствует у этих наук основные экономическиекатегории и опирается на фундаментальные законы этих наук. Со своей стороныстатистика предлагает этим наукам целую систему статистических методов иобеспечивает их результатами анализов количественных закономерностей.
Статистика тесно связана с математическойстатистикой и теорией вероятности, так как сердцевину статистическойметодологии составляют методы математической статистики.
2. Основные категории статистики.
К числу основных категорий в статистике относятся:
— Признак;
— Статистическая совокупность;
— Единица совокупности;
— Вариация и др.
Признак –это свойство, характерная черта явления, подлежащая статистическому изучению.Признаки классифицируются:
— Качественные (атрибутивные);
— Количественные.
Качественные признаки – выражают существенное неотъемлемое свойствопредмета. Противоположные качественным признаки называют альтернативными(например, мужчина – женщина).
Любойкачественный признак можно свести к альтернативному (например, студентобучающийся на «отлично» – студент не обучающийся на «отлично»).
Признаки, отдельные значения которых различаются повеличине, называются количественными (например, возраст, рост, вес).
Признаки,исходя из их значения для характеристики изучаемого явления делятся насущественные и несущественные. Деление это условное и определяется цельюисследования.
Статистическая совокупность – это множествоявлений, имеющих один или несколько общих признаков и отличающихся между собойпо значениям других признаков.
Каждое отдельное явление, подлежащее статистическомуизучению, называется единицей совокупности.
Объективность результатов статистического анализазависит от степени однородности статистической совокупности. Качественно иколичественно однородной считается совокупность, единицы которой имеют общиекачественные признаки и близкие по значениям количественные (существенные)признаки.
3. Метод статистики.
В основе статистической методологии лежитдиалектический метод.
Диалектикарассматривает явления во взаимосвязи и во взаимозависимости, в динамике, обнаруживает причинно-следственные связи, выделяет главное и второстепенное.Принципы, категории и законы диалектики нашли отражение в конкретныхстатистических методах.
Статистическим преломлением закона переходаколичественных изменений в качественные является закон больших чисел,который лежит в основе статистической методологии. Он гласит, что статистическаязакономерность может проявляться с достаточной очевидностью только при массовомстатистическом наблюдении, а полученные выводы тем более надежны, чеммногочисленней объект исследования.
Доказано, что индивидуальные случайные отклонения отнекоторого закономерного для данной совокупности процесса или уровня явленияпри достаточно большом числе единиц совокупности взаимопогашаются. В результатеобнаруживаются причинно-следственные связи или измеряется типичный уровеньявлений.
4. Задачи статистической науки.
Задачи статистики можно условно разделить на двегруппы:
— Постоянные (долговременные);
— Актуальные.
Постоянные задачи:
1) Обеспечить органы управлениягосударством, регионами, отраслями и отдельными предприятиями своевременнойполной и достоверной информацией, необходимой для принятия решения;
2) Информировать общественность оявлениях и процессах, происходящих в обществе.
Актуальныезадачи формируются исходя из потребности общества и экономики насовременном этапе:
Получение объективной информации о деятельностихозяйственных структур с учетом теневого сектора;
Создание автоматизированных баз данных о деятельноститекущих хозяйственных структур с возможностью санкционированного доступа к нимдля получения информации, необходимой для решения текущих хозяйственных задач;
Прогнозирование развития важныхсоциально-экономических процессов и явлений;
Распространение выборочных обследований во всехсекторах общественной и экономической жизни;
Проведение организационно-методологической работы попостепенному переходу на систему национальных счетов.
Организация статистики (как области практическойдеятельности).
Принципы:
1. Это единая система организациистатистики в стране. Это единая система показателей, единая методология ихрасчета, единая форма отчетности, единые сроки и формы их представления.
2. Соответствие статистическихорганов государственному устройству и административному территориальномуделению страны (то есть Россия, Есть Госкомстат).
3. Увязка в единую системупоказателей и форм бухгалтерской и статистической отчетности.
Есть статистическая комиссия ООН, котораяосуществляет разработку международной статистической методологии и системсопоставимых статистических показателей, осуществляет методическую иконсультативную деятельность (помощь) органам ООН по вопросам сбора и обработкиинформации.
Исполнительный орган – статистическое бюросекретариата ООН.
Международный статистический институт – общественнаяорганизация, членами которой являются национально-статистические организации инаиболее видные ученые различных стран мира, которые занимаются обобщениемнаучных исследований в различных странах мира.
Системы статистических показателей.
1. Понятие статистическогопоказателя. Сущность системы статистических показателей.
2. Классификация статистическихпоказателей.
1. Понятие статистического показателя. Сущностьсистемы статистических показателей.
Статистический показатель – это качественно определенная переменная величина,количественно характеризующая объект исследования или его свойства.Качественную определенность обеспечивает набор признаков, содержащихся в егоопределении. Количественная определенность показателя связана с признакамиместа и времени.
В процессе развития экономики показателивидоизменяются, появляются новые показатели, ликвидируются ранее действующие.
Учитывая сложный взаимосвязный характерсоциально-экономических явлений, их нельзя охарактеризовать с помощью одногоили нескольких разрозненных статистических характеристик. Необходима системавзаимоувязанных статистических показателей, представляющих собой статистическуюмодель экономики и общества.
2. Классификация статистических показателей.
Статистические показатели делятся на однородные группыпо различным признакам.
По степени охвата совокупности:
— Индивидуальные;
— Групповые;
— Общие.
В зависимости от того, каким образом статистическийпоказатель характеризует изучаемую совокупность:
— Абсолютные;
— Относительные;
— Средние.
Абсолютныехарактеризуют масштабы, объем изучаемого явления, различают:
- Натуральные;
- Денежные;
- Трудовые.
Натуральныехарактеризуют объект в натуральных единицах измерения. Для соизмеренияобъектов с различными потребительскими свойствами применяют условно натуральныеединицы измерения. Пересчет в натуральные показатели осуществляется с помощьюкоэффициентов, характеризующих отношение фактических потребительских свойствтовара к некоторому условному эталону. Иногда пересчет осуществляетсяприменительно к товарам, выпущенным в различных по объему упаковках. Системаусловно натуральных показателей преобладала в административно-команднойэкономике.
Денежные – показатели в денежном измерении.
Трудовые –показатели применяются для измерения затрат труда, производительности труда,потерь рабочего времени.
Относительные показатели – представляют соотношение двух и болеестатистических характеристик, измеряется в коэффициентах, процентах. Виды:
Относительные величины динамики (показывают изменениеявления во времени) – это частноеотделение текущего отчетного показателя на значение аналогичного показателя впрошлом:
- Базисные;
- Цепные.
Базисные вкачестве базы сравнения один и тот же уровень показателя в прошлом />.
Цепные –отношение текущего показателя и показателя предыдущего периода />.
Между цепными и базисными относительными величинамидинамики существует определенная взаимосвязь. Базисная относительнаявеличина динамики равна произведению цепных относительных величин динамики,взятых в виде коэффициентов за весь анализируемый период.
/>
Относительная величина планового задания />, где /> - планируемый уровень, /> - предплановый уровень.
Относительная величина выполнения плана />,где /> - фактический или отчетный показатель.
Произведение относительной величины выполнения планана относительную величину планового задания дает относительную величинудинамики.
/>
Относительная величина структуры показывает отношение части к целому (доля) />, где /> - часть, /> - целое.
Относительная величина координации показывает соотношение частей целого между собой />.
Относительная величина интенсивности – это соотношение двух разнородных величин />.
Чаще всего эти величины используются дляхарактеристики интенсивности производства, потребления какого-либо товара.
Статистическое наблюдение.
1. Понятие статистического наблюденияи его место в статистическом исследовании.
2. Программно-методологические иорганизационные вопросы статистического наблюдения.
3. Классификация видовстатистического наблюдения.
4. Ошибки наблюдения. Пути повышенияточности статистического наблюдения.
1. Понятие статистическогонаблюдения и его место в статистическом исследовании.
Статистическое исследование можно условно разделить на3 этапа:
1) Непосредственный сбор данных илистатистическое наблюдение.
2) Сводка и группировкастатистических данных.
3) Статистический анализ, то естьисследование статистических закономерностей, то есть обнаружение взаимосвязей,выявление тенденций развития явления во времени.
Все этапы связаны между собой. Опытный исследовательначинает сбор данных, заранее предполагая, как он их будет обобщать, и какиезакономерности могут быть выявлены в результате исследования.
Не всякий сбор данных – это статистическое наблюдение.
Статистическое наблюдение – это научно-обоснованный планомерно-организованныйи, как правило, систематический сбор данных о процессах и явлениях общественнойжизни.
Информация, полученная в ходе наблюдения должна бытьполной, достоверной и отвечающей цели исследования, то есть только то, чтонужно.
2. Программно-методологическиеи организационные вопросы статистического наблюдения.
Основные категории:
1. Объект наблюдения – статистическая совокупность, о которой должны бытьсобраны интересующие исследователя данные.
2. Единица статистическогонаблюдения – это составной элементобъекта наблюдения, который подвергается исследованию. Каждая единица должнаобладать набором признаков, которые регистрируются в процессе наблюдения.
3. Программа статистическогонаблюдения – перечень признаковподлежащих регистрации. Программа должна включать наиболее существенныепризнаки исходя из цели исследования и качественных особенностей объектанаблюдения. Программа должна быть предельно лаконична, так как включениекаждого дополнительного признака увеличивает затраты на сбор и обработкуинформации прямо пропорционально числу единиц наблюдения. Для оставленияпрограммы необходимо хорошо знать специфику объекта наблюдения. Составляяпрограмму необходимо одновременно продумать план обработки информации, готовитьмакеты сводок и статистических таблиц.
4. Для регистрации собранных данныхиспользуетсяформуляр – специально подготовленный бланк, имеющий обычнотитульную, адресную и содержательную части. В титульной части содержитсянаименование обследования, организация, проводящая обследование, и кем и когдаутвержден формуляр. Адресная часть содержит наименование, местонахождениеобъекта исследования и др. реквизиты, позволяющие его идентифицировать. Взависимости от построения содержательной части различают два вида формуляра:
— Бланк-карточка, который составляется на каждую единицунаблюдения;
— Бланк-список, который составляется на группу единицнаблюдения.
У каждого из формуляров есть свои достоинства инедостатки.
Бланк-карточкаудобен для ручной обработки, но связан с дополнительными затратами в оформлениититульной и адресной книги.
Бланк-списокприменяется для автоматической обработки и экономий затрат на подготовкутитульной и адресной частей.
Для сокращения затрат на сводку и ввод данныхцелесообразно использовать машины, читающие формуляры. Вопросы содержательнойчасти формуляра должны быть сформулированы таким образом, чтобы на них можнобыло получить однозначные, объективные ответы. Лучший вопрос это тот, накоторый можно ответить «Да» или «Нет». Нельзя включать в формуляр вопросы, накоторые трудно или нежелательно отвечать. Нельзя соединять в одной формулировкедва разных вопроса. Для оказания помощи опрашиваемых в правильном пониманиипрограммы и отдельных вопросов составляются инструкции. Они могут бытькак на бланке формуляра, так и в виде отдельной книги.
Чтобы направить ответы респондента в правильное руслоприменяются статистические подсказы, то есть готовые варианты ответов.Они бывают полные и неполные. Неполные дают респонденту возможность дляимпровизации.
5. Время наблюдения – продолжительность календарного периода, за которыйсобираются данные об объекте, а так же сезон непосредственного проведениянаблюдения.
6. Период проведения наблюдения(регистрации) – времянепосредственного сбора данных. Период наблюдения прямо пропорционаленсложности объекта наблюдения, динамичности его наблюдения, численности объектаисследования и обширности программы наблюдения.
7. Критический момент – момент времени, по состоянию на которыйрегистрируются данные. Устанавливается при исследовании динамично изменяющегосяобъекта.
8. Для успешного проведения массовогостатистического наблюдения составляется организационный план наблюдения.В нем указываются органы наблюдения, время, период и критический моментнаблюдения, а так же мероприятия по подготовке и обучению кадров, подготовкебланков формуляров и инструкции, мероприятий по сбору и обработке информации ипредставлению итогов исследования. Все мероприятия расписаны по срокам суказанием исполнителей, ответственных за мероприятия.
3. Классификация видовстатистического наблюдения.
Любое наблюдение, в конечном счете, осуществляется водной из двух основных формах:
— Статистической отчетности;
— Специально организованное наблюдение.
В условиях административно-командной системы основнойформой была отчетность.
Отчетность –система сбора предприятиями, учреждениями и организациями сведений о своейдеятельности и обязательно представление их статистическим органами иливышестоящей организации в установленные сроки в виде отчетов, выполненных поутвержденной форме.
Источником информации для отчетности служат данныепервичного и бухгалтерского учета. Первичный учет – регистрация фактовпо мере их возникновения.
Различают отчетность:
- Общегосударственная отчетность собирается органами общегосударственной статистики повсем хозяйственным структурам не зависимо от формы их собственности иотраслевой принадлежности;
- Ведомственная отчетность собирается для нужд управления в рамках министерствили других многофилиальных организаций.
Так же различают:
- Общая отчетность содержит показатели, характерные для всех хозяйственных структурнезависимо от их отраслевой или ведомственной принадлежности;
- Специализированная отчетность содержит показатели типичные для конкретной отраслиили вида деятельности.
По времени наблюдения различают:
- Годовая отчетность содержит данные за год;
- Текущая отчетность – квартальная, полугодовая, месячная и т.д.
Для рыночной экономики основной источник информацииэто специально организованное наблюдение.
По времени проведения различают:
· Текущее наблюдение;
· Непрерывное наблюдение ведется за состоянием и движением населения, задеятельностью предприятий;
· Прерывное наблюдение может быть:
~ Периодическое наблюдение проводится через относительно равные промежуткивремени, повторяющееся;
~ Единовременное наблюдение – по мере необходимости.
По степени охвата совокупности бывает:
· Сплошное наблюдение – охватывает всю совокупность (генеральнуюсовокупность);
· Несплошное наблюдение – исследование части совокупности, но с обязательнымраспространением результатов на всю совокупность, может быть:
~ Выборочный метод – наиболее разработанный и распространенный метод,при котором отбор из генеральной совокупности осуществляется таким образом,чтобы у каждой единицы были равные шансы попасть в выборку;
~ Метод основного массива – это выбор для исследования наиболее представленнойчасти генеральной совокупности;
~ Монографическое наблюдение – это выбор и детальное исследование наиболеетипичной единицы наблюдения.
Данные исследования могут быть получены путем:
· Непосредственного наблюдения – данные регистрируются непосредственнымнаблюдателем на месте их возникновения;
· Документальное наблюдение – источником являются документы;
· Опрос – наблюдение, при котором регистрируются устные иписьменные ответы респондента.
По способу организации различают:
· Экспедиционный способнаблюдения, это непосредственноенаблюдение, осуществляемое специалистами или специально обученными лицами,наиболее дорогой и трудоемкий способ;
· Самоисчисление или саморегистрация – данные заполняютсяреспондентом, а специалист его консультирует и осуществляет последующийконтроль;
· Анкетный способ – предполагает самостоятельное заполнениереспондентами распространенных между них анкет. Наиболее неточный способ.Эффективен только тогда, когда сами респонденты заинтересованы в анкетировании;
· Корреспондентный способ – предусматривает сбор и регистрацию информации обобъекте наблюдения специально созданной сетью корреспондентов;
· Явочный способ – способ, при котором опрашиваемый сообщаетинформацию, явившись в органы ее регистрации.
4. Ошибки наблюдения. Пути повышения точностистатистического наблюдения.
Ошибки наблюдения по источникам и причинамвозникновения можно разделить на две группы:
1) Ошибки регистрации;
2) Ошибки репрезентативности.
Ошибки регистрации связаны с неправильным установлением и/или отражением фактов впроцессе наблюдения, могут быть:
· Случайные ошибки регистрации, которые возникают из-за невнимательности или усталостирегистратора или респондента;
· Систематические ошибкирегистрации, которые бывают:
~ Преднамеренные ошибки, которые возникают из-за нежелания респондента датьобъективную информацию;
~ Непреднамеренные систематические ошибки возникают из-за недостаточной квалификациирегистраторов.
Ошибки репрезентативности возникают при несплошном наблюдении из-занесоответствия составов генеральной и отобранной совокупностей, бывают:
· Случайные ошибки, которые характерны для выборочного метода иобусловлены волею случая;
· Систематические ошибки возникают из-за неправильно проведенного отбора.
Случайные ошибки поддаются расчету с помощьюспециальных методов, систематические не поддаются.
Для предотвращения ошибок применяются:
· Логический контроль – проверка логической совместимости собранных данных;
· Арифметический контроль – подсчет и проверка итогов по строкам и столбцам,проверка значений расчетных показателей.
Сводка. Группировка.
1. Понятие и назначениестатистической сводки.
2. Сущность и понятие статистическойгруппировки.
3. Определение интервалов.
4. Виды статистических группировок.
5. Понятие и виды статистическихтаблиц.
1. Понятие и назначениестатистической сводки.
Сводка – этовторой этап статистического исследования, собранные и проверенные данные должнысистематизироваться таким образом, чтобы можно было обнаружить взаимосвязимежду признаками, тенденции развития явления во времени или описать характерстатистических распределений.
Сводку понимают в узком и широком смысле. Сводка вшироком смысле касается содержательной стороны этого процесса, этораспределение собранной информации по группам и подгруппам, подбор системыпоказателей, характеризующих эти группы и подгруппы, составление макетовстатистических таблиц. Эта сторона обработки информации тесно связана соспецификой предмета исследования.
Сводка в узком смысле это технические операции пораспределению данных по группам, по распределению их по таблицам и подсчетитогов.
Сводка бывает:
— Централизованная сводка – сбор информации осуществляется на местах исобранные данные передаются в центр для обработки. Достоинства: возможностьболее глубокого анализа без потерь информации, применение мощной вычислительнойтехники и современного программного обеспечения, участиевысококвалифицированных специалистов. Недостатки: на местах не могутвоспользоваться в полной мере результатами анализа, снижается оперативностьобработки.
— Децентрализованная сводка – обработка информации на местах с передачей сводныхданных в вышестоящие организации. В этом случае часть первичной информации ианалитических возможностей утрачивается, но ускоряется процесс обработки.
В современных условиях при наличии сканирующей,вычислительной техники, программного обеспечения - техническая сторона сводкиутрачивает первостепенное значение, появляется возможность для более глубокогоанализа.
2. Сущность и понятие статистической группировки.
Группировка– объединение единиц статистической совокупности в количественные однородныегруппы в соответствии со значениями одного или нескольких признаков.
Один из наиболее распространенных и древнихстатистических методов (применяется более 300 лет). Группировки составляются:
- Для выявления социально-экономических типов явлений;
- Для отражения структуры совокупности;
- Для обнаружения взаимосвязи социально-экономическихявлений.
Бывают:
— Группировки по количественным признакам;
— Группировки по качественным признакам.
3. Определение интервалов.
Требования при определении величины интервала:
1. Интервалы должны выбираться такимобразом, чтобы состав выделенных групп был количественно и качественнооднороден, но группы различались между собой.
2. Интервалы не должны быть слишкоммалыми, так как при этом образуется большое число малочисленных групп, покоторым нельзя обнаружить закономерности, а внутри групп не действует законбольших чисел.
3. Интервалы не должны быть слишкомбольшими, так как это приводит к образованию неоднородных групп, искажениюистинного характера, распределения и взаимосвязи.
4. Считается, что величина интервалови число выделяемых групп зависят от численности статистической совокупности ивариаций изучаемого признака, чем больше численность и выше колеблемостьисходных данных, тем больше групп мы должны и можем выделить.
Группировка осуществляется поэтапно. Вначалеопределяется примерное число групп, затем величина интервала. Строится 1йвариант группировки, потом при необходимости уточняется. Для определения числагрупп может применяться формула Стерджесса:
/>,где N — численность совокупности, r – число групп.
Величина интервала определяется по формуле: />, где xmax, xmin –соответствующие максимальное и минимальное значения признаков совокупности, с– величина интервала. Полученный результат округляется.
Равные интервалы группировки применяются дляоднородных совокупностей, а для социально-экономических явлений чащеприменяются неравноинтервальные группировки.
Если крайнее значение единиц совокупности значительноотличается по величине от остальных, применяются группировки с открытымиграницами интервалов.
Пример:Группировка по уровню среднемесячного дохода на одного члена семьи.
Среднедушевой доход, руб. Число семей, в % к итогу До 700 25,0 701-1500 19,1 1501-500 50,7 Свыше 5000 5,2 Итого 100
Первый интервал с открытой нижней границей, последнийинтервал с открытой верхней границей. Величина первого интервала принимаетсяравной величине следующего за ним интервала (не более чем). Величина последнегоинтервала с открытой верхней границей принимается равной величинепредпоследнего интервала.
4. Виды статистических группировок.
В соответствии с задачами группировки подразделяютсяна:
— Типологические группировки служат для выявления социально-экономических типовявлений.
— Структурные группировки предназначены для выявления структуры совокупности,то есть соотношение между частями целого.
Пример:Группировка рабочих цеха по профессии.
ПрофессияЧисленность
в % к итогу
Токари 35 Фрезеровщики 10 Слесари 40 Прочие 15 Итого 100— Аналитические группировки позволяют установить, в какой мере изменение значенийодного из признаков (признак-фактор), влияя на вариацию другого(результативного) признака.
Пример:Аналитическая группировка магазинов по величине торговой площади.
Группа магазинов
с торговой площадью, кв. м
Число
магазинов
Средний уровень
издержек, в % к
товарообороту
До 200 12 28,7 От 200 до 400 23 24,5 От 400 до 600 17 21,3 Свыше 600 15 18,7Группировка показывает обратную связь между торговойплощадью и издержками магазина в расчете на 100 руб. товарооборота.
— Комбинационные группировки применяются в тех случаях, когда для выявлениясоциально-экономического типа недостаточно одного признака. Комбинационныегруппировки строятся по иерархической системе, когда группы, выделенные поодному признаку, делятся на подгруппы по значениям других признаков.
Пример:Группировка промышленных предприятий по стоимости основных фондов исреднесписочной численности работников.
Группы предприятий
по стоимости
основных фондов,
тыс. руб.
В том числе с
численностью
рабочих, чел.
Число
предприятий
До 500 До 50 7 51-100 4 101-500 2 501-1000 - Свыше 1000 - 501-1000 До 50 1 51-100 3 101-500 4 501-1000 4 Свыше 1000 -Построение комбинационной группировки требуетмногочисленной совокупности, в противном случае при образовании большого числагрупп появляются малочисленные и пустые интервалы.
Недостаток комбинационной группировки: устраняетмногомерные группировки, появившиеся в 60-70 годах прошлого века.
— Многомерные группировки предназначены для выделения групп однородных посовокупности признаков.
Для решения этой задачи применяются различныематематические алгоритма, общая идея которых заключается в разбиении исходногомножества на непересекающиеся подмножества (кластеры, таксоны), элементы,которые либо подобны друг другу, либо наименее удалены друг от друга в N-мерномпространстве признаков.
5. Понятие и виды статистических таблиц.
Статистическая таблица – наиболее рациональная и распространенная формапредставления статистических данных. Существует примерно 300 лет.
Любая статистическая таблица состоит из ряда элементов.
Пересечение строк и столбцов называется скелетомтаблицы. Если включить в скелет таблицы заголовки граф и строк, получим макеттаблицы, который отражает основную цель ее построения. Макеты таблицобязательно составляются на этапе подготовки программы статистической сводки,для уточнения программ и схемы обработки собранной информации. По аналогии сграмматикой, содержание таблицы делится на подлежащее и сказуемое.Подлежащим таблицы считается объект исследования,сказуемым –перечень признаков, характеризующих объект исследования.
В зависимости от характера разработки подлежащеготаблицы делятся на:
— Простые таблицы;
— Групповые таблицы;
— Комбинационные таблицы.
В подлежащем простых таблиц содержатся либоперечень единиц наблюдений, либо показатели времени, либо отдельные территории.В зависимости от этого различают:
— Перечневыепростые таблицы;
— Хронологическиепростые таблицы;
— Территориальныепростые таблицы.
Подлежащее групповых таблиц содержитгруппировку по одному признаку, а комбинационных по несколькимпризнакам.
Сказуемоетаблица может быть:
— Простым –содержит перечень признаков, характеризующих подлежащее;
— Комбинированным– содержит группировку признаков, характеризующих подлежащее.
При составлении таблиц рекомендуется соблюдать рядобщепринятых требований:
1. Таблица не должна быть слишкомгромоздкой, перенасыщенной показателями, лучше построить 2-3 простых таблиц;
2. Общий заголовок таблицы долженлаконично отображать ее содержание, определять место и время, к которомуотносятся статистические данные;
3. Территориальные единицы вподлежащем даются в алфавитном порядке, а даты в хронологическом порядке;
4. Кратко формулируются заголовкиграф и строк, и в них указываются единицы измерения. Общая единица измеренияуказывается в общем заголовке;
5. Все показатели таблицы даются с одинаковойточностью, если значение показателя не имеет смысла ставится «х», еслиотсутствует «-», если данные не известны «….», если величина очень мала «0,0…»;
6. Таблицы могут сопровождатьсяпримечаниями со ссылками на источники информации и методы расчета данных.
Ряды распределения.
1. Понятие и виды рядовраспределения.
2. Частотные характеристики рядовраспределения.
3. Графическое изображение рядовраспределения.
1. Понятие и виды рядов распределения.
Ряд распределения – упорядоченная совокупность значений признака.
Бывают ряды распределения:
— Качественных признаков (атрибутивные рядыраспределения);
— Количественных признаков (вариационные рядыраспределения).
Любой ряд состоит из 2 видов элементов:
- Вариантов ряда (значенияпризнака);
- Его частотной характеристики.
Атрибутивные ряды характеризуют распределениекачественных признаков, например распределение рабочих по полу, профессии,образованию.
Вариационные ряды обычно упорядочиваются всоответствии с увеличением значений количественного признака.
Они бывают дискретные и интервальные. Варианты дискретногоряда – это дискретно прерывно изменяющиеся значения признак, обычно эторезультат подсчета.
Пример:Распределение мужских костюмов, реализованных магазинами за месяц по размерам.
Размер
костюма
Число проданных
костюмов, шт.
44 12 46 31 48 127 50 215 52 164 54 91 56 47 58 28 60 11 Итого 726Интервальные ряды предназначены для анализа распределения непрерывно изменяющегосяпризнака, значение которого чаще всего регистрируется путем измерения иливзвешивания. Варианты такого ряда – это группировка.
Пример:Распределение покупок в продуктовом магазине по сумме.
Сумма покупки, руб. Число покупок До 50 37 50,1-100 78 100,1-150 111 150,1-200 105 200,1-250 68 Свыше 250 49 Итого 448Если в атрибутивных и дискретных вариационных рядахчастотная характеристика относится непосредственно к варианту ряда, то винтервальных к группе вариантов.
Поскольку в расчетах группа должна быть представленаобычно одним вариантом, в качестве этого варианта условно выбирается серединакаждого интервала.
Такой подход возможен исходя из гипотезы о равномерномраспределении вариантов внутри каждого интервала.
Интервальный ряд, таким образом, преобразуется вдискретный, варианты которого – это середины соответствующих интервалов.Середины закрытых интервалов определяются как полусумма нижней и верхнейграницы интервала.
Середина первого интервала с открытой нижней границейопределяется по формуле />, где xВ1 – верхняя граница первого интервала, c2 – второй интервал.
Середина последнего интервала определяется по формуле />, где xнn – нижняяграница n-го интервала, сn-1 – предыдущий интервал (предпоследний).
2. Частотные характеристики рядов распределения.
Различают абсолютные и относительные частотныехарактеристики.
Абсолютная характеристика – частота,показывает, сколько раз встречается в совокупности данный вариант ряда.Достоинство частоты – простота, недостаток – невозможность сравнительногоанализа рядов распределения разной численности.
Для подобных сравнений применяют относительные частотыили частости, которые рассчитываются по формуле:
/>,где N – численностьсовокупности.
Это относительная величина структуры (по форме).
Сумма частостей равна 1.
/>
Если частости выражены в процентах или в промилях ихсуммы равны соответственно 100 или 1000.
В неравных интервальных рядах распределения частотныехарактеристики зависят не только от распределения вариантов ряда, но и отвеличины интервала при прочих равных условиях расширение границ интервалаприводит к увеличению наполненности групп.
Для анализа рядов распределения с неравнымиинтервалами используют показатели плотности:
Абсолютная плотность: />, где fi – частота, ci — величина интервала – показывает, сколько единиц всовокупности приходится на единицу величины соответствующего интервала.Абсолютная плотность позволяет сопоставлять между собой насыщенность различныхпо величине интервалов ряда. Абсолютные плотности не позволяют, однако,сравнивать ряды распределения разной численности.
Для подобных сравнений применяются относительныеплотности: />, где di – частости(доли), ci — величины соответствующих интервалов – показывает,какая часть (доля) совокупности приходится на единицу величины соответствующегоинтервала.
3. Графическое изображение рядов распределения.
Графическое изображение рядов распределения даетнаглядное представление о закономерностях распределения.
Дискретный ряд изображается на графике в виде ломанойлинии – полигона распределения.
/>
Интервальные ряды изображаются в виде гистограммраспределения (то есть столбиков диаграмм) при этом основанием каждогопрямоугольника служит величина соответствующего интервала, а высотой егочастотная характеристика.
/>
Любая гистограмма может быть преобразована в полигонраспределений, для этого необходимо соединить между собой отрезками прямойвершины ее прямоугольников.
При графическом изображении рядов с неравнымиинтервалами по оси ординат откладываются абсолютные или относительныеплотности.
Поскольку />, то /> и площадь каждогопрямоугольника такой гистограммы равна частоте соответствующего интервала, аобщая площадь гистограммы равна численности совокупности.
/>
Если на графике откладываются относительные плотности />, то />, то площадь каждогопрямоугольника равна частости соответствующего интервала, а общая площадьгистограммы равна 1.
При равноинтервальной группировке графикираспределений составленные по частотам, частостям и плотностям, подобны другдругу.
Графики распределений с неравными интерваламиразличаются в зависимости от того, по какой частотной характеристике онистроятся.
Для характеристики рядов распределения применяют также графики накопленных частот или куммуляты.
Пример:Распределение хозяйств по урожайности зерновых.
Урожайность,
га
Число хозяйств,
/>
Накопленная
частота,
/>
До 6 2 2 6-10 8 10 (2+8) 10-14 17 27 (10+17) 14-18 12 39 (12+27) 18-22 6 45 (6+39) Свыше 22 2 47 (25+2) Итого 47Накопленная частота – это сумма частот данного и всех предшествующих интервалов.
Куммулятапозволяет определить, какая часть совокупности обладает значениями изучаемогопризнака не превышающими заданного предела, а какая часть – наоборот –превышает этот предел.
/>
Средние величины.
1. Понятие средней величины.
2. Средняя арифметическая величина иее расчет прямым способом.
3. Свойства средней арифметическойвеличины.
4. Практическое использование свойствсредней арифметической.
5. Степенные средние.
6. Мода и процентили.
1. Понятие средней величины.
Уровень любого показателя формируется под воздействиемсущественных закономерных для данного явления, а так случайных причин.Поскольку случайных причин множество и их действия носят стихийныйразнонаправленный характер, необходимо нивелировать (устранить) результаттакого воздействия, для того чтобы определить типичный закономерный для данныхусловий места и времени уровень показателей. Таким уровнем является средняявеличина.
Средняя –это обобщающая характеристика количественно и качественно однороднойсовокупности в определенных условиях. Среднее определяется по какому-либопризнаку. Среднее проявляется в результате действия закона больших чисел, когдав массовых совокупностях индивидуальные отклонения от типичного уровня взаимопогашаются. Среднее позволяет заменить множество значений показателейодним типичным, что значительно упрощает последующий анализ явлений.
Средняя является объективной характеристикой толькодля однородных явлений. Средние для неоднородных совокупностей называютсяогульными и могут применяться только в сочетании с частными средними однородныхсовокупностей.
Средняя применяется в статистических исследованиях дляоценки сложившегося уровня явления, для сравнения между собой несколькихсовокупностей по одному и тому же признаку, для исследования динамики развития изучаемогоявления во времени, для изучения взаимосвязей явлений.
Средние широко применяются в различных плановых,прогнозных, финансовых расчетах.
2. Средняя арифметическая величина и ее расчет прямымспособом.
Средняя арифметическая – наиболее распространенный на практике вид средних.Различают 2 вида арифметических средних:
— Невзвешенную (простую);
— Взвешенную.
Средняя арифметическая невзвешенная рассчитывается для несгруппированных данных поформуле: />, где /> -сумма вариантов, N – их число – применяется обычно для совокупностейчисленностью N/>15.
Для массовых статистических совокупностейрассчитывается взвешенная средняя арифметическая по формуле: />, где /> - частоты.
Пример:Расчет средней выработки рабочими токарного цеха.
Количество деталей,
изготовленных рабочим
за смену, шт.
Число рабочих,
чел., />
/>
Объем производства,
/>
До 300 3 290 870 300-320 9 310 2790 320-340 15 330 4950 340-360 12 350 4200 360-380 6 370 2220 Свыше 380 6 390 2340 Итого 51 17370/>
Из таблицы:
1. Средняя величина всегда тяготеет квариантам с наибольшими частотами.
2. Средняя величина может несовпадать ни с одним из вариантов дискретного ряда.
3. Средняя величина находится внутриинтервала значений вариантов ряда.
Сумма /> помимочисто математического, как правило, имеет смысловое значение, наличиесмыслового значения – один из способов проверки правильности выбора средней.
Даже если варианты ряда представлены целыми числами,среднее может быть смешанным числом, иногда такой результат логическинеправомерен. В этом случае его надо округлять, переводить в проценты или впромили.
3. Свойства средней арифметической величины.
Свойства средней важны для понимания механизма расчетаэтого показателя, а так же для разработки ряда более сложных статистическихметодик.
Свойства:
1. Если из всех вариантов рядавычесть или ко всем вариантам добавить постоянное число, то средняяарифметическая соответственно уменьшится или увеличится на это число. />.
2. Если все варианты ряда умножитьили разделить на постоянное число, то средняя арифметическая соответственно увеличитсяили уменьшится в это число раз. />.
3. Если все частоты увеличить илиуменьшить в постоянное число раз, то средняя от этого не изменится. />.
4. Сумма отклонений всех вариантовряда от средней арифметической равна 0. (Нулевое свойство средней). />.
5. Общая средняя совокупности равнасредней арифметической из частных средне взвешенных по объемам частныхсовокупностей. />, где /> - средняя арифметическая частных групп, /> - численность соответствующих групп, /> - общая средняя.
6. Сумма квадратов отклонений всехвариантов ряда от средней арифметической меньше суммы квадратов их отклоненийот любого другого постоянного числа.
/>
Средний квадрат отклонений вариантов ряда отпроизвольного числа А равен дисперсии плюс квадрат разности между средней иэтим числом А.
Данное свойство положено в основу метода наименьших квадратов, который широко применяется в исследовании статистическихвзаимосвязей.
4. Практическое использование свойств среднейарифметической.
Свойства средней арифметической используются так жедля упрощения методики ее расчета. В условиях малопроизводительной вычислительной техники эта методика обеспечивала значительную экономию времении труда. В настоящее время данная методика служит наглядным образцомиллюстрации свойств средней.
Упрощенная методика расчета средней арифметической
(по данным о выработке рабочих токарей).
/>
/>
/>
/>
/>
/>
290 3 -40 -2 1 -2 310 9 -20 -1 3 -3 330 15 5 350 12 20 1 4 4 370 6 40 2 2 4 390 6 60 3 2 6 51 17 9Данный метод называется так же методом расчета отусловного нуля. В качестве условного нуля выбирается произвольное постоянноечисло А. Обычно это вариант ряда с наибольшей частотой. А=330.
Рассчитываем среднюю по новым вариантам: />.
Пользуясь свойствами средней переходим от условного /> кфактической средней величине />.
5. Степенные средние.
Средняя арифметическая величина является частнымслучаем, который называется степенной средней.
/> -для несгруппированных данных;
/> -для сгруппированных данных.
Последовательно придавая k дискретноезначение 0, 1, 2, 3, … и т.д. получим различные виды средних.
Если k=-1степенные средние приобретают вид средней гармонической.
/> -для несгруппированных данных;
/> -для сгруппированных данных.
Пример:В течение рабочей смены 3 рабочих изготовляли детали. 1й рабочийзатрачивая на изготовление 1 детали – 6 мин., 2й – 8 мин., 3й– 7,5 мин. Определить средние затраты времени на изготовление 1 детали.
Среднюю арифметическую взвешенную нельзя использоватьдля расчета, так как каждый из рабочих изготавливал за смену разное количестводеталей. В числителе формулы отражается количество человеко-силы, а взнаменателе условное количество деталей, изготавливаемых за смену.
/>
Пример:Продавец в течении нескольких дней продавал на рынке морковь. В первые 4 дняцена составляла 6 руб./кг, в последние 5 дней цена поднялась до 7 руб., аоставшаяся морковь была продана за 4,50 руб./кг. Поскольку данные отоварообороте отсутствуют, то для решения задачи применяется средняягармоническая взвешенная:
/>
При этом число дней продаж моркови по различным ценамрассматривается как показатель условного товарооборота.
Средняя гармоническая применяется в тех случаях, когдачастоты ряда выражены в неявном виде.
Если величина k=0, то степенная средняя приобретает вид среднейгеометрической.
/> длянесгруппированных данных;
/> длясгруппированных данных.
Средняя геометрическая применяется в тех случаях,когда отдельные варианты ряда резко отличаются от остальных.
Наиболее часто формулу средней геометрическойиспользуют для определения средних валютных курсов, эффективности валютныхкурсов, реальной эффективности валютных курсов (международная финансоваястатистика).
Если k=1 степеннаясредняя принимает вид средней арифметической, взвешенной и невзвешенной.
Если k=2, средняяквадрата.
/> длянесгруппированных данных;
/> -для сгруппированных данных.
Результаты статистического исследования зависят оттого, насколько верно избран вид средней. Расчет средних, выполненных на основеодних и тех же данных разными способами дает различные результаты.
В курсе математической статистики доказано, что чемниже степень средней, тем меньше ее величина. Это называется правиломмажорантности средней.
k -1 1 2/>
/>
</>
</>
</>
/> /> /> /> /> /> /> />Доказано так же, что чем интенсивней колеблютсязначения вариантов ряда, тем больше разница между ними.
6. Мода и процентили.
Наряду со средними для характеристики распределенияприменяют такие показатели как мода и процентили, которые дополняютхарактеристику (обобщающую) и позволяют сравнивать между собой и находитьразличия в рядах с одинаковыми средними.
Мода – этонаиболее часто встречающийся вариант ряда.
В дискретных рядах распределения модой являетсявариант, имеющий максимальную частотную характеристику.
В интервальных рядах мода определяется в два этапа. Вначале определяется интервал, содержащий моду (модальный интервал), азатем рассчитывается значение моды по формуле:
/>,где /> -нижняя граница модального интервала, i – величина этого интервала, />, />, /> -частоты модального, предшествующего ему и следующего за ним интервалов.
Для последней таблицы (данные о выработке рабочихтокарей):
/>
Медиана (видпроцентиля), который занимает серединное положение в ряду распределения.Медиана определяется по формуле:
/>,где /> -нижняя граница интервала, содержащего медиану (интервал определяется понакопленной частоте, первой превышающей 50% суммы частот (в дальнейшем дляквартилей, децилей – 25%, 75%, 0,1%, 0,2% и т.д.)), i – величина этого интервала, /> -номер медианы, /> - накопленная частота интервала, предшествующегомедиане, /> - частота медианного интервала.
Поскольку медиана разновидность процентиля то даннаяформула носит универсальный характер, она может применяться для определенияквартилей (Q) и децилей (d).
Квартили (четверти)отсекают от совокупности соответственно 25%, 50% и 75%.
Децилиотсекают от совокупности соответственно 10%, 20%, 30% и т.д.
На первом этапе определяется номер процентиляпо формуле:
/> -для ряда четным числом единиц;
/> -с нечетным числом единиц.
/> -номер процентиля (порядковый), /> - индекс процентиля (выражается десятичной дробью) (/>), N – численность совокупности.
Расчет моды и процентилей
на примере группировки магазинов по сумметоварооборота.
Группы магазинов
с торговой площадью,
кв. м
Число
магазинов,
/>
Накопленная
частота,
/>
До 100 6 6 100-200 12 18 200-300 27 45 300-400 13 58 400-500 8 66 Свыше 500 5 71 Итого 71Накопленная частота – это сумма частот данного и всехпредшествующих ему интервалов.
/>
/>
Четверть всех магазинов имеет площадь менее 200 кв.метров, а остальные 75% более 200 кв. метров.
/>
Три четверти магазинов имеют торговые площади непревышающие 369,2 кв. метров, остальные больше.
/>
Показатели вариации.
1. Понятие вариации и роль ееизучения в статистических исследованиях.
2. Измерители вариации.
3. Прямой способ расчета показателейвариации.
4. Свойства дисперсии и среднегоквадратического отклонения.
5. Упрощенный способ расчетадисперсии и средне квадратического отклонения.
6. Относительные показатели вариации.
7. Стандартизация данных.
8. Моменты распределения.
9. Показатели асимметрии и эксцесса.
10. Средняя арифметическая и дисперсияальтернативного признака.
1. Понятие вариации и роль ее изучения встатистических исследованиях.
Вариация –это колеблемость значений признака у отдельных единиц совокупности.
Наличию вариации обязана своим появлением статистика.Большинство статистических закономерностей проявляется через вариацию. Изучаявариацию значений признака в сочетании с его частотными характеристиками, мыобнаруживаем закономерности распределения (например: население по возрасту,студентов по уровню оценок).
Рассматривая вариацию одного признака параллельно сизменением другого, мы обнаруживаем взаимосвязи между этими признаками или ихотсутствие (например: зависимость между торговой площадью и товарооборотом).
Вариации в статистике проявляются двояко, либо черезизменения значений признака у отдельных единиц совокупности, либо через наличиеили отсутствие изучаемого признака у отдельных единиц совокупности.
Изучение вариации в статистике имеет каксамостоятельную цель, так и является промежуточным этапом более сложныхстатистических исследований.
2. Измерители вариации.
Простейшим показателем вариации является размахколебаний: />.
Достоинство этого показателя простота расчета,возможность использования для оценки вариации однородных совокупностей.Недостаток – неприемлемость для неоднородных совокупностей с редкими выбросамикрайних значений признака.
Частично недостатки этого показателя устраняет межквартельныйразмах: />. Однако, он характеризуетвариацию только половины совокупности.
Для учета колеблемости всех значений признакаприменяют показатели среднего линейного отклонения, дисперсии и среднеквадратического отклонения.
Средне линейное отклонение – среднее значение отклонений всех вариантов ряда отсредней арифметической (иногда от моды или медианы):
/> -для несгруппированных данных;
/> -для сгруппированных данных.
/> />
Аналогичным по смыслу среднему линейному отклонениюявляется показатель дисперсии и рассчитываемый на его основе показатель среднеквадратического отклонения.
Дисперсия –рассеивание, данный показатель характеризует рассеивание значений признакаотносительно его средней величины.
/> - для несгруппированных данных;
/> -для сгруппированных данных.
Дисперсия –средне квадратическое отклонение всех вариантов ряда от средней арифметической.Если извлечь квадратный корень из дисперсии, получим средне квадратическоеотклонение.
/> -для несгруппированных данных;
/> -для сгруппированных данных.
Несмотря на логическое сходство, дисперсия являетсяболее чувствительной к вариации и, следовательно, чаще применяемый показатель.
3. Прямой способ расчета показателей вариации.
Расчет показателей вариации заработной платы работников завода.
Группы со среднемесячной з/п, руб.Число раб-в, />
/>
/>
/>
/>
/>
/>
До 1500 30 750 22500 1909,09 57272,7 3644628 109338843 1501-3000 75 2250 168750 409,09 30681,8 167355 12551653 3001-4500 45 3750 168750 1090,91 49090,9 1190083 53553719 Свыше 4501 15 5250 78750 2590,91 38863,6 6712810 100692149 Итого 165 438750 175909 276136364/>
Заработная плата каждого из работников в среднемотклоняется от средне заработной платы на 1066,12 руб.
Средне квадратическое отклонение /> заметно больше, чеманалогичный ему по смыслу среднее линейное отклонение.
4. Свойства дисперсии и среднего квадратическогоотклонения.
Так же как и средняя дисперсия обладает рядом свойств,имеющих важное значение для понимания сущности этого показателя, методологииего расчета и практического использования для разработки более совершенныхстатистических методов.
Свойства дисперсии и средне квадратическое отклонение:
1) Если все варианты ряда уменьшитьили увеличить на постоянное число, то величина дисперсии и среднеквадратического отклонения не изменится. />;
2) Если все варианты ряда умножитьили разделить на постоянное число, дисперсия соответственно увеличится илиуменьшится в квадрат этого числа раз, а средне квадратическое отклонение в эточисло раз. />;
3) Если частоты ряда уменьшить или увеличить в постоянное число раз, то дисперсия и средне квадратическоеотклонение от этого не изменится;
4) Дисперсия равна среднему квадратувариантов ряда минус квадрат средней арифметической. />;
5) Общая дисперсия равна среднейарифметической из частных дисперсий (внутригрупповых дисперсий) плюс дисперсиичастных средних (межгрупповые дисперсии). Это свойство называется правиломсложения дисперсий, которое широко применяется в выборочном методе, методеизмерений взаимосвязей явлений, а так же дисперсионном анализе.
/> - общая дисперсия;
/> - частная дисперсия;
/> - средняя из частных дисперсий, /> - численность соответствующей группы;
/> - межгрупповая дисперсия;
/>
5. Упрощенный способ расчета дисперсии и среднеквадратического отклонения.
Свойства дисперсии используются для упрощения методикиее расчета. В условиях развитой вычислительной техники данный способ имеет,прежде всего, иллюстративный характер и помогает понять сущность этогопоказателя.
Упрощенный способ расчета дисперсии и среднеквадратического отклонения (метод расчета от условного нуля).
Среднемесячная з/п работников, руб., />
/>
/>
/>
/>
/>
/>
750 30 — 1 500 -1 2 -2 2 2 250 75 5 3 750 45 1 500 1 3 3 3 5 250 15 3 000 2 1 2 4 Итого 11 3 9А=2250; k=1500; с=15
/>
6. Относительные показатели вариации.
Абсолютные измерители вариации (дисперсия, среднеквадратическое отклонение) ограниченно пригодны для сравнительного анализавариаций различных совокупностей.
Для цели сравнительного анализа применяютотносительные показатели, коэффициенты вариации. Наиболеераспространенной формой коэффициентов вариации является />, он показывает, какойпроцент от средней арифметической составляет среднее квадратическое отклонение.
Вместо средне квадратического в числителе коэффициентавариации иногда используют среднее линейное отклонение />.
Если среднее линейное отклонение определялосьотносительно медианы или моды, то соответствующие показатели вариации будутвыглядеть />, />.
Коэффициенты вариации определенные по различнымоснованиям не одинаковы, поэтому, сопоставляя вариации разных совокупностей,нужно использовать коэффициенты вариации, рассчитанные по одной и той жевеличине.
Коэффициент вариации является так же количественноймерой однородности совокупности. Принято считать, что если />, то совокупностьколичественно однородна. Чем меньше, тем лучше.
7. Стандартизация данных.
Коэффициенты вариации являются сводными оценкамивариаций различных совокупностей. Однако они не позволяют сопоставить междусобой значения признака у отдельных или групп единиц разных совокупностей.
Для подобных сравнений прибегают к стандартизациивариантов разных совокупностей по формулам:
/>,где />, /> - это стандартизированныезначения вариантов ряда x и yсоответственно. В процессе стандартизации мы переходим от измерения вариантов внатуральных или стоимостных единицах к их измерению величинами соответствующихсредне квадратических отклонений.
Пример:Стандартизация данных о доходах на одного члена семьи и среднедушевомпотреблении мяса.
Доход на
одного
члена семьи,
тыс. руб./год, />
Среднедушевое потребление
мяса, />
/>
/>
/>
/>
/>
/>
60,7 12,3 -97,5 -25,6 9 506,25 655,36 -1,28 -1,31 84,2 19,1 -74 -18,8 5 476,00 353,44 -0,97 -0,96 112,4 23,1 -45,8 -14,8 2 097,64 219,04 -0,60 -0,76 144,5 35,6 -13,7 -2,3 187,69 5,29 -0,18 -0,12 180,1 49,5 21,9 11,6 479,61 134,56 0,29 0,59 240,9 57,3 82,7 19,4 6 839,29 376,36 1,09 0,99 284,6 68,4 126,4 30,5 15 976,96 930,25 1,66 1,561107,4
265,3
40 563,44
2 674,30
/>
/>
При стандартизации сгруппированных данных наряду смасштабированием вариантов ряда величинами соответствующих среднеквадратических отклонений частоты этих рядов пересчитываются в частости.
Стандартизацию данных проводят, когда вариантысравниваемых рядов отличаются единицами измерения и порядком.
Стандартизация является важнейшим статистическимпромежуточным этапом.
Стандартизация используется так же хорошо в теориивыборочного метода.
8. Моменты распределения.
Моменты распределения составляют алгоритмическую основу многихстатистических методов. Различают:
— Произвольные (общий случай);
— Начальные;
— Центральные;
— Стандартные (частный случай).
Выделяют:
- Взвешенные;
- Невзвешенные.
Произвольным моментом k-го порядканазывается среднее значение k-ой степени отклонения всех вариантов ряда отпроизвольного постоянного числа.
/> -для несгруппированных данных;
/> -для сгруппированных данных.
При этом k принимает целочисленноезначение от 1 до 4.
Если А=0, то произвольный момент преобразуетсяв начальный момент.
/> -для несгруппированных данных;
при k=1 M1=/>
при k=2 M2=/>
/> - для сгруппированных данных.
Если А=/>,произвольный момент преобразуется в центральный момент распределения.
/> -для несгруппированных данных;
/> -для сгруппированных данных.
При k=1 M1=0
При k=2 M2=/>
Стандартные моменты это начальные моменты из стандартных отклонений.
/> -для несгруппированных данных;
/> -для сгруппированных данных.
/>
Стандартный момент k-го порядка этоотношение центрального момента того же порядка к средне квадратическомуотклонению в k-ой степени.
Так же как средняя арифметическая величина идисперсия, центральные и стандартные моменты обладают рядом свойств, которые посути ближе всего к свойствам дисперсии.
9. Показатели асимметрии и эксцесса.
При анализе распределений помимо графическогоизображения характер распределения можно выяснить, рассчитывая такиепоказатели, как асимметрия и эксцесс.
В качестве показателя асимметрии используютстандартный момент 3-го порядка. Если распределение симметрично относительносредней то показатель асимметрии равен нулю.
/> />
Если показатель асимметрии больше 0, то естьпреобладают положительные отклонения от среднего, то наблюдается правосторонняяасимметрия, то есть преобладание в совокупности вариантов ряда превышающихсреднюю.
Если же показатель асимметрии меньше 0, налицо левосторонняяасимметрия, то есть превышение численности вариантов ряда меньше чемсредняя.
Показатель эксцесса характеризует степень колеблемости исходных данных, чем сильнеевариация, тем более пологой является кривая распределения и наоборот, чемоднороднее совокупность, тем в большей степени варианты ряда сконцентрированыоколо средней и тем более островершинней будет кривая распределения.
В качестве эталона высоты распределения в статистикепринимается кривая нормального распределения. Доказано, что стандартный момент4-го порядка у этой кривой равен 3.
/> />
10. Средняя арифметическая и дисперсия альтернативногопризнака.
Альтернативный признак – тот которым обладает или не обладает единицасовокупности.
Наличие альтернативного признака обозначают 1, аотсутствие – 0. Если численность совокупности – N, а M –число единиц, обладающих изучаемым признаком, то /> -доля единиц, обладающих изучаемым признаком. Соответственно /> - доля единиц такимпризнаком не обладающих.
Предположим
/>
/>
1 p q 1p+q=1
/>
Средняя арифметическая альтернативного признака равна p.
/>
Дисперсия альтернативного признака />.
Пример: N=10, M=4
N-M=6
/>
Максимальное значение дисперсии для неоднородныхсовокупностей />.
Выборочный метод.
1. Сущность выборочного метода и егопрактическое значение.
2. Ошибка выборки.
3. Малая выборка.
4. Определение оптимальнойчисленности выборки.
5. Распространение результатоввыборочного распределения на генеральную совокупность.
6. Классификация способов отбора.
7. Организация отбора различнымиспособами и оценка надежности полученных результатов.
8. Моментное выборочное наблюдение.
1. Сущность выборочного метода и его практическоезначение.
Выборочный метод – это основной способ сбора информации в условиях развитой рыночнойэкономики.
Выборка –разновидность несплошного наблюдения, позволяющего определить показатели всейсовокупности (генеральной совокупности) на основе изучения ее части. При этомотобранная часть формируется с учетом положений теории вероятности иматематической статистики.
Выборка имеет многовековую историю, но еематематическая составляющая получила развитие во 2й половине 19-20века. Значительный вклад в формирование теории выборки внесли русскиестатистики. В СССР господствовало сплошное статистическое наблюдение в видеотчетности. Выборка охватывала только:
— Оценку качества продукции;
— Наблюдение за ценами на городских колхозных рынках;
— Наблюдение за семейными бюджетами;
— Изучение спроса.
За рубежом в то время преобладало выборочноеобследование. Сплошное наблюдение охватывало только таможенную статистику,налогообложение и периодически проводимые переписи населения, и промышленныецензы.
Достоинства выборки.
При правильно организованном выборочном обследованииизучается не более 20-25% совокупности, обычно 10% и то много. На лицо огромнаяэкономия времени и средств. При этом благодаря работе статистиков –профессионалов значительно повышается точность наблюдений (нередко она выше,чем при сплошном наблюдении). Однако, параметры выборки в силу объективныхпричин могут отличаться от соответствующих параметров генеральной совокупности,поэтому результаты выборочного исследования распространяются на генеральнуюсовокупность с определенной вероятностью.
Не всякое несплошное наблюдение – этонаучно-обоснованная выборка.
Для получения надежных результатов необходимотщательно готовить выборку. Подготовка включает следующие этапы:
1. Обоснование целесообразностипроведения выборки;
2. Подготовка программы выборки;
3. Решение организационных вопросоввыборки;
4. Определение способа отбора ичисленности выборки, обеспечивающих репрезультативность ее результатов.
5. Проведение отбора единицгенеральной совокупности.
6. Сводка полученных результатов ирасчет параметров выборки.
7. Определение ошибок выборки.
8. Распространение параметров выборкина генеральную совокупность.
Главная задача выборки:
— Вычисление ожидаемой ошибки выборки, то есть разницы междуодноименными характеристиками выборочной и генеральной совокупности;
— Определение доверительной вероятности того, что ошибкарепрезультативности не превысит некоторого заранее заданного значения;
— Расчет численности выборки, обеспечивающей с заданнойвероятностью необходимую точность исследований.
2. Ошибка выборки.
Возникает из-за различий в вариации значенийизучаемого признака у единиц выборочной и генеральной совокупности. Посколькупри соблюдении требований случайного отбора все единицы генеральнойсовокупности имеют равные шансы попасть в выборку, состав выборки может значительноизменяться при повторении испытаний. Соответственно будут меняться параметрывыборки, и возникать ошибки выборки. Ошибки выборки неизбежны, они вытекают изсути метода. Ошибки выборки не могут быть постоянными при повторении отбора.
Ошибка выборки в статистике это некоторая средняявеличина или обобщающая характеристика, ошибок полученных при многократномповторении испытаний.
/>
/>W — P
/> -ошибка выборки;
/> -выборочная средняя;
/> -генеральная средняя;
W –доля единиц, обладающих изучаемым признаком в выборочной совокупности(выборочная доля);
P — доля единиц, обладающих изучаемым признаком в генеральной совокупности.
Величина ошибок зависит от способа отбора. Вматематической статистике доказано, что средняя ошибка выборки(математическое ожидание средней ошибки выборки) – это среднеквадратическоеотклонение распределения выборочной средней величины.
Ошибка выборки определяется: />
В математической статистике доказано, что средняяошибка собственно случайного повторного отбор рассчитывается: />, где
/> — средняя ошибка выборки;
/> — дисперсия генеральной совокупности;
/> — численность выборки.
Если исследуется выборочная доля при повторном отборе />, где /> - дисперсия биномиального распределения.
Результаты повторного отбора подчиняются закону биномиальногораспределения.
При бесповторном отборе результаты многократнойвыборки и распределения ошибок подчиняются гипергеометрическому распределению,и формула средней ошибки имеет вид: />,соответственно для выборочной доли />.
При выборках большой численности, когда /> из массовых генеральныхсовокупностей (/>) для расчетаошибок выборки можно использовать формулу повторного отбора.
В формулах средней ошибки выборки присутствуетгенеральная дисперсия. Однако, она, как правило, неизвестна. Если мы проводимвыборку для того, чтобы изучить только часть совокупности, мы не можем знатьгенеральную дисперсию. Исключение составляют только выборки, проводимые дляконтроля результата сплошного наблюдения.
Однако, математической статистикой доказано, чтоесли выборка производится из нормального распределения совокупности генеральнаяи выборочная дисперсия связаны между собой следующим образом:
/> /> /> /> />/>
<td/>s2 — генеральная дисперсия;
S2 — выборочная дисперсия;
n – численность выборки.
/>Из формулы видно, что достаточно большой выборке (n-1)®n, а />, откуда s2» S2. Поэтому для расчета средних ошибок выборки напрактике используют выборочные дисперсии.
/> /> /> /> />/>
<td/>/>
/>Если многократнопроводить выборки из одной и той же генеральной совокупности, то конкретномуразмеру ошибки выборки будет соответствовать та или иная статистическаявероятность ее появления.
Вероятности конкретного размера ошибок подсчитатьневозможно (нецелесообразно), гораздо важнее знать, что ошибка наблюдений невыйдет за определенные пределы.
p – вероятность того, что абсолютная величина ошибки выборки не превысит некоторого предела (tm) больше чем />;
t – доверительный коэффициент (>1);
tm=D — предельная ошибка выборки (допустимый предел ошибки)
Суть предельной теоремы: Чебышев доказал, что средняя арифметическая величинадостаточно большого числа независимых случайных величин, дисперсии которыхограничены некоторой постоянной, становится фактически независимой от игрыслучая./>
t=1, 2, 3
Поформуле Чебышева, если
t=1 r³0
t=2 r³0,75
t=3 r³0,89
Этаформула для условий повторного отбора.
Академик Марков доказал, что предельная теоремасправедлива и для бесповторного отбора.
Академик Ляпунов доказал, что вероятности предельныхошибок многочисленных выборок подчиняются закону нормального распределения,следовательно, для определения вероятностей нахождения ошибки выборки взаданных пределах можно использовать интегральную формулу Лапласа.
Площадь кривой ±s 0,6827
2s 0,9545
3s 0,9973
Отсюда, если доверительный коэффициент t=1,то вероятность того, что предельная ошибка выборки не будет больше, чем средняяошибка, которая составляет 0,683.
/>
Вероятный интервал изменения генеральной средней илидоли в статистике принято называть доверительным интервалом.
Пример:Для анализа жирности молока из партии в 1000 фляг было отобрано и проверено 30.Средний процент жирности в проверенных флягах составил 3,51%, присреднеквадратическом отклонении 0,35. С вероятностью 0,954 определитьдоверительный интервал средней жирности партии молока (если выборкабесповторная).
/>
N=1000n=30
/>=3,51%
S=0,35%
Если мы расширим допустимые пределы точности, товероятностная надежность результата будет выше, а точность ниже.
Если p=0,997 то t=3, а D=0,19 тогда ожидаемая жирность молока в генеральной совокупности должнасоставить />.
3. Малая выборка.
В процессе статистических исследований нередкоприходится ограничивать объем выборки, особенно в тех случаях, когдаисследования единиц совокупности приводит к их разрушению.
В статистике доказано, что даже в выборке весьмамалого объема (20-30, а иногда 4-5 единиц) позволяют получить приемлемые дляанализа результаты. Проблема малых выборок была решена в 1908г. английскимстатистиком У.Гассетом (псевдоним Студент). Он сумел определить зависимостьмежду величиной доверительного коэффициента t, а так жечисленностью малой выборки n с одной стороны, и вероятностью нахождения ошибкивыборки в заданных пределах с другой стороны. Эта зависимость получила название– распределение Стьюдента. Для упрощения расчетов имеются специальныетаблицы значений критериев Стьюдента (стр. 372 «Практикума по теориистатистики»).
n=n-1 – число степеней свободы.
/>
Малая выборкаопределяется по формуле
/> /> /> /> /> /> />/>
<td/>t – критерий Стьюдента;
m — средняя ошибка малой выборки.
/> /> /> />/>
Средняя ошибка малой выборки
/>
Дисперсия малой выборки- число степеней свободы.
Пример:Ежедневные затраты времени 15 работников на поездки туда и обратно составляют всреднем 1,7 часа. Определить пределы, в которых находится среднее время поездкина работу и обратно.
/>
n=15/>=1,7 часа
S2=0,134
P=0,954. Определение оптимальной численности выборки.
Трудовые и материальные затраты на проведениевыборки напрямую зависят от ее численности, поэтому чрезвычайно важно дооптимума сохранить численность выборки, так чтобы не утратить ее точность.
Поиск оптимальной численности выборки удобноосуществлять на основе формул средней и предельной ошибок. Из формулы среднейошибки случайного повторного отбора видно, что величина средней ошибки обратнопропорциональна квадратному корню из численности выборки (/>). Чтобы сократить среднююошибку в 2 раза, нужно численность выборки увеличить в 4 раза. Используяформулу предельной ошибки выборки /> можнонайти численность />. Это оптимальнаячисленность выборки для случайного повторного отбора.
Пример:Для определения среднего размера банковского вклада сроком на 91 деньнеобходимо провести повторный отбор из совокупности в 2500 договоров. Какоеколичество договоров необходимо отобрать, чтобы с вероятностью 0,954 предельнаяошибка выборки не превысила 25 руб.
/>
N=2500p=0,954
D=25 руб.
n-?
s2=8900
Наличие в формуле оптимальной численности генеральнойдисперсии />приводит на первый взгляд к парадоксу: зачем нампроводить выборку, если известна генеральная дисперсия (а, следовательно, игенеральная средняя). Однако на практике генеральная дисперсия обычно неизвестна, вместо нее используют выборочную дисперсию предыдущего обследования,так как дисперсия как показатель является более устойчивой, чем сами варианты,на основе которых она рассчитана.
Если отбор осуществляется бесповторно, точисленность выборки для такого отбора рассчитывается по формуле:
/> <td/>/>
Дляпредыдущего примера: />
Результаты близки, таккак очень велика генеральная совокупность.
Если в условиях задачиприсутствует предельная ошибка выборочной доли, то формула:
/>
- для повторного отбора;
- для бесповторного отбора.
Пример:В целях изучения спроса на спортивную обувь периодически проводился опрос 1500спортсменов. Какова должна быть численность случайного бесповторного отбора,чтобы с p=0,954 ошибка выборки доли спортсменов, предпочитающихобувь с верхом из натуральной кожи, не превысила 0,05, если известно, что ранееэтой обуви отдавали предпочтение 65% спортсменов.
/>
N=1500p=0,954 (t=2)
D=0,05
w=65%=0,65
n-?
5. Распространение результатов выборочногораспределения на генеральную совокупность.
Для этих целей используется два метода:
— Метод прямого пересчета;
— Метод поправочных коэффициентов.
Метод прямого пересчета применяется дляопределения по данным о выборочной доле величины интервала, в пределах которогов генеральной совокупности с заданной вероятностью находится число единиц,обладающих изучаемым признаком.
/>
Пример: По данным выборочного контроля в партии яблок весом20 тонн доля стандарта составила 97,5%. Предельная ошибка выборки с p=0,954равнялась 0,5%. Определить вес стандартных яблок во всей партии.w=0,975 (97,5%)
p=0,954
D=0,005 (0,5%)
Основное назначение метода поправочныхкоэффициентов – уточнение данных сплошного массового наблюдения посредствомвыборочных проверок. Обычно такие проверки осуществляютсяинструкторами-контролерами по результатам проведенных переписей.
Пример: По результатам контрольногообхода счетного участка инструктором-контролером получены уточненные сведения очисленности населения 589 человек вместо 572 зарегистрированных счетчиков.Всего на территории инструкторского участка по данным переписи проживало 3893человека.
/>
— скорректированная численность.
6. Классификация способов отбора.
Методология и результаты расчета основных параметроввыборки непосредственно зависят от способа отбора единиц из генеральнойсовокупности.
Способ отбора – это определенная системаорганизации выборочного исследования. Применение того или иного способа зависитот цели исследования условий выборки, специфики объекта исследования,необходимой точности и оперативности результатов и от средств выделенных наисследования.
Все способы отбора разделяются на 3 вида:
— Индивидуальный;
— Групповой;
— Комбинированный.
При индивидуальном виде отбирают отдельныеединицы совокупности.
При групповом виде отбирают группы, серииединиц совокупности (например: выбрали из контейнера несколько ящиков и все ихпроверили).
Комбинированный способ сочетаетиндивидуальный и групповой.
Если выборочная совокупность получена сразу, отборназывают одноступенчатым.
При наличии нескольких последовательных этаповотбора – выборка считается многоступенчатой.
Единица отбора меняется на каждой ступени. В отличииот многоступенчатой – многофазная выборка сохраняет одну и ту же единицуна всех стадиях отбора. Однако программа наблюдения постепенно расширяется.
В зависимости от применяемой схемы отбора различают:
— Повторный;
— Бесповторный.
Каждый из видов отбора может осуществлятьсяследующими способами:
1. Собственнослучайным;
2. Механическим;
3. Типическим(стратефицированным);
4. Серийным(гнездовым);
5. Комбинированным.
7. Организация отбора различными способами иоценка надежности полученных результатов.
Различные способы отбора отличаются неодинаковойметодикой формирования выборки и различными алгоритмами расчета ошибокрепрезентативности.
Собственно случайный отборорганизуется таким образом, чтобы у всех единиц генеральной совокупности былиравные возможности попасть в выборку. Это обеспечивается отбором по жребию, потаблицам случайных чисел или с помощью генераторов случайных чисел. Независимоот того, как будут отбирать единицы, их обязательно нумеруют. При отборе пожребию эти номера наносятся на карточки, шары и т.п., которые затем тщательноперемешиваются и из них наугад отбирается количество карточек, равноечисленности отбора.
Таблица случайных чисел это матрица 4 или 5 чисел,каждая цифра которой не зависит от остальных цифр данного числа и других чисел.В зависимости от численности выборки из таблицы выбираются одно, двух, трех иличетырехзначное число. Числа можно отбирать по столбцам или строкам таблицы(начиная с любой строки или столбца) заранее заданным алгоритмом отбора.
В компьютерах и некоторых калькуляторах имеетсягенератор случайных чисел, который выводит на экран случайные числа.
Средняя ошибка собственно случайного повторного илибесповторного отбора определяется по формуле: см. пункт (2).
Механический отбор это направленнаявыборка из совокупности, предварительно упорядоченной по существующему илинесуществующему признаку.
На первом этапе генеральная совокупностьупорядочивается по какому-либо признаку. Независимо от признака при механическомотборе устанавливается пропорция отбора по формуле: N/n.
Если совокупность сгруппирована по несущественномупризнаку, то безразлично, с какой единицы начинать отбор.
Если совокупность сгруппирована или упорядочена посущественному признаку, то отбор следует начинать с середины первой группы.
Средняя ошибка механического отбора рассчитываетсяпо формулам для случайного отбора. Это справедливо, когда отбор производился изсовокупности, упорядоченной по несущественному признаку.
Если же совокупность была упорядочена посущественному признаку, то такой способ расчета несколько завышает среднююошибку выборки.
В данном случае можно было использовать среднюю извнутригрупповых дисперсий, а не общую дисперсию.
Типическая выборка(стратефицированная). При этой выборке генеральная совокупность вначалеразбивается на типичные группы (страты), из которых производится случайныйотбор единиц. Такая выборка гарантирует представительство всех типичных группвыборочной совокупности, что снижает ошибку выборки. Существуютпропорциональный и непропорциональный способы типического отбора.
При пропорциональном способе из каждой группыотбирается число единиц пропорциональное либо численности группы, либовнутригрупповой вариации изучаемого признака.
При типическом повторном отборе пропорциональномчисленности групповая средняя ошибка выборки определяется по формуле:
/>
— средняя ошибка выборки для бесповторного отбора;
Если исследуется доля единиц совокупности,обладающих изучаемым признаком, то средние ошибки и дисперсия:
/>
— для повторного отбора;
— для бесповторного отбора.
Пример:Для изучения средних цен одного блюда в предприятии общественного питанияпроизведена 10% выборка пропорциональная численности групп.
ПредприятияЧисленность выборки, />
Средняя цена, />
Внутригрупповая дисперсия, />
/>
/>
Закусочные 21 19,3 68,2 405,3 1432,2 Кафе 24 42,5 151,45 1020 3634,8 Рестораны 15 63,2 342,5 948 5137,5 60 39,56 2373,3 10204,5/>
Для расчетов нужно рассчитать среднюю извнутригрупповых дисперсий:
/>
Предельнаяошибка типической выборки с p=0,954 />
Доверительный интервал средней цены блюда />
В 954 случаях из 1000 средняя цена блюда в генеральнойсовокупности будет не ниже 36 руб. 36 коп. и не выше 42 руб. 76 коп.
Оптимальная численность типической выборки пропорциональна численности групп, определяется поформулам:
/> <td/>/>
- для повторного отбора;
- для бесповторного отбора.
Каковая должна быть численность выборки, чтобы с p=0,954можно было бы утверждать, что предельная ошибка не превысит 3 руб. 50 коп.
/>/>
Численность, подлежащая отбору из отдельных типическихгрупп, рассчитывается по формуле:
/> <td/>/>
Из 600 предприятий – 210 закусочных, 240 кафе, 150ресторанов.
/>
Наиболее из точных пропорциональных способовтипического отбора является отбор пропорциональной вариации значений признака вгруппах. Данный отбор целесообразен при наличии генеральных внутригрупповыхдисперсий. Это возможно, когда выборка осуществляется для контроля данныхсплошного наблюдения или когда имеются данные предшествующего сплошногонаблюдения.
Численность выборочных групп определяется по формуле:
/> /> /> /> />/>
<td/>/> — численность выборки из j-й типической группы;
/> — генеральная внутригрупповая дисперсия;
/> - численность составляющих типических групп в генеральной совокупности.
/>Средняя ошибка выборкибесповторного типического отбора пропорциональна вариации признака в группах.Определяется по формуле:
/> <td/>/>
Данный способ отборадает ошибку меньшую, чем отбор пропорциональный численности групп.
Наиболее общим случаемявляется непропорциональный типический отбор. При произвольных пропорцияхформирования типических выборочных групп средняя ошибка выборки рассчитываетсяпо формуле:
/> /> /> /> />/>
<td/>/> - средние ошибки выборки в каждой типической группе;
/> - численность соответствующих типических групп.
/>При этом, ошибки средние выборки по группамопределяются по формулам:
/>
/> — внутригрупповаядисперсия.— для повторного отбора;
- для бесповторного отбора.
Серийный или гнездовой отбор – это случайный выбор групп единиц с последующимсплошным наблюдением внутри отобранных серий. Данная выборка применяетсяпреимущественно для контроля качества товаров, когда целесообразно вскрывать иисследовать отдельные упаковки. Это разновидность направленного отбора,способствующего снижению ошибки выборки. Благодаря сплошному исследованию гнездчастные дисперсии не оказывают влияние на ошибку репрезентативности, котораязависит только от вариации серийных средних, то есть от межгрупповой дисперсии,определяется по формуле:
/> /> /> /> />/>
<td/>/> - частная выборочная дисперсия;
/> - общая средняя серийной выборки;
/> - число отобранных серий.
/>Средняя ошибка серийной выборки определяется по формулам:
/>
— для повторногоотбора;/>
— для бесповторного отбора.
Пример:при проверке качества обуви партии 500 коробов отобрано в случайном порядке ипроверено 10 пар обуви. Число стандартных пар в коробах распределялосьследующим образом. />
№ коробов 1 2 3 4 5 6 7 8 9 10 ИтогоЧисло стандартных
пар в
коробе (/>).
48 45 50 49 47 48 50 46 48 49 480/>
2304 2025 2500 2401 2209 2304 2500 2116 2304 2401 23054/>
Если становится задача с вероятностью 0,954 определитьчисло стандартных пар обуви в коробе и доверительные интервалы доли стандартнойобуви в партии, то предельная ошибка выборки />.Доверительный интервал числа пар в генеральной совокупности определяется поформуле:
/>
Доля стандартной обуви />/
Комбинированная выборка – это сочетание группового и индивидуального отбораединиц наблюдения. Чаще всего сочетается серийный и собственно случайный отбор.
Ошибка выборки комбинированного отбора складывается изошибок выборки ожидаемых по каждому способу отбора, входящему в комбинацию.Обычно применяют бесповторную комбинированную выборку, хотя теоретическивозможен повторный комбинированный отбор. Комбинированная выборка по своейприроде является многоступенчатой. Несмотря на простоту методологиимногоступенчатого отбора, расчет его ошибки достаточно сложен и определяется поформуле:
/> дляравночисленного отбора на каждой ступени.
/> <td/>/> - средние ошибки выборок на каждой из ступеней отбора;
/> - численность ступеней отбора.
8. Способ моментных наблюдений.
Метод моментных (мгновенных) наблюдений разработан в1938 году английским статистиком Типлетом для выборочного изученияпроизводственного процесса. Метод применяется для групповых фотографий затратрабочего времени и времени работы оборудования, когда наблюдатель периодическиобходя рабочие места по заранее установленному маршруту регистрирует вспециальном бланке, чем занят рабочий в конкретный момент времени, работает онв данный момент или отдыхает.
Метод моментных наблюдений – это выборка во времени,где генеральной совокупностью является фонд рабочего времени объектанаблюдения, то есть коллектива работников или группы единиц оборудования.Выборочная совокупность складывается из периодов времени регистрации состоянияобъекта исследования.
Групповые фотографии обеспечивают многократноеснижение затрат по сравнению с индивидуальными фотографиями, так как не требуютпостоянного присутствия наблюдателя на каждом рабочем месте в течении всегорабочего дня. Метод эффективен для оценки труда коллектива работников,выполняющих однородные операции.
Первым этапом организации мгновенных наблюденийявляется определение численности выборки, то есть необходимого числа моментарегистрации.
/> - доверительный коэффициент;
/> - выборочная доля единиц, обладающих изучаемым признаком;
/> - предельная ошибка выборки, выраженная в процентах.
/>Пример:для изучения использования рабочего времени 20 официантов методом мгновенныхнаблюдений проводится групповая фотография рабочего времени. По норме времяработы должно составлять 8/10 установленной продолжительности рабочего дня (/>). Допустимый пределотклонений />. Вероятностная надежность0,954. Надо определить доверительный интервал доли времени работы вустановленной продолжительности рабочего дня.
/>
№ рабочего места Порядковые номера обходов Итоги регистрации 1 2 3 4 … 13 14 Работал Не работал 1 Н Н Н 10 4 2 Н Н Р 12 2 3 Р Р Р 11 3 4 … … … … … … … 19 Н Н Р 20 Н НВсего
Работал
2 4 9 210 Не работал 18 16 11 70Доля рабочего времени по данным обследования />.
Средняя ошибка выборки />.
Предельная ошибка с вероятностью 0,954 />.
Доля времени работы по данным исследований
/>
Статистическое исследование взаимосвязей.
1. Видывзаимосвязей и цели их статистического изучения.
2. Классификацияметодов исследования взаимосвязей.
3. Парнаярегрессия.
4. Измерениятесноты взаимосвязи.
5. Множественнаякорреляция и регрессия.
1. Видывзаимосвязей и цели их статистического изучения.
Изучение причинно-следственных зависимостей междуфактами – важнейшая задача анализа социально-экономических явлений. Этонеобходимо для принятия обоснованных управленческих решений. Изучение зависимостей– это сложнейшая задача, поскольку социально-экономические явления сами по себесложны и многообразны. Кроме того, полученные выводы носят вероятностныйхарактер, так как они делаются на основе данных, представляющих собой выборкуво времени или пространстве.
Статистические методы изучения зависимости построеныс учетом особенностей изучаемых закономерностей. Статистика изучаетпреимущественно стохастические связи, когда одному значению признака-факторасоответствует группа значений результативного признака. Если с изменениемзначений признака-фактора изменяются среднегрупповые значения результативногопризнака, то такие связи называют корреляционными. Не всякаястохастическая зависимость является корреляционной. Если каждому значениюфакторного признака соответствует строго определенное значение результативногопризнака, то такая зависимость функциональная. Ее называют еще полнойкорреляцией. Неоднозначные корреляционные зависимости называют неполнойкорреляцией.
Помеханизму взаимодействия различают:
— Непосредственные связи – когда причина прямо влияет наследствие;
— Косвенные связи – когда между причиной и следствиемсуществуют ряд промежуточных признаков (например, влияние возраста назаработок).
Понаправлениям различают:
— Прямые связи – когда значение факторного и результативногопризнаков изменяются в одном направлении;
— Обратные связи – когда значения факторного ирезультативного признаков изменяются в разных направлениях.
Бывают:
— Прямолинейные (линейные) связи – выражены прямой линией;
— Криволинейные связи – выражены параболой, гиперболой.
По числувзаимосвязанных признаков различают:
— Парные связи – когда анализируется взаимосвязь двух признаков(факторного и результативного);
— Множественные связи – характеризуют влияние нескольких признаковна один результативный.
По силевзаимодействия различают:
— Слабые (заметные) связи;
— Сильные (тесные) связи.
Задачастатистики определить наличие, направление, форму и тесноту взаимосвязи.
2. Классификацияметодов исследования взаимосвязей.
Для изучения зависимости применяются различныестатистические методы. Поскольку зависимости в статистике проявляются черезвариацию признаков, то и методы в основном измеряют и сопоставляют вариациюфакторного и результативного признаков.
Для изучения функциональных зависимостей в статисткеприменяют балансовый и индексный методы. Сущность балансового методавыражается формулой:
/>
Данная форма может характеризовать движениематериальных, денежных средств, ценностей.
Индексный метод применяется для анализа динамикии сравнения обобщающих показателей, а так же факторов, влияющих на изменениеуровней этих показателей.
Изучение неполной корреляции осуществляется двумягруппами методов, которые можно определить, как нематематические иматематические. Нематематические методы:
— Метод параллельных рядов;
— Метод аналитических группировок;
— Графический метод.
Метод параллельных рядов применяется дляопределения наличия и направления взаимосвязи при немногочисленныхсовокупностях (15-20 единиц). При этом методе значение факторного признакарасполагается в порядке возрастания или убывания и параллельно с нимиотражаются соответствующие значения результативного признака. Сопоставляя рядызначений, устанавливается зависимость.
Метод аналитической группировки применяется вслучаях, когда совокупность достаточно велика и параллельные ряды не позволяютобнаружить зависимость. Этот метод – это разбиение исходных данных на группы всоответствии со значением признака фактора и расчет для каждой группысоответствующего среднегруппового значения результативного признака с тем,чтобы обнаружить взаимосвязь. Аналитические группировки обычно используются дляоднородных совокупностей, поэтому в них применяются чаще всего равныеинтервалы.
Пример: зависимость между суммойтоварооборота магазина и уровнем издержек обращения.
Группы магазинов с товарооборотом, тыс. руб. Количество магазинов Уровень издержек обращения в процентах к итогу До 20 (10) 3 35,2 20,1 – 40 (30) 5 32,4 40,1 – 60 (50) 8 25,2 Свыше 60 (70) 2 21,3Группировка показывает, что с ростом товарооборотападает значение результативного признака. Налицо обратная зависимость. Еслиизобразить результаты группировки на графике, получим эмпирическую линиюрегрессии. Интервалы значений факторного признака заменяются средними групповымипоказателями.
/>
Эмпирическая линия регрессии показывает примернуюформу и направление взаимосвязи.
При построении аналитической группировки надежностьее результатов зависит от того, какое число групп мы можем выделить, не натолкнувшисьни на одно исключение в предполагаемом характере взаимосвязи.
Помимо эмпирической линии регрессии, непосредственноопределяющей форму и направление взаимосвязей, существует корреляционноеполе, на котором отражаются параметрические данные. По корреляционному полютак же можно судить о характере взаимосвязи. Если точки сконцентрированы околодиагонали идущей слева направо, снизу вверх – то связь прямая. Если околодругой диагонали – обратная. Если точки рассеяны по всему полю графика – связь отсутствует.
При построении аналитической группировки важноправильно определить величину интервала. Если в результате первичнойгруппировки связь не проявляется отчетливо, можно укрупнить интервал. Однако,укрупняя интервалы, можно иногда обнаружить связь даже там, где ее нет. Поэтомупри построении аналитической группировки руководствуются правилом: чем большегрупп мы можем выделить, не натолкнувшись ни на одно исключение, тем надежнеенаша гипотеза о наличии и форме связи.
Нематематические методы дают приближенную оценку оналичии, формы и направлении связи. Более глубокий анализ осуществляется спомощью математических методов, которые развились на базе методов,применяемых статистиками - нематематиками:
— Регрессионный анализ, позволяющий выразить с помощьюуравнения форму взаимосвязи.
— Корреляционный анализ используется для определения теснотыили силы взаимосвязи признаков. Корреляционные методы делят:
- Параметрические методы, которые дают оценку тесноты связинепосредственно на базе значений факторного и результативного признаков;
- Непараметрические методы – дают оценку на основе условныхоценок признаков.
Оценка тесноты криволинейных зависимостей даетсяпосле расчета параметра уравнения регрессии. Поэтому такой метод называется корреляционно-регрессивным.
Если анализируется зависимость одного факторного ирезультативного признаков, то в этом случае имеем дело с парной корреляциейи регрессией. Если анализируются несколько факторных и результативныхпризнаков – это множественная корреляция и регрессия.
3. Парнаярегрессия.
Регрессия – это линия, характеризующаянаиболее общую тенденцию во взаимосвязи факторного и результативного признаков.
Предполагается, что аналитическое уравнение выражаетподлинную форму зависимости, а все отклонения от этой функции обусловленыдействием различных случайных причин. Так как изучаются корреляционные связи,изменению факторного признака соответствует изменение среднего уровнярезультативного признака. При построении аналитических группировок мырассматривали эмпирическую линию регрессии. Однако, эта линия не пригодна дляэкономического моделирования и ее форма зависит от произвола исследователя.Теоретически линия регрессии в меньшей степени зависит от субъективизмаисследователя, однако, здесь так же может быть произвол при выборе формы илифункции взаимосвязи. Считается, что выбор функции должен опираться на глубокоезнание специфики предмета исследования.
На практике чаще всего применяются следующие формырегрессионных моделей:
— Линейная />;
— Полулогарифметическая кривая />;
— Гипербола />;
— Парабола второго порядка />;
— Показательная функция />;
— Степенная функция />.
Помимо содержательного подхода существуетформальная оценка адекватности подобранной регрессионной модели. Лучшей из нихсчитается та, которая наименее удалена от исходных данных.
/>
Данное свойство средней, гласящее, что суммаквадратов отклонений всех вариантов ряда от средней арифметической меньше суммыквадратов их отклонений от любого другого числа, положено в основу методанаименьших квадратов, позволяющего рассчитать параметры избранногоуравнения регрессии таким образом, чтобы линия регрессии была в среднемнаименее удалена от эмпирических данных.
Пример:данная система двух уравнений с двумя неизвестными а0и а1позволяет определить точное значение коэффициентов линейной регрессии.
/>
Анализ формы и параметров взаимосвязи между ценой килограммарепчатого лука и объемом его продаж.
Цена 1 кг
лука, руб. />
Объем продаж,
кг />
Товарооборот,
руб. />
/>
/>
/>
/>
/>
/>
3 175 525 9 -107,73 205,68 -30,68 941,26 30625 3,5 200 700 12,25 -125,69 187,73 12,28 150,68 40000 4 180 720 16 -143,64 169,77 10,23 104,65 32400 4,5 150 675 20,25 -161,60 151,82 -1,815 3,29 22500 5 160 800 25 -179,55 133,86 26,14 683,30 25600 5,5 120 660 30,25 -197,51 115,91 4,09 16,77 14400 6 85 510 36 -215,46 97,95 -12,95 167,70 7225 6,5 90 585 42,25 -233,42 80,00 10,00 100,10 8100 7 50 350 49 -251,37 62,04 -12,04 144,96 2500 7,5 40 300 56,25 -269,33 44,09 -4,09 16,69 1600 8 25 200 64 -287,28 26,13 -1,13 1,28 625 60,5 1275 6025 360,25 -2172,56 1274,96 0,045 2330,68 185575Предположим, что связь между ценой и объемомреализации лука линейная. Тогда для расчета параметров а0и а1необходимо решить систему уравнений
/>,
подставляя расчетные значения в систему нормальныхуравнений и решая ее. Одним из методов получим коэффициенты уравнения линейнойрегрессии.
/>
/> -уравнение регрессии или функция, характеризующая теоретическую зависимостьобъемов продаж лука от цены на него. Знак минус указывает на обратнуюзависимость.
Параметр а0 характеризует условное значение результативногопризнака при нулевом значении факторного признака (условный объем продаж лукапри нулевой цене на него).
Параметры уравнения регрессии оцениваются навероятностную надежность. Для этого величина каждого из параметров сравниваетсяс соответствующей средней ошибкой выборки, то есть />,где /> - расчетное значениекритерия Стьюдента, а /> - остаточноесреднеквадратическое отклонение, характеризующее вариацию эмпирических значенийрезультативного признака относительно соответствующих им теоретических значений(вариацию около линии регрессии).
/>
Расчетное значение t критериясравнивается с табличным значением для />степенейсвободы и заданной вероятности. Если p=0,95 /> тотабличное значение равно t=2,262, то есть />,следовательно, параметр а0с вероятностью 0,95 надежен. Параметр а1оценивается по формуле:
/>,где /> — это показатель вариациифакторного признака.
В нашем примере />удобнеевсего рассчитывать по формуле:
/>
Параметры уравнения регрессии надежны, следовательно,с вероятностью 0,95 можно утверждать, что полученное уравнение регрессии />объективно отражает формузависимости между ценой и объемом продаж лука.
По данным регрессионного анализа можно рассчитать коэффициентэластичности, характеризующий пропорцию взаимосвязи между вариациейфакторного и результативного признаков.
/>
Коэффициент эластичности показывает, что с ростом ценына 1%, объем реализации лука снижается на 1,7%.
4. Измерения тесноты связи.
Методы измерения тесноты взаимосвязи условно делятсяна непараметрические и параметрические.
Непараметрические методы применяются для измерения тесноты связи качественныхи альтернативных признаков, а так же количественных признаков, распределениекоторых отличается от нормального распределения.
Для измерения связи альтернативных признаковприменяются коэффициент ассоциации Дэвида Юла и коэффициентконтингенции Карла Пирсона. Для расчета этих показателей применяетсяследующая матрица взаимного распределения частот.
a, b, c, d –частоты взаимного распределения признаков.
1 признак
2 признак
ДА НЕТ ДА a b НЕТ c dПри прямой связи частотысконцентрированы по диагонали a-d, при обратной связи по диагонали b-c,при отсутствии связи частоты практически равномерно распределены по всему полютаблицы.
Коэффициент ассоциации />
Пример:проанализируем зависимость между полом и фактом совершения покупки посетителямимагазина.
1 признак
2 признак
М Ж Итого Купил 24 32 56 Не купил 16 28 44 Итого 40 60/>
Наблюдается очень слабая прямая связь между полом ифактом свершения покупки. Предельное абсолютное значение коэффициента можетбыть близко к единице.
Коэффициент ассоциации непригоден для расчета в томслучае, если одна из частот по диагонали равна 0. В этом случае применяется коэффициентконтингенции, который рассчитывается по формуле:
/>
Коэффициент контингенции также указывает напрактическое отсутствие связи между признаками (его величина всегда меньше Кас).
Если значения признака распределены более чем по 2группам, то для определения тесноты связи применяют коэффициенты взаимнойсопряженности признаков Пирсона, Чупрова и др.
Показатель Пирсона определяется по формуле />, где /> — показатель взаимнойсопряженности признаков, который рассчитывается на основе матрицы взаимногораспределения частот.
1 гр. 2 гр. 3 гр. Итого 1 гр.s11
s12
s13
n1
2 гр.s21
s22
s23
n2
3 гр.s31
s32
s33
n3
Итогоm1
m2
m3
/>
Пример:рассмотрим зависимость между величиной магазина и формой обслуживания.
Самообслуживание Традиционное ИтогоМелкие
магазины
12 45 57 Средние 19 10 29 Крупные 14 4 18 Итого 45 59
/>
Коэффициент свидетельствует о наличии заметной связимежду величиной магазина и формой его обслуживания. Более точным показателемтесноты связи является коэффициент Чупрова, который определяется поформуле:
/>,где /> — соответственно числогрупп, выделенных по каждому признаку. В нашем примере:
/>
Непараметрические методы измерения тесноты взаимосвязиколичественных признаков были первыми из методов измерения тесноты взаимосвязи.Впервые попытался измерить тесноту связи в 30-ч годах 19 века французскийученый Гиррий. Он сопоставлял между собой среднегрупповые значения факторного ирезультативного признаков. При этом абсолютные значения заменялись ихотношениями к некоторым константам. Полученные результаты ранжировались впорядке возрастания. О наличии или отсутствии связи Гиррий судил сопоставляяранее по группам и подсчитывая количество совпадений и несовпадений рангов.Если преобладало число совпадений – связь считалась прямой. Несовпадение –обратной. При равенстве совпадений и несовпадений – связь отсутствовала.
Методика Гиррий была использована Фехнером приразработке своего коэффициента, а так же Спирменом при разработке коэффициентакорреляции рангов.
Расчет коэффициента Фехнера.
Цена 1 кг
лука, руб. />
Объем продаж,
кг />
Знаки отклонений Сравнение знаков/>
/>
3 175 -2,5 59,1 н 3,5 200 -2 84,1 н 4 180 -1,5 64,1 н 4,5 150 -1 34,1 н 5 160 -0,5 44,1 н 5,5 120 4,1 с 6 85 0,5 -30,9 н 6,5 90 1 -25,9 н 7 50 1,5 -65,9 н 7,5 40 2 -75,9 н 8 25 2,5 -90,9 н/>
Коэффициент указывает на наличие весьма теснойобратной связи.
На ряду с коэффициентом Фехнера для измерениявзаимосвязи количественных признаков применяются коэффициенты корреляции рангов. Наиболее распространенным среди них является коэффициент корреляциирангов Спирмена.
Пример:вычисление коэффициента Спирмена для измерения тесноты взаимосвязи междутоварооборотом и уровнем издержек обращения в магазинах.
Однодневный товарооборот, тыс. руб.
/>
Издержки
в % к товарообороту
/>
РангиРазность рангов
/>
/>
/>
/>
18 20,5 1 4 -3 9 23 23,4 2 6 -4 16 29 21,2 3 5 -2 4 45 18,9 4 2 2 4 78 19,2 5 3 2 4 93 17,5 6 1 5 25 Всего 62/>
/>
Коэффициент корреляции рангов может принимать значениев пределах от –1 (обратная связь, близкая к функциональной) до +1 (прямаясвязь, близкая к функциональной).
Непараметрические методы учитывают направленияизменений значений признаков, но не зависят от того, насколько интенсивноколеблются значения результативного признака в результате изменения факторногопризнака. Это позволяют сделать параметрические методы.
Для измерения тесноты линейной взаимосвязи применяетсякоэффициент корреляции. Базовая форма коэффициента корреляции следующая:
/>
Фактически, коэффициент корреляции – это среднеепроизведения нормативных отклонений:
/>
Если связь между признаками отсутствует, торезультативный признак не варьирует при изменении факторного признака,следовательно />. Такой жерезультат получается при сбалансированности сумм отрицательных и положительныхпроизведений.
Обычно для расчета коэффициента корреляции применяютсяформулы, использующие те показатели, которые уже рассчитывались при определениипараметров уравнения регрессии. Наиболее удобной для расчетов является формула:
/>
Величина коэффициента корреляции свидетельствует оналичии очень тесной обратной связи между признаками. Качественная оценкатесноты связи дается с помощью шкалы Чедока.
Показатель тесноты связи
0,1-0,3
0,3-0,5
0,5-0,7
0,7-0,9
0,9-0,99
1,0
Характеристика связи
Слабая
Умеренная
Заметная
Тесная
Очень тесная
Функциональная
Для оценки значимости коэффициента корреляцииприменяют критерий t-Стьюдента, расчетная величина критерия определяетсяпо формуле:
/>
Табличное значение критерия t-Стьюдента:
/>
Следовательно, параметр надежен.
Для измерения тесноты криволинейных зависимостейприменяются универсальные показатели тесноты связи, коэффициентыдетерминации, теоретические корреляционные отношения или индексыкорреляции. Эти показатели построены на принципе соизмерения дисперсийрезультативных признаков.
/>
При этом по правилу сложения дисперсий получаетсявзаимосвязь между дисперсиями: />.
Коэффициент детерминации: />
Теоретическое корреляционное отношение: />.
Для линейной связи величина теоретическогокорреляционного отношения равна коэффициенту корреляции.
Индекс корреляции, по сути, аналогичен теоретическомукорреляционному отношению, его рассчитывают на основе правила сложениядисперсий, используя общую и остаточную дисперсии.
/>
Индекс корреляции:
/>
5. Множественнаякорреляция и регрессия.
Применяется для изучения влияния двух и болеефакторов на результативный признак. Процесс исследования включает несколькоэтапов.
Сначала проводится выбор формы уравнения взаимосвязи,чаще всего выбирается n-мерная линейная формула:
/>,так как легче считать и интерпретировать полученный результат.
Поскольку расчеты важны и трудоемки, важнейшеезначение имеет отбор факторов для включения в регрессионную модель. На основекачественного анализа необходимо отбирать наиболее существенные факторы. Наэтапе отбора факторов, рассчитывается так же единичная матрица парныхкоэффициентов корреляции между признаками факторов, отобранных для включения вуравнение регрессии.
1/>
/>
…/>
…/>
/>
1/>
…/>
…/>
/>
/>
1 …/>
…/>
… … … … … … …/>
/>
/>
… 1 …/>
/>
/>
/>
… … … …В уравнение регрессии не включаются оба или хотя быодин из тесно взаимосвязанных между собой факторов, коэффициент корреляцииравен или превышает величину 0,8, это делается, чтобы избежать явлениямультиколлинеарности, искажающего сущность исследуемого процесса врегрессионной модели.
После подстановки факторов в уравнение, проводятсярасчеты его параметров по методу наименьших квадратов, и полученные результатыоцениваются на вероятностную надежность, путем сравнения каждого из параметровнеизвестного с величиной соответствующей ошибке выборки. Ненадежные параметрыисключаются из уравнений.
Все ненадежные параметры исключаются из уравнения регрессии,и расчеты повторяются до тех пор, пока все оставшиеся параметры иликоэффициенты при неизвестных не будут надежны. Такой метод называется пошаговойрегрессией. Затем рассчитывается множественный коэффициент детерминации.
Ряды динамики.
1. Понятие ряда динамики иклассификация динамических рядов.
2. Обеспечение сопоставимости рядовдинамики.
3. Определение среднего уровнявременного ряда.
4. Система статистических показателейдинамики.
5. Изучение основной тенденцииразвития, социально-экономического развития во времени.
6. Исследование периодическихколебаний во времени.
7. Корреляционная зависимость в рядахдинамики.
8. Статистические методыпрогнозирования.
1. Понятиеряда динамики и классификация динамических рядов.
Ряд динамики или временной ряд – этопоследовательность чисел, характеризующих развитие явления во времени.
Ряд динамики – это совокупность двух взаимосвязанныхэлементов:
— Уровни ряда;
— Показатели времени, к которым они относятся.
Уровень ряда – количественная оценкаизучаемого явления (абсолютные, относительные, средние величины). В зависимостиот показателя времени выделяют:
— Моментные;
— Интервальные ряды динамики.
Моментныединамические ряды характеризуют уровень явления по состоянию наопределенный момент времени. Уровни моментных динамических рядов не следуетсуммировать, так как каждый последующих уровень условно или фактически включаетв себя предыдущий.
Интервальныединамические ряды отражают масштабы явления за определенные периоды времени(дни, пятидневки, декады, месяцы, кварталы и т.д.) — товарооборот, издержки,доходы и т.д. Показатели интервального ряда можно суммировать. Такая операцияназывается укрупнением временных интервалов.
Разновидностьюинтервальных рядов являются ряды динамики с нарастающими итогами. Ониприменяются для оценки хода выполнения запланированных показателей и текущего,сравнение результатов деятельности разных хозяйственных субъектов. Каждыйуровень такого ряда – это сумма значений анализируемого показателя за всепредшествующие периоды его регистрации.
Пример: показатели динамики выполненияквартального плана коммерческого банка по доходам от реализации услуг.
Месяцы Сумма доходов от услуг, тыс.руб.Выполнение квартального
плана в %
За месяц С начала года Январь 11,5 11,5 28,75 Февраль 10,8 22,3 55,75 Март 19,1 41,4 103,5План за первый квартал установлен в сумме 40 тыс.руб.
Статистическое исследование временных рядовпредусматривает:
1) Измерениеинтенсивности развития временного ряда;
2) Определениеобщей тенденции изменений явлений во времени;
3) Анализпричинно-следственной зависимости в рядах динамики;
4) Исследованиепериодических (циклических и сезонных) колебаний;
5) Прогнозированиеразвития динамических рядов.
2. Обеспечениесопоставимости рядов динамики.
В процессе изменения явлений во времени на ряду сколичественными изменениями происходят процессы, изменяющие качественноесодержание объекта исследования. Основными причинами качественных измененийявляются:
1) Инфляция,колебание курса валют;
2) Изменениегосударственных и административных границ;
3) Переход на иныеметодологии расчета сравниваемых показателей;
4) Использованиедругих единиц измерения;
5) Изменениекритического момента или периода регистрации;
6) Изменениеперечня объектов, входящих в состав совокупности;
7) Изменениепотребительной стоимости единиц совокупности.
Непосредственное сравнение уровней динамическихрядов не приведенных к сопоставимому виду дает ошибочные результаты и приводятк неправильным управленческим решениям.
Существуют различные способы сопоставимости данных.Влияние инфляции и курсов валют устраняются путем деления фактических данных насоответствующий базисный индекс (относительный показатель динамики) инфляцииили курсов валют. Таким образом, ряд динамики пересчитывается в сопоставимые(базисные) цены и курсы валют.
Уровни рядов динамики в различных единицах измеренияпересчитываются в сопоставимые единицы. Наибольшую сложность представляетсобой приведение к сопоставимому виду показателей, рассчитанных по разнымметодикам. Сложность не только в дополнительной трудоемкости пересчета уровнейпрошлых периодов по новой методике, но и в отсутствии для этого необходимойинформации.
При изменении административно-территориальных граници в силу других причин, отражающихся на составе сравниваемых совокупностейприбегают к смыканию динамических рядов, когда в период изменения приводятсяодновременно два показателя: в старых границах и в новых, и рассчитываетсякоэффициент соотношения между ними, который применяется затем для пересчетапоказателей в старых границах к новым.
Пример: динамика численности населениягорода на 01.01.
1994 1995 1996 1997 1998 1999 Без пригородов 95400 97888 103520 После присоединения пригородов 12470 130456 132370 134500 Сопоставимая численность 111942 114861 121470 130456 132370 134500Расчет коэффициента />
/>
В случае изменения потребительских свойств объектаисследования производится пересчет уровней динамического ряда вусловно-натуральный показатель.
Если состав совокупностей изменяется в результатецеленаправленной деятельности по достижению более высоких показателей, рядыдинамики могут не пересчитываться.
3. Определениесреднего уровня временного ряда.
Обобщающей характеристикой динамики развития явленияво времени служит средняя хронологическая (средний уровень товарных запасов,средний уровень оплаты труда). Важны не только средние абсолютные показатели,но и относительные средние величины. Такие как средние темпы роста, прирост.
Способы начислениясредних зависит от вида динамического ряда.
Средняяхронологическая интервального ряда определяется по формуле:
/>, где /> - уровни ряда, /> - число уровней.
Средняя хронологическая моментного ряда с равноотстоящими моментами может определяться в дваэтапа:
— Вначале определяется средняя для каждого промежутка времени какполусумма двух соседних уровней ряда;
— Средняя из полученных на первом этапе результата.
Все это может быть выражено одной формулой: />
Для динамических рядов с неравноотстоящими моментамисредняя может определяться по одной из двух формул:
/>,где /> - средняя для каждого изпериодов времени (определяется по простой средней арифметической из соседнихуровней ряда), /> -продолжительность соответствующего периода времени.
Если уровни ряда динамики изменяются неравномерно, тодля расчета средних хронологических целесообразно использовать формулу:
/>,где /> - уровень ряда динамики вконкретный момент времени, /> -продолжительность периода времени в течении которого данный уровень неизменяется.
4. Системастатистических показателей динамики.
Для оценки направления и интенсивности развитиясоциально-экономических явлений применяется система абсолютных, относительных исредних показателей динамики. Статистические показатели динамики принято делитьна базисные и цепные.
Показатели:
1) Абсолютный прирост – разница между уровнямиряда:
/> - уровень, принятый за базу сравнения;
/> - текущий уровень;
/> - предшествующий уровень.
/>Сумма цепных абсолютных приростов равна базисномуабсолютному приросту за соответствующий период времени />.
2) Темп роста (относительная величинадинамики). Он показывает во сколько раз текущий уровень больше или меньшесравниваемого. Базисные темпы роста определяются по формуле:
/>
Произведение цепных темпов роста (выраженыкоэффициентами) равно базисному темпу роста за весь анализируемый период.
3) Темп прироста — показывает, на сколькопроцентов увеличился или уменьшился текущий уровень по сравнению с принятым забазу сравнения уровнем.
/>
Если уровни ряда динамики последовательно возрастаютво времени, то важное значение имеет не только процент изменения показателей,но и абсолютное значение одного процента прироста />.
Если экономика также постоянно растет, то длясравнительной оценки интенсивности роста применяется темп наращивания.Когда абсолютные цепные приросты сравниваются с базисными уровнями.
/>
4) Средний абсолютный прирост представляетсобой отношение суммы цепных приростов за анализируемый период на их число.
/>,где m – число цепных приростов за анализируемый период.
Средняя абсолютного прироста, а так же средние темпыроста применяются в статистическом прогнозировании явлений со стабильнойдинамикой развития.
5) Средний темп роста:
/>
5. Изучениеосновной тенденции развития, социально-экономического развития во времени.
Одна из главных задач статистического исследованиядинамики – это определение общей тенденции развития динамического ряда вовремени или тренда.
Тренд (фактор времени) рассматривается каксовокупный результат действия множества различных причин, которые условнообъединяются в одну причину. Считается, что линия тренда может быть выпуклой,вогнутой или прямой. Но она не должна иметь волнообразную форму, которуюпринято считать результатом циклического изменения социальных и экономическихпоказателей.
Кроме того, тренд не должен менять направление напротяжении примерно 10 лет. Существуют различные способы выделения тренда,выбор которых определяется целью исследования и спецификой изучаемого явления:
— Способы укрупнения интервала;
— Скользящей средней;
— Аналитического выравнивания.
Сущность любого из способов это сглаживаниеслучайных единовременных колебаний для выявления общей тенденции развития.
Метод укрупнения интервалов – это суммирование уровней ряда за более короткиепромежутки времени с целью замены их более крупными.
Способ скользящей средней предусматривает последовательное усреднениенекоторого постоянного числа уровней (членов динамического ряда) по формулепростой средней арифметической. Число членов скользящей средней обычно прямопропорционально численности и интенсивности колебаний уровней динамическогоряда.
Аналитическое выравнивание – это набор уравнения прямой или кривой линии,адекватно выражающей общую тенденцию развития динамического ряда и расчетпараметров этого уравнения чаще всего по методу наименьших квадратов. Привыборе уравнения функции руководствуются спецификой изучаемого явления, а также рядом формальных признаков. Например, если для развития явления характернодостаточно стабильные абсолютные, цепные приросты (то есть />), то выбирается уравнение линейноготренда: />.
Если абсолютные цепные приросты с течением временипостепенно сокращаются, то для характеристики тренда применяется полулогарифмическаякривая: />.
Если явление развивается с достаточно стабильнымицепными темпами роста, то для характеристики тренда применяется показательнаяфункция: />.
Если примерно постоянны цепные темпы прироста (/>), то используется параболавторого порядка: />.
Из множества разнообразных функций тренда с формальноматематической точки зрения наилучшей считается та, которая наименее удалена отэмпирических уровней ряда: />.
6. Исследование периодическихколебаний во времени.
При изучении динамики явлений выделяют обычно четырегруппы причин, обуславливающих размер и характер изменения уровней рядадинамики.
/>
— случайная компонента;/>
— сезонная компонента;/>
— циклическая составляющая;/>
— тренд./>
Логика статистического исследования динамического рядасостоит в последовательном определении и наклонении отдельных составных частей(/> - аддитивная модель).
Однако на практике чаще применяется исключениефакторов не методом разностей, а методом соотношений (/>).
Это позволяет при последовательном проведении анализавыражать полученные на каждом этапе результаты в сопоставимом масштабе. То естьмы заменяем аддитивную модель на мультипликативную.
Если трендовая составляющая определяется по одной израссмотренных вами функций, то циклическая составляющая рассчитывается обычнопо синусо-косинусоидальной функции (гармонике Фурье): />, причем величина k –это целое число, которое устанавливается прямо пропорционально интенсивностициклических колебаний. После определения циклической составляющей, расчеткоторой в условиях развивающейся рыночной экономики имеет важное значение,определяется сезонная компонента.
Сезонное колебание – это повторяющиеся устойчивые внутригодовые колебания. Ониобусловлены природно-климатическими и другими факторами, определяющиминеравномерность производства и потребления во времени.
Знание сезонных колебаний позволяет осуществитьрациональное внутригодовое и внутримесячное планирование. Избежать ненужныхпотерь и использовать все имеющиеся возможности. В большинстве случаевстатистическое исследование рядов динамики за короткие промежутки временисводятся к изучению сезонных колебаний. Индикатором сезонных колебаний являетсяиндекс сезонности, который определяется по формуле:
/>,где /> и /> — фактическое и выровненноезначение уровня динамического ряда в i-ый момент времени или в i-ыйпериоде времени.
В зависимости от способа выравнивания исходных данныхразличают методы расчета индекса сезонности по простой средней, скользящейсредней и аналитического выравнивания.
Пример:расчет индексов сезонности товарооборота по методу простой средней.
КварталыТоварооборот по годам,
тыс. руб.
Среднеквартальныеуровни товарооборота
Индексы
сезонности, %
1998 1999 2000 1 11561 11919 12446 11975 102,9 2 8786 8832 9484 9034 77,6 3 10764 11323 11712 11266 96,8 4 13993 14176 14624 14264 122,6 Итого 45104 46250 48266Определим среднеквартальный уровень:
/>
Среднеквартальный уровень за все годы:
/>
Индексы сезонности:
/>
Индексы сезонности показывают, что в 1 кварталетоваров продается примерно на 2,9% больше среднеквартального уровня. Во второмна 22,3% меньше. В третьем на 3,2 меньше, а в четвертом на 22,6% большесреднеквартального уровня. Полученные показатели целесообразно использовать длявнутриквартального планирования годового товарооборота.
Метод расчета индексов сезонности по простой среднейпрост в расчете и достаточно точен в случаях, когда анализируемые явления неимеют устойчивой интенсивной тенденции роста или падения во времени. В противномслучае применяют расчет индекса сезонности по скользящей средней или с помощьюаналитического выравнивания.
Расчет индекса сезонности по методу скользящейсредней (четырехчленной).
См. таблицу
/>
/>
Далее определяется индекс сезонности для каждогоквартала. Полученные индексы сезонности для каждого года и кварталаиспользуются для расчета средних индексов для каждого квартала по методупростой средней:
/>
Определение индекса сезонности методоманалитического выравнивания. В качестве тенденции развития товарооборотавыбираем линейный тренд вида />, длярасчета параметров тренда используется система уравнений:
/>
Поскольку, показатель времени t представляетсобой ряд числе, каждое из которых на 1 больше предыдущего, то системауравнений может быть упрощена искусственно, подобрав ряд tтаким образом, чтобы сумма t равнялась 0 (/>).В этом случае имеем
/>
В нашем примере (см. таблицу дальше):
/>
/>
Годы КварталыТоварооборот,
тыс. руб.
/>
Условные
номера
кварталов
/>
/>
/>
Индексы
сезонности, %
1998 1 11561 -11 -127171 10624 108,8 2 8786 -9 -79074 10807 81,3 3 10764 -7 -75348 10991 97,9 4 13993 -5 -69965 11175 125,2 1999 1 11919 -3 -35757 11359 104,9 2 8832 -1 -8832 11543 76,5 3 11323 1 11323 11727 96,6 4 14176 3 42528 11911 119,0 2000 1 12446 5 62230 12095 102,9 2 9484 7 66388 12279 77,2 3 11712 9 105408 12463 94,0 4 14624 11 160864 12646 115,6 139620 52594Подставляя в уравнение условные значения t,получим теоретические значения уровней ряда динамики (/> ).
Далее по простой средней рассчитываем средние индексысезонности:
/>
Полученные индексы сезонности можно изобразить награфике в виде сезонной волны.
/>
7. Корреляцияв рядах динамики.
При анализе рядов динамики возникает необходимостьисследования взаимосвязи между признаками. Иногда исследовать взаимосвязи можно только в рядах динамики. Это в первую очередь касается многофакторногокорреляционного анализа, когда число единиц совокупности должно не менее чем ввосемь раз превышать число факторов, включенных в регрессионную модель.
Поэтому применяется метод «заводо-лет», когда анализуподвергаются динамические ряды. Однако непосредственное определение теснотысвязи при этом методе возможно только при отсутствии автокорреляции, тоесть зависимости последующих уровней ряда от предыдущих. Вследствиеавтокорреляции наличие синхронных колебаний (тенденций) развития уровней двухпоказателей может быть истолковано как наличие связи между ними.
Поэтому исследование рядов динамики всегда начинаетсяс определения коэффициента автокорреляции:
/>
Рассчитанные коэффициенты автокорреляции оцениваютсяна вероятностную надежность с помощью критерия t –Стьюдента.Если фактическая величина критерия t больше табличного, тоавтокорреляция имеет место и расчет показателей тесноты связи можно осуществитьпо одному из специальных способов:
1) Коррелирование отклонений оттрендов;
2) Коррелирование абсолютныхразностей.
Коэффициент корреляции отклонений от трендоврассчитывается по формуле:
/>,где /> — соответственнотеоретические значения уравнений факторного и результативного признаков,соответственно рассчитанные с помощью уравнений линейных трендов вида:
/>,где x, y – соответственно фактические значения уравненийфакторного и результативного признаков.
Для коррелирования абсолютных разностей цепныеабсолютные приросты по факторному и результативному признакам по формулам:
/>
А коэффициент корреляции: />.
Некоторые социально-экономические явления или факторывоздействуют друг на друга не сразу, а с некоторой задержкой во времени, свременным лагом (запаздыванием). Например, инвестиции в проект дают эффект поистечении срока их освоения.
Для определения тесноты связи подобных явленийвременные ряды факторного и результативного признаков сдвигаются одинотносительно другого на величину временного лага.
8. Статистические методыпрогнозирования.
Результаты анализа временных рядов используются дляпрогнозирования путем экстраполяции, то есть нахождения уравнений запределами временного ряда.
Существуют краткосрочное, среднесрочное идолгосрочное прогнозирование. Понятие срочности прогнозирования связано соспецификой изучаемого явления. Для прогнозирования валютных курсов долгосрочнымявляется прогноз в пределах 1 года, в то время как развитие экономикиосуществляется в долгосрочном плане на 5 и более лет. Краткосрочное – до 1года, среднесрочное – до 3 лет.
В зависимости от сроков прогнозирования и особенностиразвития явления в прогнозный период используют разные методики. Если дляявления (ряда динамики) были характерны достаточно стабильные цепные приросты(абсолютные), то прогнозирование осуществляется по формуле:
/>,где /> — конечный уровеньдинамического ряда, /> — срокпрогнозирования, /> — среднегодовойабсолютный прирост.
Если для явления были характерны достаточно стабильныецепные темпы роста, то прогнозирование осуществляется по формуле:
/> ,где /> — средний темп роста.
Наиболее точным и сложным является прогнозирование сиспользованием различных уравнений трендов (см. пункт 5).
Индексы.
1. Индексный метод. Его роль ванализе социально-экономических явлений.
2. Индивидуальные индексы.
3. Сводные индексы.
4. Средние индексы.
5. Системы индексов. Анализ факторовразвития социально-экономических явлений индексным методом.
1. Индексный метод. Его роль ванализе социально-экономических явлений.
Индекс (впереводе с латинского – указатель). В статистике индекс трактуется какотносительный показатель, характеризующий изменение явления во времени,пространстве или по сравнению с планом. Поскольку индекс относительнаявеличина, наименования индексов созвучны с наименованием относительных величин.
Существуют индексы динамики, выполнения плана,структурных сдвигов, сравнения.
Индексный методнаиболее распространенный метод анализа социально-экономических явлений.Существуют индексы урожайности, заработной платы и т.д. Тем не менее, уиндексного метода имеется существенный недостаток, он адекватно измеряет толькофункциональные причинно-следственные зависимости, которые в экономике не преобладают.Построение индексов требует глубоких знаний в специфике изучаемого явления.
2. Индивидуальные индексы.
Индивидуальные индексы – самые не сложные из индексов.За рубежом их нередко называют «simple index number»(простейший индексный указатель). Это механический подход к названию,правильнее их называть индивидуальными индексами, так как они характеризуютдинамику одного однородного объекта (индивидуума).
Пример: индексцен />, где /> — цена какого-либо товара вотчетном и базисном периоде.
Существуют индивидуальные индексы:
· Физического объема />,динамики количества проданного или произведенного товара;
· Производительности труда />;
· Трудоемкости />.
Если индексы определяются за ряд последовательныхпромежутков времени, они называются цепными или базисными.
Основное достоинство индивидуальных индексовпростота, недостаток – ограниченная сфера применения (только для одногооднородного явления).
3. Сводные индексы.
Первая попытка устранить недостатки индивидуальныхиндексов была сделана французским ученым Дюто в 1752 г. Он предложил сводныйиндекс и свою запись индекса суммы цен товаров />.Недостаток этого сводного индекса – он не учитывал разницу цен на не одинаковыетовары и структуру товарооборота.
Более совершенным индексом являлся индекс Карли (1766г.) /> . Он не зависел от уровняцен на отдельные товары, однако он также не учитывал структуру товарооборота.
Индексы Дюто и Карли в настоящее время не применяются,однако они послужили базой для создания двух современных ветвей индексов:
· Индекса в агрегатной форме (Дюто);
· Средних индексов (Карли).
Термин агрегат заимствован из техники, онозначает соединение разнородных механизмов в единую машину.
Впервые индекс в агрегатной форме былпостроен в 1871 г. профессором Лаасперосом: />,где /> — цены товара, /> — количество.
Индекс в агрегатной форме благодаря использованиюуниверсального соизмерителя позволяет суммировать товары в разных единицахизмерения, которые непосредственному суммированию не поддаются.
Пример:
Товар Цена, руб. Количество ТоварооборотОтчетный
по базисной
цене
/>
Базисный
по отчетной
цене
/>
/>
/>
/>
/>
баз
/>
отч
/>
/>
/>
/>
/>
Яблоки кг 5 6 200 100 1000 600 500 1200 1,2 500 0,5 500 Молоко л 3,2 4 500 400 1600 1600 1280 2000 1,25 1280 0,8 1280 Яйца дес. 4,4 5,2 100 80 440 416 352 520 1,18 352 0,8 352 Итого 3040 2616 2132 3720 2132 2132/> (122,4%).Этот индекс показывает, что в отчетном периоде, по сравнению с базисным, ценына товары, приобретенные в прошлом, выросли в среднем на 22,4%.
Разница между числителем и знаменателем показывает абсолютное подорожание или удешевление (если «-») набора товаров в отчетномпериоде.
/>руб.
Индекс Лааспероса является основным индексом цен вусловиях рыночной экономики для расчета динамики стоимости потребительскойкорзины.
Если объем и структура товарооборота с течениемвремени существенно изменяются, то применяется индекс Пааше: />.
/> (122,7%).
Индекс Пааше является основным индексом дляадминистративно-командной экономики, он показывает среднее изменение цен нафактически реализованные товары в отчетном периоде по сравнению с прошлымпериодом.
Разница между числителем и знаменателем индекса Паашепоказывает экономию или перерасход населения в результате изменения цен.
/>руб.
На ряду с индексом цен широко распространены индексыфизического объема:
/> (70,1%) – он показывает динамику количества проданных товаров. В отчетномпериоде по сравнению с базисным физический объем (количество проданных товаров)снизилось почти на 30% или /> (70,3%).
Разница между числителем и знаменателем индексовфизического объема показывает абсолютный прирост (снижение) товарооборота засчет количества проданных товаров.
/>
Использование различных весов в индексах цен илифизического объема приводит к разным результатам, поэтому были предпринятыпопытки усреднить индексы, в частности путем расчета индекса Лоу: />, где /> — средний объем продаж в отчетноми базисном периодах.
В общем виде индекс в агрегатной форме: />, где /> — качественный(индексированный) показатель, />-объемный показатель (вес).
4. Средние индексы.
Средние индексы– это сочетание индекса в агрегатной форме и индивидуальных индексов.Применяются в том случае, когда отсутствуют какие-либо данные в отчетном илибазисном периодах.
Если отсутствуют данные о количестве проданныхтоваров, но зарегистрированы показатели выручки и индексы цен на отдельныетовары, то на базе индекса Пааше можно рассчитать средний гармоническийиндекс цен. Выводим его через индекс Пааше />.
Имеются данные о товарообороте отчетного периода ииндивидуальные индексы цен. Тогда учитывая, что /> можнопредставить, что />, а />.
/>.
Если имеются данные о динамике физического объемапроданных товаров, то можно на базеоборота за прошлый период рассчитать средний арифметический индексфизического объема.
/>
5. Системы индексов. Анализ факторов развитиясоциально-экономических явлений индексным методом.
Индексы взаимосвязаны между собой в системы подобнотому, как между собой взаимосвязаны индексные экономические показатели.
Пример:товарооборот можно рассматривать как сумму произведений цен на товары наколичество товара.
/>
Подобным образом связаны между собой индекс объемапроизводства с индексом цен и физического объема, индексом валового сбора синдексом урожайности и посевных площадей.
Другой разновидностью систем индексов являетсявзаимодействие между индексами переменного состава, постоянного состава иструктурных сдвигов.
Расчет системы индексов средней себестоимости единицыпродукции.
Себестоимость единицы продукции Объем производства Затраты на производство Отчетный по базисной себестоимости Структура производства Затраты в базисном периоде в расчете на 100 тыс. штук изделий/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
А 2,4 2,3 200 220 480 506 528 44,44 45,83 106,67 110 Б 2,8 2,6 100 100 280 260 280 22,22 20,83 62,22 58,33 В 2,6 2,4 150 160 390 376 416 33,33 33,33 86,67 86,67 Итого 450 480 1150 1142 1224 100,00 100,00 255,56 255,00Индекс переменного состава характеризуется соотношениемдвух средних величин индексированного показателя в отчетном и базисномпериодах.
Средние затраты на производство единицы продукцииснизились на 7,03%.
/> (92,97%)
Индекс переменного состава характеризует изменениеиндексированных показателей под действием двух факторов:
1) Применение качественногопоказателя у отдельных вариантов ряда (в данном случае изменение себестоимостиединицы продукции на отдельных предприятиях);
2) Изменения вследствие структурныхсдвигов количественных показателей (структура производства, в данном случае />).
Влияние каждого из этих факторов отражает индекссоответствующий, который выводится из индекса переменного состава путемзакрепления одного из факторов на постоянном уровне.
/> (93,3%). (аналог индекса Пааше).
Индекс себестоимости показывает среднее изменениесредней себестоимости единицы продукции в результате изменения себестоимостипроизводства на отдельном предприятии в отчетном периоде по сравнению с базисным.
В результате изменения себестоимости производства наотдельных предприятиях средняя себестоимость единицы продукции снизилась всреднем на 6,7%.
Индекс структурных сдвигов характеризует влияниеизменений структуры производства на динамику средней величины (себестоимостьединицы продукции). Так же выводится из индекса переменного состава путемзакрепления качественного показателя (себестоимость единицы продукции) набазисном уровне.
/> (99,61%).
В результате структурных сдвигов в производствесредняя себестоимость единицы продукции снизилась на 0,39%.
Между индексами постоянного, переменного состава иструктурных сдвигов существует следующая взаимосвязь: />, позволяющая рассчитатьодин из индексов, если известны два других.
/>
Система индексов позволяет измерить не толькоотносительные, но и абсолютные индексированных показателей производных от него.
/>
Это разности между числителями и знаменателямисоответствующих комплексных индексов.
Данная система индексов позволяет определитьсоставляющие общего абсолютного изменения затрат на производство в отчетномпериоде по сравнению с базисным.
/>