Реферат: Выборочные исследования в эконометрике


РЕФЕРАТ

Поэконометрике

 

Выборочныеисследования


Термин «выборочныеисследования» применяют, когда невозможно изучить все единицыпредставляющей интерес совокупности. Приходится знакомиться с частьюсовокупности — с выборкой, а затем с помощью эконометрических методов и моделейпереносить выводы с выборки на всю совокупность. В качестве примера рассмотримвыборочные исследования предпочтений потребителей, которые часто проводятспециалисты по маркетингу.

Построение выборочнойфункции спроса

 

Функция спроса частовстречается в экономических учебниках, но при этом обычно не рассказывается,как она получена. Между тем оценить ее по эмпирическим данным не так уж трудно.Мы часто выясняем ожидаемый спрос с помощью следующего простого приема — спрашиваем потенциальных потребителей: «Какую максимальную цену Вызаплатили бы за такой-то товар?» Пусть для определенности речь идет о конкретномучебном пособии по менеджменту. В одном из экспериментов выборка состояла из 20опрошенных. Они назвали следующие максимально допустимые для них цены (в рубляхпо состоянию на сентябрь 1998 г.):

40, 25, 30, 50, 35, 20,50, 32, 15, 40, 20, 40, 45, 30, 50, 25, 35, 20, 35, 40.

Первым делом названныевеличины надо упорядочить в порядке возрастания. Результаты представлены втабл.1. В первом столбце — номера различных численных значений (в порядкевозрастания), названных потребителями. Во втором столбце приведены самизначения цены, названные ими. В третьем столбце указано, сколько раз названо тоили иное значение.


Табл.1. Эмпирическаяоценка функции спроса и ее использование

№ п/п (i) Цена pi Ni

Спрос

 D(p i)

Прибыль

 (p-10)D(р)

Прибыль

 (p-15)D(р)

Прибыль

(p-25)D(р)

1

15

1

20

100

-

2

20

3

19

190

95

-

3

25

2

16

240

160

4

30

2

14

280

210

70

5

32

1

12

264

204

84

6

35

3

11

275

220

110

7

40

4

8

240

200

120

8

45

1

4

140

120

80

9

50

3

3

120

105

75

 

Таким образом, 20потребителей назвали 9 конкретных значений цены (максимально допустимых, илиприемлемых для них значений), каждое из значений, как видно из третьегостолбца, названо от 1 до 4 раз. Теперь легко построить выборочную функциюспроса в зависимости от цены. Она будет представлена в четвертом столбце,который заполним снизу вверх. Если мы будем предлагать товар по цене свыше 50руб., то его не купит никто из опрошенных. При цене 50 руб. появляются 3покупателя. Записываем 3 в четвертый столбец в девятую строку. А если ценупонизить до 45? Тогда товар купят четверо – тот единственный, для когомаксимально возможная цена — 45, и те трое, кто был согласен на большую цену –50 руб. Таким образом, легко заполнить столбец 4, действуя по правилу: значениев клетке четвертого столбца равно сумме значений в находящейся слева клеткетретьего столбца и в лежащей снизу клетке четвертого столбца. Например, за 30руб. купят товар 14 человек, а за 20 руб. — 19.

Зависимость спроса отцены — это зависимость четвертого столбца от второго. Табл.1 дает нам девятьточек такой зависимости. Зависимость можно представить на рисунке, вкоординатах «спрос – цена». Если абсцисса — это спрос, а ордината — цена, тодевять точек на кривой спроса, перечисленные в порядке возрастания абсциссы,имеют вид:

(3; 50), (4; 45), (8; 40), (11; 35),(12; 32), (14; 30), (16; 25), (19; 20), (20; 15).

/>
 Эти девять точек можноиспользовать для построения кривой спроса каким-либо графическим или расчетнымспособом, например, методом наименьших квадратов (см. ниже главу 5). Криваяспроса, как и должно быть согласно учебникам экономической теории, убывает,имея направления от левого верхнего угла чертежа к правому. Однако заметныотклонения от гладкого вида функции, связанные, в частности, с естественнымпристрастием потребителей к круглым числам. Заметьте, все опрошенные, кромеодного, назвали числа, кратные 5 руб.

Данные табл.1 могут бытьиспользованы для выбора цены продавцом-монополистом (или действующем на рынкемонополистической конкуренции). Пусть расходы на изготовление единицы товараравны 10 руб. (например, оптовая цена книги — 10 руб.). По какой цене еепродавать на том рынке, функцию спроса для которого мы только что нашли? Дляответа на этот вопрос вычислим суммарную прибыль, т.е. произведение прибыли наодном экземпляре (p-10) на число проданных (точнее, запрошенных) экземпляровD(p). Результаты приведены в пятом столбце табл.1. Максимальная прибыль, равная280 руб., достигается при цене 30 руб. за экземпляр. При этом из 20потенциальных покупателей окажутся в состоянии заплатить за книгу 14, т.е. 70%.

Если же удельные издержкипроизводства, приходящиеся на одну книгу (или оптовая цена), повысятся до 15руб., то данные столбца 6 табл.1 показывают, что максимальная прибыль, равная220 руб. (она, разумеется, меньше, чем в предыдущем случае), достигается приболее высокой цене — 35 руб. Эта цена доступна 11 потенциальным покупателям,т.е. 55% от всех возможных покупателей. При дальнейшем повышении издержек,скажем, до 25 руб., как вытекает из данных столбца 7 табл.1, максимальнаяприбыль, равная 120 руб., достигается при цене 40 руб. за единицу товара, чтодоступно 8 лицам, т.е. 40% покупателей. Отметьте, что при повышении оптовойцены на 10 руб. оказалось выгодным увеличить розничную лишь на 5, посколькуболее резкое повышение привело бы к такому сокращению спроса, которое перекрылобы эффект от повышения удельной прибыли (т.е. прибыли, приходящейся на однупроданную книгу).

Представляет интересанализ оптимального объема выпуска при различных значениях удельных издержек(табл.2).

Табл.2. Прибыль приразличных значениях издержек

№ п/п (i) Цена pi

Спрос

 D(p i)

Прибыль

 (p-5)D(р)

Прибыль

 (p-20)D(р)

Прибыль

(p-30)D(р)

Прибыль

(p-35)D(р)

Прибыль

(p-40)D(р)

1

15

20

200

-

-

-

-

2

20

19

285

-

-

-

3

25

16

320

80

-

-

-

4

30

14

350 *

140

-

-

5

32

12

324

144

24

-

-

6

35

11

330

165 *

55

-

7

40

8

280

160

80 *

40

8

45

4

160

100

60

40

20

9

50

3

135

90

60

45 *

30 *

В табл.2 звездочками указанымаксимальные значения прибыли при том или ином значении издержек, не включенномв табл.1. Для легкости обозрения результаты об оптимальных объемах выпуска исоответствующих ценах из табл. 1 и 2 приведены в табл.3.


Табл.3. Зависимостьоптимального выпуска и цены от издержек

Издержки

5

10

15

20

25

30

35

40

Оптимальный выпуск

14

14

11

11

8

8

3

3

Цена

30

30

35

35

40

40

50

50

Как видно из табл.3, сростом издержек оптимальный выпуск падает, а цена растет. При этом изменение издержекна 5 единиц может вызывать, а может и не вызывать повышения цены. В этомпроявляется микроструктура функции спроса – небольшое повышение цены можетпривести к тому, что значительные группы покупателей откажутся от покупок, иприбыль упадет.

Этот эффект напоминаетизвестное в экономической теории разделение налогового бремени междупроизводителем и потребителем. Неверно говорить, что производительперекладывает издержки или, конкретно, налоги, на потребителя, повышая цену наих величину, поскольку при этом сокращается спрос (и выпуск), а потому иприбыль производителя.

Дальнейшее ясно — еслиоптовая цена будет повышаться, то и дающая максимальную прибыль розничная ценатакже будет повышаться, и все меньшая доля покупателей сможет приобрести товар.Крайняя точка — оптовая цена, равная 45 руб. Тогда только трое (15 %) купяттовар за 50 руб., а прибыль продавца составит только 15 руб. Наглядно видно,что повышение издержек производства приводит к ориентации производителя нанаиболее богатые слои населения, но и повышение цен (до оптимального длямонополиста-производителя уровня) не приводит к повышению прибыли, напротив,она снижается, и при этом большинство потенциальных потребителей не в состояниикупить товар. Таково влияние инфляции издержек на экономическую жизнь. (Обинфляции мы подробнее поговорим позже.)

Отметим, что рыночныеструктуры не в состоянии обеспечить всех желающих – это просто не выгодно. Так,из 20 опрошенных лишь 14, т.е. 70%, могут рассчитывать на покупку, даже приминимальных издержках и ценах. Если общество желает чем-либо обеспечить всехграждан, оно должно раздавать это благо бесплатно, как это делается, например,с учебниками в школах.


Маркетинговые опросыпотребителей

 

Потенциального покупателяинтересует не только цена, но и качество товара, красота упаковки (например,для подарочных наборов конфет) и многое другое. Хочешь узнать, чего желаетпотребитель — спроси его. Эта простая мысль объясняет популярностьмаркетинговых опросов.

Бесспорно,что основная цель производственной и торговой деятельности — удовлетворениепотребностей людей. Как получить представление об этих потребностях? Очевидно,необходимо опросить потребителей. В американском учебнике по рекламному делу[1] подробно рассматриваются различные методы опроса потребителей и обработкирезультатов с помощью методов эконометрики. Расскажем о результатах опросапотребителей растворимого кофе. Исследование проведено Институтом высокихстатистических технологий и эконометрики по заказу АОЗТ «Д-2» вапреле 1994 г. в Москве.

Сборданных. Обсудим постановку задачи. Заказчика интересуютпредпочтения как продавцов кофе (розничных и мелкооптовых), так инепосредственно потребителей. В результате совместного обсуждения было признаноцелесообразным использовать для опроса и тех, и других одну и ту же анкету из14 основных и 4 социально-демографических вопросов с добавлением двух вопросовспециально для продавцов. Анкета была разработана совместно представителямизаказчика и исполнителя и утверждена заказчиком. В табл.4 приведен несколькосокращенный вариант этой анкеты.


Табл.4.Анкета для потребителей растворимого кофе

_____________________________________________________________

Дорогойпотребитель растворимого кофе,

Институтвысоких статистических технологий и эконометрики просит Вас ответить нанесколько простых вопросов о том, какой кофе Вы любите. Ваши ответы позволятсоставить объективное представление о вкусах российских любителей кофе и будутспособствовать повышению качества этого товара на российском рынке.

1.Частоли Вы пьете растворимый кофе: иногда, каждый день 1 чашку, 2-3 чашки, больше,чем 3 чашки.

(Здесьи далее подчеркните нужное.)

2.Что Вы цените в кофе: вкус, аромат, крепость, цвет, отсутствие вредных дляздоровья веществ, что-либо еще (сообщите нам, что именно).

3.Как часто покупаете кофе: по мере надобности или по возможности?

4.Любите ли Вы бразильский растворимый кофе? Да, нет, не знаю.

5.Какой объем упаковки Вы предпочитаете: в пакетиках, маленькая банка, средняябанка, большая банка, обязательно стеклянная банка, все равно.

6.Где покупаете растворимый кофе: в ларьках, в продуктовых магазинах, вспециализированных отделах и магазинах, все равно, где купить, где-либо еще(опишите, пожалуйста).

7.Были ли случаи, когда купленный Вами кофе оказывался низкого качества? Да, нет.

8.Согласны ли Вы, что за высокое и гарантированное качество продукта можно изаплатить несколько дороже? Да, нет.

9.Какой кофе Вы предпочтете купить: банка неизвестного качества за 2000 руб. илипродукт того же веса, безопасность которого гарантирована Минздравом России, за2500 руб.? Первый, второй.

10.Считаете ли Вы нужным, чтобы производитель принял меры для того, чтобы вредныедля здоровья вещества, в частности, ионы тяжелых металлов, не проникали изматериала упаковки непосредственно в растворимый кофе? Да, нет.

Институтвысоких статистических технологий и эконометрики предполагает сравнитьпотребительские предпочтения различных категорий россиян. Поэтому просимответить еще на несколько вопросов.

11.Пол: женский, мужской.

12.Возраст: до 20, 20-30, 30-50, более 50.

13.Род занятий: учащийся, работающий, пенсионер, инженер, врач, преподаватель,служащий, менеджер, предприниматель, научный работник, рабочий, др.(пожалуйста, расшифруйте).

14.Вся Ваша семья любит растворимый кофе или же Вы — единственный любитель этоговосхитительного напитка современного человека? Вся семья, я один (одна).

15.Согласились бы Вы и в дальнейшем участвовать в опросах потребителейотносительно качества различных пищевых продуктов (чай, джем и др.). Если«да», то сообщите свой адрес, телефон, имя и отчество.

Спасибо за Ваше содействие работе поповышению качества продуктов на российском рынке!

Выборметода опроса. Широко применяются процедуры опроса,когда респонденты (так социологи и маркетологи называют тех, от кого получаютинформацию, т.е. опрашиваемых) самостоятельно заполняют анкеты (розданные имили полученные по почте), а также личные и телефонные интервью. Из этихпроцедур нами было выбрано личное интервью по следующим причинам.

Возвратпочтовых анкет сравнительно невелик (в данном случае можно было ожидать неболее 5-10%), оттянут по времени и искажает структуру совокупности потребителей(наиболее динамичные люди вряд ли найдут время для ответа на подобную анкету).Кроме того, есть проблемы с почтовой связью (постоянное изменение тарифовзатрудняет возмещение респондентам почтовых расходов и др.).

Самостоятельноезаполнение анкеты, как показали специально проведенные эксперименты, непозволяет получить полные ответы на поставленные вопросы (респондент утомляетсяили отвлекается, отказывается отвечать на часть вопросов, иногда не понимает ихили отвечает не по существу). Некоторые категории респондентов, например,продавцы в киосках, отказываются заполнять анкеты, но готовы устно ответить навопросы.

Телефонныйопрос искажает совокупность потребителей, поскольку наиболее активныхиндивидуумов трудно застать дома и уговорить ответить на вопросы анкеты.Репрезентативность нарушается также и потому, что на один номер телефона можетприходиться различное количество продавцов и потребителей растворимого кофе, анекоторые из них не имеют телефонов вообще. Анкета достаточно длинна, иразговор по домашнему и тем более служебному телефону респондента может бытьпрекращен досрочно по его инициативе. Иногородних продавцов и потребителейрастворимого кофе, приехавших в Москву, по телефону опросить практическиневозможно.

Методличного интервью лишен перечисленных недостатков. Соответствующим образомподготовленный интервьюер, получив согласие на интервью, удерживает вниманиесобеседника на анкете, добивается получения ответов на все её вопросы,контролируя при этом соответствие ответов реальной позиции респондента. Ясно,что успех интервьюирования зависит от личных качеств и подготовки интервьюера.Однако расходы на получение одной анкеты при использовании этого метода больше,чем для других рассмотренных методов.

Формулировкивопросов. В маркетинговых и социологических опросахиспользуют три типа вопросов — закрытые, открытые и полузакрытые, они жеполуоткрытые. При ответе на закрытые вопросы респондент может выбирать лишь изсформулированных составителями анкеты вариантов ответа. В качестве ответа наоткрытые вопросы респондента просят изложить свое мнение в свободной форме.Полузакрытые, они же полуоткрытые вопросы занимают промежуточное положение — кроме перечисленных в анкете вариантов, респондент может добавить своисоображения.

Всоциологических публикациях продолжается дискуссия по поводу «мягких»и «жестких» форм сбора данных, т.е. фактически о том, какого типавопросы более целесообразно использовать — открытые или закрытые (см.,например, статью директора Института социологии РАН В.А. Ядова [2]).Преимущество открытых вопросов состоит в том, что респондент может свободновысказать свое мнение так, как сочтет нужным. Их недостаток — в сложностисопоставления мнений различных респондентов. Для такого сопоставления иполучения сводных характеристик организаторы опроса вынуждены сами шифроватьответы на открытые вопросы, применяя разработанную ими схему шифровки.Преимущество закрытых вопросов в том и состоит, что такую шифровку проводит самреспондент. Однако при этом организаторы опроса уподобляются древнегреческомумифическому персонажу Прокрусту. Как известно, Прокруст приглашал путниковзаночевать у него. Укладывал их на кровать. Если путник был маленького роста,он вытягивал его ноги так, чтобы они доставали до конца кровати. Если же путникоказывался высоким и ноги его торчали — он обрубал их так, чтобы достигнутьстандарта: «рост» путника должен равняться длине кровати. Так иорганизаторы опроса, применяя закрытые вопросы, заставляют респондента«вытягивать» или «обрубать» свое мнение, чтобы выразить егос помощью приведенных в формулировке вопроса возможных ответов.

Ясно,что для обработки данных по группам и сравнения групп между собой нужныформализованные данные, и фактически речь может идти лишь о том, кто — респондент или маркетолог (социолог, психолог и др.) — будет шифровать ответы.В проекте «Потребители растворимого кофе» практически для всех вопросовварианты ответов можно перечислить заранее, т.е. можно широко использоватьзакрытые вопросы. В отличие от опросов с вопросами типа: «Одобряете ли Выидущие в России реформы?», в которых естественно просить респондентарасшифровать, что он понимает под «реформами» (открытый вопрос).Поэтому в используемой в описываемом проекте анкете использовались в основномзакрытые и полузакрытые вопросы. Как показали результаты обработки, этот подходоказался правильным — лишь в небольшом числе анкет оказались вписаны своиварианты ответов. Вместе с тем демонстрировалось уважение к мнению респондента,не выдвигалось требование обязательного выбора из заданного множества ответов — респондент мог добавить свое, но редко пользовался этой возможностью (не болеечем в 5% случаев).

Впоследнем вопросе анкеты респонденту предлагалось стать постоянным участникомопросов о качестве товаров народного потребления. Ряд респондентов откликнулсяна это предложение, в результате стало возможным развертывание постоянной сети«экспертов по качеству», подобной аналогичным в США.

Обоснованиеобъема выборки и проведение опроса. Математико-статистическиевероятностные модели выборочных маркетинговых и социологических исследованийчасто опираются на предположение о том, что выборку можно рассматривать как«случайную выборки из конечной совокупности» (см. терминологическоеприложение). Типа той, когда из списков избирателей с помощью датчика случайныхчисел отбирается необходимое число номеров для формирования жюри присяжныхзаседателей. В рассматриваемом проекте нельзя обеспечить формирование подобнойвыборки — не существует реестра потребителей растворимого кофе. Однако в этом инет необходимости. Поскольку гипергеометрическое распределение хорошоприближается биномиальным, если объем выборки по крайней мере в 10 раз меньшеобъема всей совокупности (в рассматриваемом случае это так), то правомерноиспользование биномиальной модели, согласно которой мнение респондента (ответына вопросы анкеты) рассматривается как случайный вектор, а все такие векторанезависимы между собой. Другими словами, можно использовать модель простойслучайной выборки. Таким образом, позиция в давней дискуссии в средеспециалистов, изучающих поведение человека (маркетологов, социологов,психологов, политологов и др.) о том, есть ли случайность в поведении отдельновзятого человека или же случайность проявляется лишь в отборе выборки изгенеральной совокупности, практически не влияет на алгоритмы обработки данных.

Вбиномиальной модели выборки оценивание характеристик происходит тем точнее, чемобъем выборки больше. Часто спрашивают: «Какой объем выборки нужен?»В математической статистике есть методы определения необходимого объемавыборки. Они основаны на разных подходах. Либо на задании необходимой точностиоценивания параметров. Либо на явной формулировке альтернативных гипотез, междукоторыми необходимо сделать выбор. Либо на учете погрешностейизмерений (методы статистики интервальных данных, см. ниже). Ни один из этихподходов нельзя применить в рассматриваемом случае.

Биномиальнаямодель выборки. Она применяется для описания ответов назакрытые вопросы, имеющие две подсказки, например, «да» и«нет». Конечно, пары подсказок могут быть иными. Например,«согласен» и «не согласен». Или при опросе потребителей кондитерскихтоваров первая подсказка может иметь такой вид: «Больше люблю»Марс", чем «Сникерс». А вторая тогда такова: «Большелюблю „Сникерс“, чем „Марс“.

Пустьобъем выборки равен n. Тогда ответы опрашиваемых можно представить как X1, X2 ,…,Xn<sub/>, где Xi<sub/>=1, если i-й респондент выбралпервую подсказку, и Xi<sub/>=0, если i-й респондент выбралвторую подсказку, i=1,2,…,n.В вероятностной модели предполагается, что случайные величины X1,X2 ,…,Xn<sub/>независимы и одинаковораспределены. Поскольку эти случайные величины принимают два значения, тоситуация описывается одним параметром р — долей выбирающих первуюподсказку во всей генеральной совокупности. Тогда

Р(Xi<sub/>= 1) = р, Р(Xi<sub/>= 0)= 1-р, i=1,2,…,n.

Пустьm= X1 + X2+…+Xn<sub/>.Оценкой вероятности р является частота р*=m/n.При этом математическое ожидание М(р*) и дисперсия D(p*)имеют вид

М(р*)= р, D(p*)= p(1-p)/n.

ПоЗакону Больших Чисел (ЗБЧ) теории вероятностей (в данном случае — про теоремеБернулли) частота р* сходится (т.е. безгранично приближается) квероятностир при росте объема выборки. Это и означает, что оцениваниепроводится тем точнее, чем больше объем выборки. Точность оценивания можноуказать. Займемся этим.

Потеореме Муавра-Лапласа теории вероятностей

/>

где/> — функция стандартногонормального распределения с математическим ожиданием 0 и дисперсией 1,

/>

где/>= 3,1415925…-отношениедлины окружности к ее диаметру, e=2,718281828… — основание натуральных логарифмов. График плотности стандартногонормального распределения

/>

оченьточно изображен на германской денежной банкноте в 10 немецких марок. Этабанкнота посвящена великому немецкому математику Карлу Гауссу (1777-1855),среди основных работ которого есть относящиеся к нормальному распределению. Внастоящее время нет необходимости вычислять функцию стандартного нормальногораспределения и ее плотность по приведенным выше формулам, поскольку давносоставлены подробные таблицы (см., например, [3]), а распространенныепрограммные продукты содержат алгоритмы нахождения этих функций.

Спомощью теоремы Муавра-Лапласа могут быть построены доверительные интервалы длянеизвестной эконометрику вероятности. Сначала заметим, что из этой теоремынепосредственно следует, что

/>

Посколькуфункция стандартного нормального распределения симметрична относительно 0, т.е./> то />

Зададимдоверительную вероятность />. Пусть />удовлетворяет условию

/>

т.е.

/>

Изпоследнего предельного соотношения следует, что

/>

/> <td/> />
Ксожалению, это соотношение нельзя непосредственно использовать длядоверительного оценивания, поскольку верхняя и нижняя границы зависят отнеизвестной вероятности. Однако с помощью метода наследования сходимости [4,п.2.4] можно доказать, что

Следовательно,нижняя доверительная граница имеет вид

/>

вто время как верхняя доверительная граница такова:

/>

Наиболеераспространенным (в прикладных исследованиях) значением доверительнойвероятности является /> Иногдаупотребляют термин „95% доверительный интервал“. Тогда /> 

Пример.Пусть n=500, m=200.Тогда p*=0,40. Найдем доверительный интервал для />

/>

Такимобразом, хотя в достаточно большой выборке 40% респондентов говорят»да", можно утверждать лишь, что во всей генеральной совокупноститаких от 35,7% до 44,3% — крайние значения отличаются на 8,6%.

Замечание.С достаточной для практики точностью можно заменить 1,96 на 2.

Удобныедля использования в практической работе маркетолога и социолога таблицыточности оценивания разработаны во ВЦИОМ (Всероссийском центре по изучениюобщественного мнения). Приведем здесь несколько модифицированный вариант однойиз них.

Табл.5.Допустимая величина ошибки выборки (в процентах)

 Объем группы

Доля р*

1000 750 600 400 200 100 Около 10% или 90% 2 3 3 4 5 7 Около 20% или 80% 3 4 4 5 7 9 Около 30% или 70% 4 4 4 6 9 10 Около 40% или 60% 4 4 5 6 8 11 Около 50% 4 4 5 6 8 11

Вусловиях рассмотренного выше примера надо взять вторую снизу строку. Объемавыборки 500 нет в таблице, но есть объемы 400 и 600, которым соответствуют ошибкив 6% и 5% соответственно. Следовательно, в условиях примера целесообразнооценить ошибку как ((5+6)/2)% = 5,5%. Эта величина несколько больше, чемрассчитанная выше (4,3%). С чем связано это различие? Дело в том, что таблицаВЦИОМ связана не с доверительной вероятностью /> ас доверительной вероятностью /> которойсоответствует множитель />Расчетошибки по приведенным выше формулам дает 5,65%, что практически совпадает созначением, найденным по табл.5.

Минимальныйиз обычно используемых объемов выборки nв маркетинговых или социологических исследованиях — 100, максимальный — до 5000(обычно в исследованиях, охватывающих ряд регионов страны, т.е. фактическиразбивающихся на ряд отдельных исследований — как в ряде исследований ВЦИОМ).По данным Института социологии Российской академии наук [5], среднее числоанкет в социологическом исследовании не превышает 700. Поскольку стоимостьисследования растет по крайней мере как линейная функция объема выборки, аточность повышается как квадратный корень из этого объема, то верхняя границаобъема выборки определяется обычно из экономических соображений. Объемыпилотных исследований (т.е. проводящихся впервые, предварительно или как первыев сериях подобных) обычно ниже, чем объемы исследований по обкатаннойпрограмме.

Нижняяграница определяется тем, что в минимальной по численности анализируемойподгруппе должно быть несколько десятков человек (не менее 30), поскольку поответам попавших в эту подгруппу необходимо сделать обоснованные заключения опредпочтениях соответствующей подгруппы в совокупности всех потребителейрастворимого кофе. Учитывая деление опрашиваемых на продавцов и покупателей, намужчин и женщин, на четыре градации по возрасту и восемь — по роду занятий,наличие 5 — 6 подсказок во многих вопросах, приходим к выводу о том, что врассматриваемом проекте объем выборки должен быть не менее 400 — 500. Вместе стем существенное превышение этого объема нецелесообразно, посколькуисследование является пилотным.

Поэтомуобъем выборки был выбран равным 500. Анализ полученных результатов (см. ниже)позволяет утверждать, что в соответствии с целями исследования выборку следуетсчитать репрезентативной.

Организацияопроса. Интервьерами работали молодые люди – студентыпервого курса экономико-математического факультета Московского государственногоинститута электроники и математики (технического университета) и лицея No.1140,проходившие обучение по экономике, всего 40 человек, имеющих специальнуюподготовку по изучению рынка и проведению маркетинговых опросов потребителей ипродавцов (в объеме 8 часов). Опрос продавцов проводился на рынках г. Москвы,действующих в Лужниках, у Киевского вокзала и в других местах. Опроспокупателей проводился на рынках, в магазинах, на улицах около киосков иларьков, а также в домашней и служебной обстановке.

Большоевнимание уделялось качеству заполнения анкет. Интервьюеры были разбиты на шестьбригад, бригадиры персонально отвечали за качество заполнения анкет. Второйуровень контроля осуществляла специально созданная «группа организацииопроса», третий происходил при вводе информации в базу данных. Каждаяанкета заверена подписями интервьюера и бригадира, на ней указано место и времяинтервьюирования. Поэтому необходимо признать высокую достоверность собранныханкет.

Обработкаданных. В соответствии с целью исследования основной методпервичной обработки данных — построение частотных таблиц для ответов наотдельные вопросы. Кроме того, проводилось сравнение различных групппотребителей и продавцов, выделенных по социально-демографическим данным, спомощью критериев проверки однородности выборок (см. ниже). При болееуглубленном анализе применялись различные методы статистики объектов нечисловойприроды (более 90 % маркетинговых и социологических данных имеют нечисловуюприроду [6]). Использовались средства графического представления данных.

Итоги опроса. Итак, по заданию одной из торговыхфирм были изучены предпочтения покупателей и мелкооптовых продавцоврастворимого кофе. Совместно с представителями заказчика был составлен опросныйлист (анкета типа социологической) из 16 основных вопросов и 4 дополнительных,посвященных социально-демографической информации. Опрос проводился в формеинтервью с 500 покупателями и продавцами кофе. Места опроса — рынки, лотки,киоски, продуктовые и специализированные магазины. Другими словами, былиохвачены все виды мест продаж кофе. Интервью проводили более 40 специальноподготовленных (примерно по 8-часовой программе) студентов, разбитых на 7бригад. После тщательной проверки бригадирами и группой обработки информациябыла введена в специально созданную базу данных. Затем проводиласьразнообразная статистическая обработка, строились таблицы и диаграммы,проверялись статистические гипотезы и т.д. Заключительный этап — осмысление иинтерпретация данных, подготовка итогового отчета и предложений для заказчиков.

Технология организации ипроведения маркетинговых опросов лишь незначительно отличается от технологиисоциологических опросов, многократно описанной в литературе. Так, мы предпочлииспользовать полуоткрытые вопросы, в которых для опрашиваемого дан переченьподсказок, а при желании он может высказать свое мнение в свободной форме. Неуложившихся в подсказки оказалось около 5 %, их мнения были внесены в базуданных и анализировались дополнительно. Для повышения надежности опроса онаиболее важных с точки зрения маркетинга моментах спрашивалось в несколькихвопросах. Были вопросы — ловушки, с помощью которых контролировалась«осмысленность» заполнения анкеты. Например, в вопросе: «Что Выцените в кофе: вкус, аромат, крепость, наличие пенки...» ловушкой являетсявключение «крепости» — ясно, что крепость зависит не от кофе самогопо себе, а от его количества в чашке. В ловушку никто из 500 не попался — никтоне отметил «крепость». Этот факт свидетельствует о надежности выводовпроведенного опроса. Мы считали нецелесообразным задавать вопрос об уровнедоходов (поскольку в большинстве случаев отвечают «средний», чтоневозможно связать с определенной величиной). Вместо такого вопроса мыспрашивали: «Как часто Вы покупаете кофе: по мере надобности или повозможности?». Поскольку кофе не является дефицитным товаром, первый ответсвидетельствовал о наличии достаточных денежных средств, второй — об ихограниченности (потребитель не всегда имел возможность позволить себе купитьбанку растворимого кофе).

Стоимость подобныхисследований — 5-10 долларов США на одного обследованного. При этомтрудоемкость (и стоимость) начальной стадии — подготовки анкеты и интервьюеров,пробный опрос и др. — 30 % от стоимости исследования, стоимость непосредственноопроса — тоже 30 %, ввод информации в компьютер и проведение расчетов,построение таблиц и графиков — 20 %, интерпретация результатов, подготовкаитогового отчета и предложений для заказчиков — 20 %. Таким образом, стоимостьсобственно опроса в два с лишним раза меньше стоимости остальных стадийисследования. И в выполнении работы участвуют различные специалисты. На первойстадии – в основном нужны высококвалифицированные аналитики. На второй – многочисленныеинтервьюеры, в роли которых могут выступать студенты и школьники, прошедшиеконкретный курс обучения в 8-10 часов. На третьей – работа с компьютером (надоуметь строить и обсчитывать электронные таблицы или базы данных, использоватьстатистические пакеты, составлять и печатать таблицы и диаграммы и т.п.). Начетвертой – опять в основном нужны высококвалифицированные аналитики.

Приведем некоторые изполученных результатов.

а) В отличие от западныхпотребителей, отечественные не отдавали предпочтения стеклянным банкам посравнению с жестяными. Поскольку жестяные банки дешевле стеклянных, то можнобыло порекомендовать (в 1994 г., когда проходил опрос) с целью снижениярасходов закупку кофе в жестяных банках.

б) Отечественныепотребители готовы платить на 10-20% больше за экологически безопасный кофеболее высокого качества, имеющий сертификат Минздрава и символ экологическойбезопасности на упаковке.

в) Средний объемпотребления растворимого кофе — 850 г в месяц (на семью потребителя).

г) Потребителирастворимого кофе делятся на классы. Есть «продвинутые» потребители,обращающие большое внимание на качество и экологическую безопасность, марку истрану производства, терпимо относящиеся к изменению цены. Эти «тонкиеценители» — в основном женщины от 30 до 50 лет, служащие, менеджеры,научные работники, преподаватели, врачи (т.е. лица с высшим образованием),пьющие кофе как дома, так и на работе, причем «кофейный ритуал»зачастую входит в процедуру деловых переговоров или совещаний. Противоположныйпо потребительскому поведению класс состоит из мужчин двух крайних возрастныхгрупп — школьников и пенсионеров. Для них важна только цена, что очевиднымобразом объясняется недостатком денег.

Результаты былииспользованы заказчиком в рекламной кампании. В частности, обращалось вниманиена сертификат Минздрава и на экологическую безопасность упаковки.

Приведем пример еще однойанкеты из нашего опыта, предназначенной для изучения спроса на образовательныеуслуги (табл.6).


Табл.6. Исследованиерынка образовательных услуг

_____________________________________________________________

ИССЛЕДОВАНИЕ РЫНКА ОБРАЗОВАТЕЛЬНЫХ УСЛУГ

Анкета студентов первого курса экономико-математического факультетаМГИЭМ(ту).

А. Объективные данные

1. Группа

2. Пол

3. Год рождения

4. Женат (замужем) — да/нет

Б. Общее изучение рынка

5. Почему Вы выбрали специальность экономиста?

6. Почему Вы выбрали именно МГИЭМ(ту) среди всех вузов Москвы, готовящихэкономистов?

7. Как Вы представляете себе будущую деятельность по окончании МГИЭМ(ту)?

8. Есть ли у Вас надежда на то, что приобретаемые сейчас знания окажутсяполезными в практической работе? Если нет, то зачем Вы учитесь?

В. Отношение к платному образованию

9. Если бы обучение в МГИЭМ(ту) было платным (порядка 1 миллиона руб. вгод в ценах февраля 1994 г.), стали бы Вы поступать в МГИЭМ(ту)?

10. Если обучение в МГИЭМ(ту) станет платным, то останетесь ли Вы учитьсяв МГИЭМ(ту)? (Например, организация оплаты за учебу такова: некоторая фирмазаключает контракт со студентом и оплачивает его учебу; студент самостоятельноищет такую фирму.)

11. Представляет ли для Вас интерес возможность параллельно с дипломомМГИЭМ(ту) получить диплом бакалавра Межкультурного открытого университета(штаб-квартира в Нидерландах) по специальности «бизнес администрейшн»(обучение заочное, стоимость 1780 долларов США за курс)?

Г. О курсе «Основы экономики»

12. Нужно ли рассказывать содержание реферата-дайджеста учебника К.Макконнелла и С. Брю «Экономикс: Принципы, проблемы и политика» илисчитать его общеизвестным и говорить о том, чего в нём нет?

13. Полезен ли электронный учебник? Если нет, то почему?

14. Нужны ли Вам индивидуальные занятия в аудитории (а не в компьютерномклассе с электронным учебником) и в каком виде?

15. Какие темы Вы считаете полезным рассмотреть дополнительно?

16. Сформулируйте иные Ваши замечания и предложения по курсу «Основыэкономики»: по лекциям, практическим и индивидуальным занятиям.

Д. Дополнительная информация

17. Какие предметы обучения — самые трудные, какие — самые легкие напервом семестре?

18. Подрабатываете ли Вы? Если согласны, укажите примерную (среднюю)сумму в месяц.

19. Существенна ли для Вас стипендия?

20. Есть ли у Вас дома компьютер?

21. Участвуете ли Вы в каких-либополитических движениях, партиях? Если согласны, назовите.


Проверка однородностидвух биномиальных выборок

 

Как сравнить две группы — мужчин и женщин, молодых и пожилых, и т.п.? В маркетинге это важно длясегментации рынка. Если две группы не отличаются по ответам, значит, их можнообъединить в один сегмент и проводить по отношению к ним одну и ту жемаркетинговую политику, в частности, осуществлять одни и те же рекламныевоздействия. Если же две группы различаются, то и относиться к ним надопо-разному. Это — представители двух разных сегментов рынка, требующих разногоподхода при борьбе за их завоевание.

Эконометрическаяпостановка такова. Рассматривается вопрос с двумя возможными ответами,например, «да» и «нет». В первой группе из n1опрошенных m1 человек сказали «да», а во второйгруппе из n2 опрошенных m2 сказали«да». В вероятностной модели предполагается, что m1и m2<sub/>- биномиальные случайные величины B(n1, p1) и B(n2, p2) соответственно.(Запись B(n, p) означает, что случайная величина m, имеющаябиномиальное распределение B(n, p) с параметрами n — объемвыборки и p — вероятность определенного ответа (скажем, ответа«да»), может быть представлена в виде m = X1 + X2+…+Xn , где случайные величины X1, X2 ,…,Xn<sub/>независимы, одинаково распределены, принимают два значения1 и 0, причем Р(Xi= 1) = р, Р(Xi = 0)= 1-р, i=1,2,…,n.)

Однородность двух группозначает, что соответствующие им вероятности равны, неоднородность — что этивероятности отличаются. В терминах математической статистики: необходимопроверить гипотезу однородности

H: p1= p2

при альтернативнойгипотезе

H1: p1/>p2 .

(Иногда представляютинтерес односторонние альтернативные гипотезы /> и/>.)

Оценкойвероятности р1 является частота р1*=m1/n1,аоценкой вероятности р2 является частота р2*=m2/n2.Даже при совпадении вероятностей р1 и р2частоты, как правило, различаются, как говорят, «по чисто случайнымпричинам». Рассмотрим случайную величину р1* — р2*.Тогда

M(р1* — р2*) = р1 — р2, D(р1* — р2*) = р1 (1 — р1 )/ n1+ р2 (1-р2 )/ n2.

Из теоремы Муавра-Лапласаи теоремы о наследовании сходимости [4, п.2.4] следует, что

/>

где /> — функция стандартногонормального распределения с математическим ожиданием 0 и дисперсией 1. Дляпрактического применения этого соотношения следует заменить неизвестнуюэконометрику дисперсию разности частот на оценку этой дисперсии:

D*(р1* — р2*) =р*1 (1 — р*1 )/ n1+ р*2 (1-р*2)/ n2.

/> <td/> />
С помощью указанной вышематематической техники можно показать, что

При справедливостигипотезы однородности M(р1* — р2*) = 0. Поэтому правило принятия решения при проверкеоднородности двух выборок выглядит так:

1.   Вычислить статистику

/>

2. Сравнить значениемодуля статистика |Q| с граничным значением K. Если |Q|<K,то принять гипотезу однородности H0. Если же |Q|>K,то заявить об отсутствии однородности и принять альтернативную гипотезу H1.

Граничное значение Копределяется выбором уровня значимости статистического критерия проверкиоднородности. Из приведенных выше предельных соотношений следует, что присправедливости гипотезы однородности Hдля уровня значимости />имеем (при />

/>

Следовательно, граничноезначение в зависимости от уровня значимости целесообразно выбирать из условия

/>

Здесь /> — функция, обратная кфункции стандартного нормального распределения. В социально-экономическихисследованиях наиболее распространен 5% уровень значимости, т.е. /> Для него К = 1,96.

Пример. Пусть в первой группе из 500опрошенных ответили «да» 200, а во второй группе из 700 опрошенныхсказали «да» 350. Есть ли разница между генеральными совокупностями,представленными этими двумя группами, по доле отвечающих «да»?

Уберем из формулировкипримера термин «генеральная совокупность».

Пусть из 500 опрошенныхмужчин ответили «да, я люблю пепси-колу» 200, а из 700 опрошенныхженщин 350 сказали «да, я люблю пепси-колу». Есть ли разница междумужчинами и женщинами по доле отвечающих «да» на вопрос о любви кпепси-коле?

В рассматриваемом примеренужные для расчетов величины таковы: />Вычислимстатистику

/>

Поскольку |Q| = 3,45 > 1,96, то необходимоотклонить нулевую гипотезу т принять альтернативную. Таким образом, мужчины иженщины отличаются по рассматриваемому признаку — любви к пепси-коле.

Необходимо отметить, чторезультат проверки гипотезы однородности зависит не только от частот, но и отобъемов выборок. Предположим, что частоты (доли) зафиксированы, а объемывыборок растут. Тогда числитель статистикиQ не меняется, а знаменатель уменьшается, значит, всядробь возрастает. Поскольку знаменатель стремится к 0, то дробь возрастает добесконечности и рано или поздно превзойдет любую границу. Есть только одноисключение — когда в числителе стоит 0. Следовательно, вывод эконометрикадолжен выглядеть так: «различие обнаружено» или «различие необнаружено». Во втором случае различие, возможно, было бы обнаружено приувеличении объемов выборок.

Как и для доверительногооценивания вероятности, во ВЦИОМ разработаны две полезные таблицы, позволяющиеоценить вызванные чисто случайными причинами допустимые расхождения междучастотами в группах. Эти таблицы рассчитаны при выполнении нулевой гипотезыоднородности и соответствуют ситуациям, когда частоты близки к 50% (табл.7) илик 20% (табл.8). Если наблюдаемые частоты — от 30% до 70%, то рекомендуетсяпользоваться первой из этих таблиц, если от 10% до 30% или от 70% до 90% — товторой. Если наблюдаемые частоты меньше 10% или больше 90%, то теоремаМуавра-Лапласа и основанные на ней асимптотические формулы дают не оченьхорошие приближения, целесообразно применять иные, более продвинутыематематические средства, в частности, приближения с помощью распределенияПуассона.


Табл.7.

Допустимыерасхождения (в %) между частотами в двух группах в случае, когда наблюдаютсячастоты от 30% до 70%

Объемы

Групп

750 600 400 200 100 750 6 7 7 10 12 600 7 8 8 11 13 400 7 8 10 11 14 200 10 11 11 13 16 100 12 13 14 16 18

Табл.8.

Допустимыерасхождения (в %) между частотами в двух группах в случае, когда наблюдаютсячастоты от 10% до30% или от 70% до 90%

Объемы

Групп

750 600 400 200 100 750 5 5 6 8 10 600 5 6 7 8 10 400 6 7 8 9 11 200 8 8 9 10 12 100 10 10 11 12 14

В условиях разобранноговыше примера табл.7 дает допустимое расхождение 7%. Действительно, объем первойгруппы 500 отсутствует в таблице, но строки, соответствующие объемам 400и 600,совпадают для первых двух столбцов слева. Эти столбцы соответствуют объемамвторой группы 750 и 600, между которыми расположен объем 700, данный в примере.Он ближе к 750, поэтому берем величину расхождения, стоящую на пересечениипервого столбца и второй (и третьей) строк, т.е. 7%. Поскольку реальноерасхождение (10%) больше, чем 7%, то делаем вывод о наличии значимого различиямежду группами. Естественно, этот вывод совпадает с полученным ранее расчетнымпутем.

Допустимое расхождение />между частотами нетруднополучить расчетным путем. Для этого достаточно воспользоваться формулой длястатистики Q и определить, при каком максимальномрасхождении частот все еще делается вывод о том, что верна гипотезаоднородности. Следовательно, допустимоерасхождение />находится из уравнения

/>

Таким образом,

/>

Для данных примера />= 1,96 />0,029 = 0,057, или 5,7%,для уровня значимости 0,05. .

Для других уровнейзначимости надо использовать другие коэффициенты />Так, K(0,01) = 2,58 для уровнязначимости 1% и K(0,10) = 1,64 для уровня значимости 10%. Для данных примера />= 2,58 />0,029 = = 0,7482 /> 0,075, или 7,5%, дляуровня значимости 0,01. Если округлить до ближайшего целого числа процентов, тополучим 7%, как при использовании таблицы 7 выше.

Анализ таблиц 7 и 8показывает, что для констатации различия частоты должны отличаться не менее чемна 6%, а при некоторых объемах выборок — более чем на 10%, при объемах выборок100 и 100 — на 19%. Если частоты отличаются на 5% или менее, можно сразусказать, что эконометрический анализ приведет к выводу о том, что различие необнаружено (для выборок объемов не более 750).

В связи с этим возникаетвопрос: каково типовое отличие частот в двух выборках из одной и той жесовокупности? Разность частот в этом случае имеет нулевое математическоеожидание и дисперсию

/>

Величина р(1-р) достигаетмаксимума при р=1/2, и этот максимум равен 1/4. Если р=1/2, а объемы двухвыборок совпадают и равны 500, то дисперсия разности частот равна

/>

Следовательно, среднееквадратического отклонение />равно0,032, или 3,2%. Поскольку для стандартной нормальной случайной величины в 50%случаев ее значение не превосходит по модулю 0,67 (а в 50% случаев — больше0,67), то типовой разброс равен 0,67/>, а врассматриваемом случае- 2,1%. Приведенные соображения дают метод контроля заправильностью проведения повторных опросов. Если частоты излишне устойчивы, этоподозрительно!


Литература

 

1.        Сэндидж Ч.,Фрайбургер В., Ротцолл К. Реклама: теория и практика: Пер. с англ. — М.:Прогресс, 1989. — 630 с.

2.        ЯдовВ.А. Стратегии и методы качественного анализа данных. — Журнал«Социология: методология, методы, математические модели», 1991, No.1,с.14-31.

3.        Большев Л.Н.,Смирнов Н.В. Таблицы математической статистики. — М.: Наука, 1983. — — 416 с.

4.        Орлов А.И.Устойчивость в социально-экономических моделях. — М.: Наука, 1979. — 296 с.

5.        Опытприменения ЭВМ в социологических исследованиях. — М.: Институт социологическихисследований АН СССР, Советская социологическая ассоциация, 1977. — 158 с.

6.        Орлов А.И. Общийвзгляд на статистику объектов нечисловой природы. — В сб.: Анализ нечисловойинформации в социологических исследованиях (научные редакторы: В.Г. Андреенков,А.И.Орлов, Ю.Н.Толстова). — М.: Наука, 1985. // С.58-92.

еще рефераты
Еще работы по экономико-математическому моделированию