Реферат: Процесс анализа информационных массивов

--PAGE_BREAK--<img width=«611» height=«256» src=«ref-1_1811903022-14228.coolpic» v:shapes="_x0000_i1033">

Рис.1.7 Гистограмма распределения
предприятий
по величине коммерческих и управленческих расходов


<img width=«596» height=«316» src=«ref-1_1811917250-8202.coolpic» v:shapes="_x0000_i1034">


Рис.1.8 Полигон распределения
предприятий
по величине коммерческих и управленческих расходов


По графикам видно, что распределение предприятий по расходам имеет схожие характеристики с распределением предприятий по себестоимости, отличается только количеством групп.
<img width=«605» height=«275» src=«ref-1_1811925452-5307.coolpic» v:shapes="_x0000_i1035">


Рис.1.9 Кумулята распределения
предприятий
по величине коммерческих и управленческих расходов

После сбора, группировки и поверхностного анализа данных следует провести более углубленный анализ.
1.2           
Оценка однородности совокупности


априорный анализ статистический совокупность распределение

Для оценки однородности совокупности используют различные методы, такие как: группировка, расчет показателей вариации (дисперсия, коэффициент вариации), анализ аномальных наблюдений на основе l— и q-статистик.

На основе группировки и ее графического изображения (рис.1.1 – рис.1.9) можно предположить, что ряды распределения по трем признакам не являются однородными. Но вместе с тем, следует иметь виду, что при незначительном объеме выборки (n < 50) слишком углубленный анализ гистограммы может привести к неверным выводам, поскольку слабо выраженные «горбики и ямы» частот могут быть обусловлены не основными факторами, определяющими распределение единиц по группам, а просто случайными отклонениями вариантов от <img width=«16» height=«20» src=«ref-1_1811930759-387.coolpic» v:shapes="_x0000_i1036">.

После анализа аномальных наблюдений на основе l— статистики, выявляется аномальность значений, соответствующих 13 предприятию, а также аномальность показателей выручки и расходов 9 предприятия.

В данной работе последующий анализ будет проводится с учетом аномальности, вызванной объективно существующими причинами.

Причины появления в совокупности аномальных наблюдений могут быть:

1)     внешние, возникающие в результате технических ошибок;

2)     внутренние, объективно существующие.

Для дальнейшего анализа формы распределения используют показатели вариации. Показатели вариации делятся на абсолютные и относительные. К абсолютным относятся размах колебаний, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение и квартильное отклонение. Коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации и относительный показатель квартильной вариации – относительные показатели.

В данной курсовой работе для характеристики однородности совокупности рассчитывались такие показатели, как дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Дисперсия – это средний квадрат отклонений индивидуальных значений признака от средней величины. Дисперсия не только является основной мерой колеблемости признака, но также используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д.

Для сгруппированных данных она вычисляется по формуле (1.3):
<img width=«136» height=«53» src=«ref-1_1811931146-524.coolpic» v:shapes="_x0000_i1037"> ,

(1.3)
где xi– i-ый вариант осредняемого признака;

<img width=«16» height=«20» src=«ref-1_1811930759-387.coolpic» alt="*" v:shapes="_x0000_i1038">– выборочная средняя величина или средняя агрегатная;

ni– частота, то есть число, показывающее сколько раз встречаются варианты из данного интервала, или вес i-го варианта;

n– число объектов совокупности.

Для оценки влияния различных факторов, обуславливающих вариацию признака, рассчитывается дисперсия по каждому из показателей. Для этого строятся расчетные таблицы:
Таблица 1.5

Расчетная таблица для вычисления дисперсии по величине выручки от продажи товаров, продукции, работ, услуг



Средняя выборочная вычисляется по формуле (1.4):
<img width=«17» height=«27» src=«ref-1_1811932057-165.coolpic» v:shapes="_x0000_i1041">= <img width=«50» height=«49» src=«ref-1_1811932552-214.coolpic» v:shapes="_x0000_i1042"> (1.4)
Отсюда <img width=«17» height=«27» src=«ref-1_1811932057-165.coolpic» v:shapes="_x0000_i1043"> = 177166,1.

По таблице 1.5 видно, что значения признака отклоняются от средней выборочной в основном в отрицательную сторону.

С помощью формулы (1.3) находится дисперсия, σ2 = 3422825485.
Таблица 1.6

Расчетная таблица
для вычисления дисперсии
по величине
себестоимости проданных товаров, продукции, работ, услуг




<img width=«17» height=«27» src=«ref-1_1811932057-165.coolpic» v:shapes="_x0000_i1046">= 137056,4

σ2 = 2096102493

Значения себестоимости в основном не превышают среднюю выборочную.
Таблица 1.7

Расчетная таблица
для вычисления дисперсии
по
величине коммерческих и управленческих расходов


<img width=«17» height=«27» src=«ref-1_1811932057-165.coolpic» v:shapes="_x0000_i1049">= 41436,7

σ2 = 183131024,9

По таблице видно, что значения признака отклоняются от средней выборочной также в основном в отрицательную сторону.

Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации (формула (1.5)):
<img width=«117» height=«53» src=«ref-1_1811933921-533.coolpic» v:shapes="_x0000_i1050"> (1.5)
Для того чтобы рассчитать коэффициент вариации для группы предприятий по величине выручки от продажи товаров, продукции, работ, услугнужно рассчитать среднее квадратическое отклонение σ по формуле (1.6):

<img width=«67» height=«37» src=«ref-1_1811934454-332.coolpic» v:shapes="_x0000_i1051">(1.6)
Среднее квадратическое отклонение σ = 58504,92, то есть величина выручки в среднем отклоняется на 58504,92 тыс. руб.

Исходя из этого, коэффициент вариации равен:

Vв = (58504, 92 / 177166,1) * 100% = 33 %

Величина Vв оценивает интенсивность колебаний вариантов относительно их средней величины. Принята следующая оценочная шкала колеблемости признака:

– 0% < Vв ≤40% – колеблемость незначительная;

– 40% < Vв ≤ 60% – колеблемость средняя (умеренная);

– Vв > 60% – колеблемость значительная.

Для нормальных и близких к нормальному распределений показатель Vв служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства

Vв ≤ 33%,

совокупность является количественно однородной по данному признаку. Так как коэффициент вариации не превышает 33%, то можно считать совокупность предприятий по выручке достаточно однородной.

Коэффициент вариации для остальных признаков равен:

1)                Для группы предприятий по себестоимости проданных товаров, продукции, работ, услугVв = 33,4%. Колеблемость незначительная.

2)                Для группы предприятий по величине коммерческих и управленческих расходовVв = 32,7%. Колеблемость незначительная. Совокупность можно считать однородной.

Так как коэффициент вариации группировки предприятий по себестоимости незначительно превышает 33%, то можно сказать, что совокупность достаточно однородна, а превышение можно объяснить небольшим объемом выборки, аномальностью некоторых значений и влиянием внешних и внутренних факторов.
1.3           
Оценка характера распределения совокупности исходных данных


Выявление общего характера распределения предполагает оценку не только степени его однородности, но и его симметричности, остро- или плосковершинности.

Простейшей мерой ассиметричности распределения является отклонение между характеристиками центра распределения. Поскольку в симметричном распределении <img width=«16» height=«20» src=«ref-1_1811930759-387.coolpic» v:shapes="_x0000_i1052"> = Me= Mo, то чем заметнее ассиметрия, тем больше отклонение (<img width=«16» height=«20» src=«ref-1_1811930759-387.coolpic» v:shapes="_x0000_i1053"> — Mo). В связи с этим простейший показатель ассиметрии, коэффициент К. Пирсона, рассчитывается так, формула (1.7):


<img width=«119» height=«55» src=«ref-1_1811935560-411.coolpic» v:shapes="_x0000_i1054"> ,(1.7)

где <img width=«16» height=«20» src=«ref-1_1811930759-387.coolpic» v:shapes="_x0000_i1055"> – средняя арифметическая ряда распределения;

Mo– мода (наиболее часто встречающееся значение признака у единиц данной совокупности).

При правосторонней асимметрии Asn> 0, при левосторонней Asn<0. Если Asn= 0, вариационный ряд симметричен.

Показатель ассиметрии также можно рассчитать с помощью центрального момента третьего порядка (формула (1.8)):
<img width=«67» height=«48» src=«ref-1_1811936358-345.coolpic» v:shapes="_x0000_i1056"> ,(1.8)
где μ3– центральный момент третьего порядка.

Центральный момент <img width=«22» height=«27» src=«ref-1_1811936703-106.coolpic» v:shapes="_x0000_i1057"> рассчитывается по формуле (1.9):
<img width=«133» height=«53» src=«ref-1_1811936809-554.coolpic» v:shapes="_x0000_i1058">.(1.9)
Центральный момент первого порядка всегда равен нулю. Центральный момент второго порядка представляет собой дисперсию. Центральный момент третьего порядка равен нулю в симметричном распределении. Центральный момент четвертого порядка применяется при вычислении показателя эксцесса.

Если рассчитать показатель ассиметрии ряда распределения выручки через центральный момент третьего порядка, то получится такой результат:

As= (10005540,2*103) / (19*995847754,2) = 0,53;

As = 0,53 > 0, это значит, что в ряду распределения преобладают варианты, которые больше, чем средняя, то есть ряд положительно ассиметричен.

Для оценки существенности показателя ассиметрии находится средняя квадратическая ошибка, которая зависит от объема наблюдений, по формуле (1.10):
σAs= <img width=«85» height=«49» src=«ref-1_1811937363-481.coolpic» v:shapes="_x0000_i1059">= 0,495.

(1.10)
Так как отношение <img width=«31» height=«49» src=«ref-1_1811937844-185.coolpic» v:shapes="_x0000_i1060"> = 1,2 < 3, ассиметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для оценки крутизны распределения вычисляется показатель эксцесса по формуле (1.11):
<img width=«102» height=«52» src=«ref-1_1811938029-434.coolpic» v:shapes="_x0000_i1061"> ,

(1.11)
Показатель эксцесса ряда распределения выручки равен:

Ek= (4057850999*103) / (19*99446750716) = 2,248 – 3 = -0,85.

При симметричном распределении Ek= 0. Если Ek> 0, распределение является островершинным; если Ek< 0 – плосковершинным.

В частности, большая отрицательная величина Ek означает преобладание у признака крайних значений, причем одновременно и более низких, и более высоких. При этом в центральной части распределения может образоваться «впадина», превращающая распределение в двухвершинное (U-образной формы), что является индикатором неоднородности совокупности.

Исходя из этого, можно говорить о плосковершинности ряда распределения выручки.

Оценка существенности показателя эксцесса равна 0,85, это значит, что эксцесс несущественен.

Для ряда распределения предприятий по себестоимости проданных товаров, продукции, работ:

As= (13013850,4*103) / (19*858154723,4) = 0,8.

Для ряда распределения предприятий по величине коммерческих и управленческих расходов:

As= (62040,2*103) / (19*8343127,4) = 0,39.

Что означает, что ряды распределения этих признаков имеют правостороннюю скошенность.

Эксцесс для групп предприятий по себестоимости:

Ek= (3635894445*103) / (19*81549404931) – 3 = -0,65.

Эксцесс для групп предприятий по расходам:

Ek= (6181726,6*103) / (19*169214861,8) – 3 = -1,08.

Так как эксцессы этих рядов распределений меньше нуля, то ряды распределения являются плосковершинными (рис 1.5, рис.1.8).

Исходя из показателей ассиметрии и эксцесса, можно предположить, что распределение значений признаков не является нормальным.

Априорный анализ исходных данных показал, что совокупности предприятий по признакам являются достаточно однородными, но отклоняются от нормального распределения. Это может быть объяснено различными внешними факторами, как расположение предприятий, клиентура, конкуренты, экономическое и политическое устройство и др.


    продолжение
--PAGE_BREAK--
еще рефераты
Еще работы по математике