Лекция: Показатели силы влияний.
Определение силы влияний по их результатам требуется в биологии, сельском хозяйстве, медицине для выбора наиболее эффективных средств воздействия, для дозировки физических и химических агентов – стимуляторов, замедлителей, возбудителей, лекарственных препаратов, пищевых средств.
Измерение силы статистического влияния может быть произведено при помощи квадрата корреляционного отношения, предложенного К. Пирсоном, – показателя, который может измерять силу влияния одного признака на другой при любой форме корреляционной связи.
Такое использование корреляционного отношения стало возможным потому, что в основу этого показателя К. Пирсон положил отношение величин, которые в настоящее время определяются как дисперсии – факториальная (межгрупповая) и общая, т. е. как основные элементы дисперсионного анализа.
При дисперсионном анализе ортогональных комплексов используются аддитивные свойства частных дисперсий (сумм квадратов центральных отклонений):
СV + СZ = СY, СА + СB + САВ + СZ = СY.
На этом свойстве аддитивности частных дисперсий основан описанный выше закон разложения общих дисперсий в ортогональных комплексах.
Если взять отношения частных дисперсий к общей:
Каждое из этих отношений будет показывать долю участия отдельной частной дисперсии в образовании общей дисперсии.
А так как каждая частная дисперсия соответствует одному из частных влияний, то отношение частной дисперсии к общей измеряет долю данного влияния в общем суммарном статистическом влиянии всех факторов определяющих развитие данного результативного признака.
Поэтому доля (выраженная в относительных единицах или в процентах) каждой частной дисперсии в общей их сумме может быть принята за показатель силы влияния, того влияния, которое характеризуется данной частной дисперсией – или одной из факториальных или случайной.
Например, в однофакторном комплексе, чем большую долю в общей дисперсии занимает ее факториальная часть (СV/СY), тем большая часть общего разнообразия обусловлена разнообразием градаций фактора, а это и означает, что фактор действует с большей силой, оставляя на долю случайных влияний меньшую часть общего разнообразия признака.
Таким образом, сила влияния фактора (факторов) в дисперсионном анализе измеряется отношением дисперсий частных к общей:
Так как этот показатель отражает основной закон разложения общих дисперсий и основное аддитивное свойство частных дисперсий, а также составлен из основных элементов дисперсионного анализа, то отношение одной из факториальных дисперсий (СV, СА, СB, САB) или случайной дисперсии (CZ) к общей (СY) можно назвать основным показателем силы влияний факторов – организованных и неорганизованных.
Квадратный корень из основного показателя силы влияния в однофакторных комплексах есть пирсоновское корреляционное отношение, символ которого η перешел и на современный показатель, силы влияния.
В однофакторном комплексе определяются два показателя силы влияния: организованного фактора:
и неорганизованного фактора:
Сумма этих показателей равна единице:
В двухфакторном комплексе определяются пять видов влияний:
Влияние первого фактора:
Влияние второго фактора:
Влияние сочетаний градаций обоих факторов:
Суммарное действие обоих факторов:
Действие случайных факторов:
Интерпретация показателей 4-го и 5-го влияний в двухфакторном дисперсионном комплексе проводится так же, как и в однофакторном: комплексе: чем больше, а значит, чем меньше, тем сильнее проявилось суммарное действие обоих организованных факторов.
Интерпретацию первых трех влияний в двухфакторном комплексе лучше начинать с показателя влияния сочетаний градаций.
Этот показатель всегда настолько больше нуля, насколько сильно действие одного фактора зависит от действия (градаций) другого.
Наименьшее значение этого показателя =0 получается, когда один фактор действует совершенно одинаково при любых градациях второго.
Наибольшее значение этого показателя равно показателю суммарного влияния организованных факторов:. Так может получиться, когда действие одного фактора при одной градации второго фактора строго противоположно его действию при других градациях второго фактора.
В таких крайних случаях получаются очень малые показатели частных влияний первого фактора или второго, или того и другого – они приближаются к нулю, но это не связано со слабым действием каждого фактора в отдельности.
При, действие одного фактора настолько сильно зависит от действия другого, что становится невозможным изучать и использовать влияние первого фактора без учета влияния второго.
Показатели силы влияния каждого фактора в двухфакторном комплексе и имеют особое значение, зависящее от силы сочетания их градаций: .
Если показатель сочетания градаций не велик, то показатели частных влияний факторов ( и ) имеют обычное значение: чем они больше, тем сильнее влияние фактора.
Надо только помнить, что сила каждого фактора в отдельности измеряется в дисперсионном комплексе при усредненном действии градаций другого фактора, что равносильно известному требованию изучать варианты воздействий «при прочих равных условиях».
В тех же случаях, когда возрастает влияние сочетания градаций обоих факторов ( ), уже нельзя по показателям ( и ) судить в полной мере о силе соответствующих влияний. Как указывалось, в таких случаях возможны очень малые показатели силы статистического влияния каждого фактора в отдельности при очень заметном их физиологическом влиянии на результативный признак.
В таких случаях сильное действие одного фактора имеет противоположное направление в разных градациях другого фактора. При усреднении таких противоположных действий получается в большей или меньшей степени нивелировка измерений силы влияния, что и приводит к уменьшению показателей силы частного влияния каждого фактора в отдельности.
34.Достоверность различия распределений.
Статистическая гипотеза – это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистической гипотезы – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Статистический тест или статистический критерий – строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.
Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предполагаются выполненными.
Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Гипотезы о виде распределения проверяются с помощью критериев согласия.
Не всегда эмпирическое распределение хорошо соответствует нормальному. Для практических и научных работ часто требуется выяснить, сильно или слабо расходятся эмпирический и теоретический ряды. Для этого необходимо установить такой предел, недостижение которого означает, что расхождение между эмпирическим и нормальным распределениями еще не настолько велико, чтобы с ним считаться, и что данный эмпирический ряд еще можно практически принять за нормальный. Для этой цели применяются особые показатели, из которых в биологических исследованиях используются критерий χ2 и критерий λ.
Ошибка репрезентативности основного показателя силы влияния. Точная формула ошибки основного показателя силы влияния еще не найдена.
В однофакторных комплексах, когда ошибка репрезентативности определяется только для одного показателя факториального влияния, удобнее пользоваться таким вариантом общей формулы:
В двухфакторных комплексах, если рассчитаны дисперсии, можно использовать формулу:
где индекс i – V, А, В или АВ.
Если дисперсии не рассчитываются, то наиболее удобна общая формула:
В этом случае для двухфакторного комплекса находится постоянная величина и умножением ее на число степеней свободы по каждому влиянию находятся ошибки показателя этих влияний для данного комплекса.
Предлагаемая ошибка репрезентативности основного показателя силы влияния имеет существенные отличия от обычных ошибок выборочных показателей. Отношение основного показателя силы влияния к этой его ошибке:
равно не критерию Стьюдента (как обычно), а критерию Фишера при двух степенях свободы: ν1 = r – 1, ν2 = N – r.
Использование предлагаемой ошибки для определения достоверности влияния дает точно такие же результаты, как и критерий Фишера.
Преимущество предлагаемой ошибки заключается в том, что по ней можно определить хотя бы приближенно доверительные границы основного показателя силы влияния, чего нельзя сделать при помощи критерия Фишера.
Эти доверительные границы определяются по обычной формуле, в которой вместо критерия Стьюдента (t) введен критерий Фишера (F):
Предлагаемая формула ошибки основного показателя силы влияния обладает еще одним важным свойством: критерий достоверности, полученный по этой ошибке, учитывает различие в достоверности показателей для комплексов различной структуры, т. е. одинакового объема, но с разным числом градаций (r) и с разной повторностью (n). Если, например, исследованы два комплекса одинакового объема N = 100 с одинаковым выборочным показателем силы влияния = 0,6, но с разной структурой r1 = 2, n1 = 50,r2 = 50,
n2 = 2, то достоверность показателя первого комплекса должна быть значительно выше по сравнению с достоверностью показателя второго комплекса.
В первом комплексе показатель влияния получен при анализе 2 частных средних (r1 = 2), из которых каждая подкреплена 50 данными (n1 = 50) и поэтому в гораздо меньшей степени отражает случайности в формировании средних величин.
Во втором комплексе, наоборот, показатель влияния получен при анализе 50 частных средних, из которых каждая усредняет всего 2 признака и потому подвержена в гораздо большей степени случайностям в привлечении данных в градации.
Большое различие в достоверности показателя силы влияния в этих двух комплексах в достаточной степени отражено в ошибке репрезентативности:
в критерии достоверности:
;
и в доверительных границах:
Следует отметить, что резкое различие комплексов по достоверности их показателей совершенно не учитывается обычной ошибкой корреляционного отношения. Для обоих только что разобранных комплексов ошибка репрезентативности корреляционного отношения будет одинаковой: