NetNado
  Найти на сайте:

Учащимся

Учителям



Анализ многомерных данных


3.4.3 Смешанные модели дисперсионного анализа

Рассмотрим свойства планов эксперимента для смешанных моделей, которые наиболее часто используются при проведении биологических исследований.
3.4.3.1 План со случайными блоками

Пусть, например, исследователь хочет сравнить урожайности I сортов некоторой культуры. Опыты проводятся на поле, плодородие которого может меняться от участка к участку. Если сорта по участкам распределять случайно, тогда один сорт может получить, скажем, два "хороших" участка и ни одного плохого, а другой сорт - наоборот. В этом случае причиной ошибок наблюдений будут в основном различия между участками, а не ошибки измерения. Это может привести к тому, что не будет выявлено различия между сортами, даже если оно существует. Поэтому рассмотренный выше однофакторный план может оказаться неэффективным. План со случайными блоками позволяет уменьшить влияние на результат эксперимента тех или иных неоднородностей условий, при которых проводятся отдельные наблюдения.

Покажем на этом же примере построение плана со случайными блоками. Однотипные по плодородию участки группируются в J блоков (случайный фактор B) по I участков каждый, каждый из которых засевают одним из I сортов (постоянный фактор A), причем внутри каждого блока сорта распределяются по участкам случайно. Таким образом, получаем план со случайными блоками без повторений, т.е. K=1.

Обозначим через yij урожайность участка (i,j), засеянного i-ым сортом, и принадлежащего к j -ому блоку, и положим

yij = μ + αi + bj + εij, i=1,…, I; j=1,…, J, (3.20)

где μ - общее среднее, αi - эффект i-ого уровня фактора A, bj - эффект j-ого уровня фактора B; bj и εijk - независимые в совокупности нормально распределенные случайные величины с нулевым средним и дисперсиями σB2 и σ2, соответственно. Модель (3.20) называется смешанной двухфакторной моделью. Использование аддитивной модели объясняется тем, что оценить взаимодействие "сорт-блок" невозможно, ведь каждым сортом засеян только один участок внутри каждого блока.

Неизвестными параметрами в (3.20) являются μ, αi и две компоненты дисперсии σ2 и σB2. М.н.к-оценки μ и αi, как и для однофакторной модели I, при дополнительном ограничении , равны: , , . Несмещенные оценки для компонент дисперсии имеют вид: , . Вычеркивая в табл. 3.6 строку «остаток» и заменяя обозначения SSAB на SSR, νAB на νR и MSAB на MSR, получим таблицу дисперсионного анализа для модели (3.20).

Для этой модели проверяются две гипотезы.

1. H0: все αi=0, при альтернативе H1: не все αi=0. Критерий для проверки этой гипотезы строится, как и для модели I однофакторного дисперсионного анализа. Если верна гипотеза H0, то статистика FA=MSA/MSR имеет F-распределение c νA=I-1 и νR=(I-1)(J-1) степенями свободы.

2. H0: σB2=0, о том, что фактор блока B не вносит никакого вклада в дисперсию наблюдений, при альтернативе H1: σa2≠0. Критерий для проверки этой гипотезы строится, как и для модели II однофакторного дисперсионного анализа. Если верна гипотеза H0, статистика FB=MSB/MSR имеет F-распределение c νB=J-1 и νR=(I-1)(J-1) степенями свободы.

Если каждый блок делится на KI делянок, и каждый сорт случайно засевается на K делянках внутри блока (см. табл. 3.10), то такой план называется планом со случайными блоками с повторениями. Использование плана с повторениями позволяет оценить взаимодействие "сорт-блок" (Шеффе, 1980).
Таблица 3.10. План со случайными блоками с повторениями




1-й блок из I однородных участков

...

J-й блок из I однородных участков




1-й сорт

1-ая делянка

...

1-ая делянка

...

...

K-ая делянка

K-ая делянка




...

...

...

I-й сорт

1-ая делянка

...

1-ая делянка

...

...

K-ая делянка

K-ая делянка


Необходимо отметить, что уменьшить влияние неоднородностей условий проведения эксперимента может только разбиение на однородные блоки. Любое свойство экспериментальных объектов, которое может быть определено до начала эксперимента, должно быть использовано для определения блока. Например, в агробиологических исследованиях соседние площадки часто можно считать близкими по плодородию, а, следовательно, группы смежных участков можно принимать за блоки. Листья на одном растении при антивирусной прививке, животные одного помета при опытах с питанием, пробы крови одного человека при сравнении нескольких методов подсчета числа лейкоцитов являются примерами однородных блоков. Отметим, что более полное исключение влияния неоднородностей условий достигается с помощью планов латинских квадратов.
3.4.3.2 Планы с группировкой

Пусть необходимо выбрать план эксперимента для сравнения I методов (постоянный фактор A) определения некоторой характеристики крови (зависимая переменная Y) у животного. Рассмотрим план, для проведения которого потребуется IJ животных. Для каждого метода случайно выбираются «свои» J животных (случайный фактор B с J уровнями), т.е. у каждого из J животных одной выборки проводится K независимых измерений характеристики крови первым методом, для другой выборки - вторым методом и т. д. (табл. 3-11). В этом случае каждый уровень фактора B сочетается не более чем с одним уровнем фактора A. Такой план эксперимента называется двухфакторным планом с группировкой, или иерархическим, или, как еще говорят, гнездовым (nested). Фактор A называют группирующим фактором, а фактор B - сгруппированным фактором A, что обозначается B(A). Фактор A может быть как постоянным, так и случайным, фактор B – случайным. Одна из основных областей применения иерархических планов - генетика. Эти планы используются, например, при изучении наследственного влияния родительских поколений на продуктивность или другие признаки потомства.
Таблица 3.11. План с группировкой.

 

1-е животное

...

J-е животное

...

1-е животное

...

J-е животное




1-й метод

1-е измерение

...

1-е измерение

...


нет

...


нет

...

...

...

...

...

...

...

K-е измерение

...

K-е измерение

...


нет

...


нет

 

...

...

...

...

...

...

...

I-й метод


нет

...


нет

...

1-е измерение

...

1-е измерение

...

...

...

...

...

...

...


нет

...


нет

...

K-е измерение

...

K-е измерение

В качестве примера рассмотрим смешанную модель для двухфакторного плана с группировкой, когда фактор A является постоянным, а фактор B(A) - случайным:

yijk = μ + αi + bj(i) + εijk, i=1,…, I; j=1,…, J; k=1,…,K, (3.21)

где μ - общее среднее, αi - эффект i-ого уровня фактора A, bj(i) - эффект j-ого уровня фактора B, сгруппированного i-ым уровнем фактора A; bj(i) и εijk - независимые в совокупности, нормально распределенные случайные величины с нулевым средним и дисперсиями σB(A)2 и σ2, соответственно.

Неизвестными параметрами в (3.21) являются μ, αi и две компоненты дисперсии σ2 и σ2B(A). М.н.к-оценки μ и αi при дополнительном ограничении равны: , , . Несмещенные оценки для компонент дисперсии имеют вид: , . Результаты анализа для модели (3.21) заносятся в таблицу дисперсионного анализа для плана с группировкой, табл. 3.12.

Таблица 3.12. Дисперсионный анализ двухфакторного плана с группировкой.



Источник разброса

Сумма квадратов


Число степеней свободы


Средний квадрат



F-отношение






Фактор A














Фактор B

(внутри A)













Остаток

(ошибка)














Полная













Для этой модели проверяются две гипотезы: 1. H0: все αi=0, при альтернативе H1: не все αi=0. Если верна гипотеза H0, то статистика FA=MSA/MSB(A) (см. табл. 3.12) имеет F-распределение c c νA=I-1 и νB(A)=I(J-1) степенями свободы. 2. H0: σ2B(A)=0, при альтернативе H1: σa2≠0. Если верна гипотеза H0, то статистика FB(A)=MSB(A)/MSR (см. табл. 3.11) имеет F-распределение c νB)A)=I (J-1) и νR=IJ(K-1) степенями свободы.

Рассмотрим пример смешанной модели для трехфакторного плана с группировкой, когда постоянный фактор A является группирующим, фактор B(A) – сгруппированным фактором A, а фактор С(B) - сгруппированным фактором B.

Пример. Для сравнения трех методов (фактор A) определения содержания гликогена в печени крысы проводились два повторных измерения для каждой из трех случайных проб печени (фактор C), взятых у каждой из двух крыс (фактор B) (Sokal, Rohlf, 1995). В этом случае фактор A - постоянный группирующий фактор с тремя уровнями; случайный фактор B с двумя уровнями сгруппирован фактором A; случайный трехуровневый фактор C сгруппирован фактором B (рис. 3.5).

Методы




























 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


































3 уровня




























 





























































 





























































 


























































 





























































 





























































 




























Животные










 

 

 

 

 

 

 

 

 

 


































 

 

 

 

 

 

 

 

 

 


































 

 

 

 

 

 

 

 

 

 
















2 уровня













 




























 































 




























 































 




























 




























 




























 































 




























 































 




























 













Пробы




 

 

 

 

 

 













 

 

 

 

 

 
















 

 

 

 

 

 













 

 

 

 

 

 
















 

 

 

 

 

 













 

 

 

 

 

 







3 уровня




 







 







 










 







 







 













 







 







 










 







 







 













 







 







 










 







 







 










 







 







 










 







 







 













 







 







 










 







 







 













 







 







 










 







 







 




Измерения

 

 




 

 




 

 







 

 




 

 




 

 










 

 




 

 




 

 







 

 




 

 




 

 










 

 




 

 




 

 







 

 




 

 




 

 




2 повтора

 




 

 




 

 




 




 




 

 




 

 




 







 




 

 




 

 




 




 




 

 




 

 




 







 




 

 




 

 




 




 




 

 




 

 




 


Рис. 3.5. Пример трехфакторного плана с группировкой.
Для анализа результатов эксперимента использовалась смешанная модель для трехфакторного плана с группировкой

yijk = μ + αi + bj(i) + cl(j)ijlk, I=3, J=2, L=3, K=2.

Значения оценок средних равны:

.
Таблиц 3.12. Результаты дисперсионного анализа для примера плана с группировкой.

Источник

Разброса

Сумма квадратов SS

Число степеней свободы ν

Средний квадрат MS=SS/ ν


F-отношение


p-значение




A

1557,5

2

778,8

2,93

0,197

B(A)

797,7

3

265,9

5,37

0,014

C(B)

594,0

12

49,5

2,34

0,05

Остаток

381,0

18

21,2







Полная

3330,2

35











Анализ табл. 3.12 показывает, что гипотеза H0: все αi =0 не отвергается на уровне α=0,05, т.е. различия между методами определения содержания гликогена в печени крысы не обнаружено; гипотеза H0: σ2B(A)=0 отвергается на уровне α=0,05 как и гипотеза H0: σ2C(B)=0 - на уровне α=0,05.

Приведем значения оценок компонент дисперсии:

.

Так как гипотеза H0: все αi =0 не отвергается, а гипотезы H0: σ2B(A)=0 и H0: σ2C(B)=0 отвергаются, оценка дисперсии единичного наблюдения и доля каждой компоненты дисперсии определяются так:

Вклад фактора B(A) в общую дисперсию равен 36,1/71/4*100%=50,5%; вклад фактора C(B) равен 14,2/71,4*100%=19,8%; доля дисперсии ошибки наблюдения равна 21,2/71,4*100%=29,6%. На основании проведенного анализа можно сделать следующие выводы. Так как наибольший вклад в общую дисперсию вносит фактор B, то при планировании подобных экспериментов желательно увеличить число уровней фактора B, т.е. число крыс, а также число повторных измерений.

страница 1 ... страница 2страница 3страница 4страница 5


скачать

Другие похожие работы:






Создание таблиц баз данных

Лабораторная работа: 1 стр.