NetNado
  Найти на сайте:

Учащимся

Учителям



Анализ многомерных данных



Можно показать, что средние квадраты MSA и MSR (другое, часто используемое обозначение этих величин, – и ), определение которых дано в табл. 3.2, являются двумя различными и независимыми оценками дисперсии единичного наблюдения σ2, математические ожидания которых при выполнении Н0 равны

Заметим, что MSR является несмещенной оценкой σ2 для всех моделей дисперсионного анализа.

Если гипотеза Н0 верна, то справедливы следующие утверждения:

  • SSA и SSR независимы и распределены как: SSA ~ σ2χ2I-1, SSR ~ σ2χ2n-I;

  • M(MSR)=M(MSA)=σ2,

- статистика F=MSA/MSR имеет F-распределение с I-1 и n-I степенями свободы. Так как MSA/MSR≥1, критическая область уровня значимости α состоит из одного полуинтервала [FI-1,n-I,1-α, ∞), где FI-1,n-I,1-α - квантиль порядка 1-α F-распределения с I-1 и n-I степенями свободы.

Если вычисленное по наблюдениям значение F-статистики, Fнабл., меньше значения FI-1,n-I,1-α, то нет оснований для отклонения гипотезы Н0. Обычно на этом анализ может быть завершен. Н0 если такой вывод противоречит, например, результатам предыдущих исследований, тогда следует выяснить:

- не нарушаются ли предпосылки дисперсионного анализа;

- нет ли других факторов, влияющих на зависимую переменную, и либо перейти к двухфакторному анализу, либо спланировать эксперимент так, чтобы по возможности исключить влияние неоднородностей условий проведения наблюдений, т.е. использовать план со случайными блоками.

Если же Fнабл. FI-1,n-I,1-α, то нулевая гипотеза отвергается на уровне значимости α, т.е. существует, по крайней мере, одна пара средних yk. и yl., которые различаются статистически значимо. Часто исследователю желательно также знать, какое из выборочных средних можно считать большим, чем все другие. Если нельзя выделить пары средних, представляющие интерес для сравнения, то приходится проверять гипотезы о равенстве всевозможных пар средних. Чтобы при этом сохранить α в качестве общего уровня значимости, следует использовать методы множественных сравнений.

Кроме сравнения двух средних для исследователя могут представлять интерес сравнения вида μ1-μ4, μ1-(μ2+μ3+μ4)/3 и.т.п. Линейные комбинации , где , называются контрастами. Выдвижение гипотез о контрастах (Н0: =0) и их проверка позволяют получить дополнительную информацию. Если линейная комбинация задана до получения экспериментальных данных, такие сравнения называют планируемыми сравнениями (planned comparisons). Например, если врач хочет выявить эффективность нескольких лечебных препаратов по сравнению с контролем, то такое сравнение является планируемым.

На практике сравнения, представляющие интерес, определяются часто после получения результатов эксперимента, когда уже известны оценки средних μi, и вид наиболее важных сравнений подсказывают сами результаты эксперимента. Такие сравнения называют непланируемыми (unplanned comparisons). Сравнение всевозможных пар средних является примером непланируемых сравнений. Число таких сравнений для модели (3.11) равно k=I(I-1)/2. С рекомендациями по использованию методов множественных сравнений можно познакомиться в работах (Шеффе, 1980; Sokal, Rohlf, 1995).

Заметим, что аналогично проводятся исследования сравнений любой модели дисперсионного анализа, а не только однофакторной.
Пример (Sokal, Rohlf, 1995). В восьми различных местах обитания (в США) были собраны 130 жуков-скакунов (Cicindela circumpicta). У каждого жука измерялась ширина головки (в мм). Требовалось выяснить, влияет ли место обитания на этот признак. Для ответа на этот вопрос используем однофакторный дисперсионный анализ, предполагая, что все его предпосылки выполнены. Обозначим через yij результат измерения ширины головки j-ого жука из i -ой местности, j=1,…, ni; i=1,..., 8. В табл. 3.3 приведены средние значения yi. результатов наблюдений, упорядоченные по возрастанию, а также значения ni и .
Значения yi., ni, S2i для примера 1. Таблица 3.3

    1. I


1

2

3

4

5

6

7

8




yi.

3,512

3,694

3,722

3,723

3,738

3,748

3,784

3,845

ni

20

20

20

14

10

15

11

20

S2i

0,0357

0,0445

0,0135

0,0284

0,0204

0,0184

0,0338

0,0157

страница 1страница 2страница 3страница 4страница 5


скачать

Другие похожие работы:






Создание таблиц баз данных

Лабораторная работа: 1 стр.