NetNado
  Найти на сайте:

Учащимся

Учителям



1. /Готсданкер - Экспериментальная психология/Внешняя валидность.DOC
2. /Готсданкер - Экспериментальная психология/Выделение независимой переменной.DOC
3. /Готсданкер - Экспериментальная психология/Вычисления.DOC
4. /Готсданкер - Экспериментальная психология/Гипотезы об абсолютных и относительных отношениях.DOC
5. /Готсданкер - Экспериментальная психология/Достижение внутренней валидности в экспериментах с межгрупповым сравнением.DOC
6. /Готсданкер - Экспериментальная психология/Другие аспекты валидности.DOC
7. /Готсданкер - Экспериментальная психология/Источники экспериментальных гипотез.DOC
8. /Готсданкер - Экспериментальная психология/Количественные и качественные независимые переменные.DOC
9. /Готсданкер - Экспериментальная психология/Корреляционные исследования.DOC
10. /Готсданкер - Экспериментальная психология/Нуль-гипотеза.DOC
11. /Готсданкер - Экспериментальная психология/Основы планирования эксперимента.DOC
12. /Готсданкер - Экспериментальная психология/Планирование действий - первое условие эксперимента.DOC
13. /Готсданкер - Экспериментальная психология/Протоколирование - второе условие эксперимента.DOC
14. /Готсданкер - Экспериментальная психология/Словарь экспериментатора.DOC
15. /Готсданкер - Экспериментальная психология/Статистическое приложение/Двухфакторный дисперсионный анализ.DOC
16. /Готсданкер - Экспериментальная психология/Статистическое приложение/Коэффициент корреляции.DOC
17. /Готсданкер - Экспериментальная психология/Факторные эксперименты.DOC
18. /Готсданкер - Экспериментальная психология/Экспериментальные схемы в приложении к многоуровневому эксперименту.DOC
19. /Готсданкер - Экспериментальная психология/Экспериментальный отчет.DOC
Внешняя валидность: представленность изучаемой популяции
Выделение независимой переменной в чем сходны следующие ситуации?
Вычисление среднего по данным интервальной классификации
Гипотезы об абсолютных и относительных отношениях
Достижение внутренней валидности в экспериментах с межгрупповым сравнением
Другие аспекты валидности
Источники экспериментальных гипотез
Количественные и качественные независимые переменные
Корреляционные исследования
Нуль-гипотеза
Основы планирования эксперимента
Планирование действий первое условие эксперимента
Словарь экспериментатора
Статистическое приложение: двухфакторный дисперсионный анализ
419 \ статистическое приложение: коэффициент корреляции
Факторные эксперименты
Предыдущие экспериментальные схемы в приложении к многоуровневому эксперименту
Заключительный этап оформления

скачать doc

НУЛЬ-ГИПОТЕЗА


Кажется весьма странным проверять нуль-гипотезу о том, что интенсивность плача не различается в слу­чаях, когда комнату покидает мать и когда уходит ассистентка. Ведь это противоречит тому, что предпо­лагает экспериментатор. Экспериментальная гипотеза состоит как раз в том, что плач сильнее, когда уходит мать.

Существуют два основания для такого «хода от про­тивного». Первое состоит в том, что любой реальный эксперимент (который не является ни идеальным, ни бесконечным) не может быть абсолютно доказательным. Мы никогда не сможем сказать, что безусловно и на­всегда доказали, что наши условия различные. Мы не в состоянии «доказать» экспериментальную гипотезу. Самое большее, что мы можем сделать, — это показать, что альтернативные объяснения неправильны, что при­водит нас ко второму основанию обращения к нуль -гипотезе. Это специфическая гипотеза, и ее отвержени? имеет большой смысл. Так как она специфическая (раз­ница между условиями равна нулю) в отличие от экс­периментальной гипотезы (для одного условия показа­тель больше), она доступна стандартной статистической проверке. Это и составляет ее смысл. Ведь если невер­но, что данные условия не различаются, значит, мы точно знаем, что они в чем-то различны.

­

Третье возможное заключение

Очевидно, вам было не очень приятно узнать из 2-Й главы, что в любом эксперименте приходится .делать одно из двух конкурирующих заключений: 1) подтверж­дена экспериментальная гипотеза о том, что зависимая переменная имеет более высокое значение для усло­вия А, чем для условия Б; 2) подтверждена противо­положная гипотеза о большем значении зависимой пе­ременной для условия Б, чем для условия А. (Навер­ное, все это больше огорчает вашего преподавателя.) Что же тогда можно сказать о выводе, что ни одна из конкурирующих гипотез не подтвердилась? Вообще говоря, мы не должны заботиться об этом третьем воз­можном заключении при использовании результатов таких простых экспериментов, которые описаны в нача­ле книги. Ткачиха может либо носить наушники, либо нет. Она не выберет компромиссного решения носить только один из них, если разница в пользу наушников окажется очень незначительной. Если нет проблемы стоимости или удобства, почему бы не принять к све­дению любую полученную разницу, как бы мала она ни была? Всегда есть некоторая вероятность того, что условие, обнаруживающее преимущество в эксперимен­те, сохранит его и в будущем. Другими словами, в слу­чае таких простых практических решений правило со­стоит в том, чтобы учитывать любые позитивные дан­ные. Тогда в процессе решения для третьего заключения не остается места.

Однако в экспериментах, подобных описанному в предыдущей главе, где ложное заключение нанесет ущерб научному знанию, необходимо рассматривать третье возможное заключение, состоящее в том, что независимая переменная оказалась просто неэффектив­ной. Итак, на основании результатов эксперимента Флинера и Кернса можно было сделать три заключения» каждое из которых относится к тому, что могло бы быть получено в бесконечном или идеальном экспери­менте:

1. Подтвердилась гипотеза, что дети данной возраст­ной группы плачут больше, если уходит мать.

2. Подтвердилась гипотеза, что дети плачут боль­ше, если уходит ассистентка.

3. Ни одна из приведенных гипотез не подтверди­лась.

Указанные исследователи понимали, - что в любом реальном ограниченном эксперименте как положитель­ные результаты (плач сильнее, когда уходит мать), так и отрицательные результаты (плач сильнее, когда ухо­дит ассистентка) могут быть чисто случайными. Поэто­му только достаточно большое различие в интенсивно­сти плача при уходе матери по сравнению с уходом ассистентки могло бы рассматриваться как подтверж­дение экспериментальной гипотезы о том, что то же самое обнаружится в идеальном или бесконечном экс­перименте. Меньшее различие имело бы весьма высо­кую вероятность оказаться случайным.

Мы можем представить связь между полученным различием и заключением, сделанные на его основе при помощи следующей диаграммы:

Тонкая вертикальная черточка над значением +3,40 справа показывает, что это различие (для старшей группы) было достаточно для подтверждения экспери­ментальной гипотезы, что плач сильнее, если уходит мать. С другой стороны, вертикальная отметка над значением +0,93 (различие для более младшей груп­пы) показывает, что это различие недостаточно для подтверждения экспериментальной гипотезы. Для того чтобы подтверждалась либо экспериментальная гипоте­за, либо противоположная гипотеза, требуется различие порядка ±3 единицы.

Отвержение или неотвержение нуль-гипотезы

Правило статистического решения. Три рассмотрен­ных выше возможных заключения из результатов экс­перимента делаются на основе правила статистического решения. Здесь оно состояло в том, что нуль-гипотеза может быть отвергнута только в случае, если вероят­ность получения различия, удовлетворяющего нуль-ги­потезе, меньше, чем 0,05 (т. е. меньше 1 из 20).

Основа статистического вывода. Если бы Флинер и Керне многократно повторяли свой эксперимент на но­вых группах детей той же возрастной категории, они бы не получали в каждом эксперименте разницу между средними для ухода матери и для ухода ассистентки. в точности равную 3,40. Из-за случайных вариаций эта разница была бы то больше, то меньше. Если бы для бесконечного числа повторений общая средняя разница равнялась в точности 0, это означало бы справедливость нуль-гипотезы. Однако для каждого отдельного экспе­римента можно было бы ожидать значение, отличное от нуля.

Итак, разность «мать — ассистент» будет варьиро­вать от эксперимента к эксперименту. Величина раз­броса этих разностей зависит от надежности каждого эксперимента. Как мы видели в главе 2. надежность выше и, следовательно, разброс от эксперимента к экс­перименту меньше, чем больше число наблюдений и чем меньше случайных вариаций. Поэтому разброс разно­стей «мать — ассистент» был бы меньше, если бы каж­дый эксперимент проводился на большом числе испы­туемых и имел небольшое стандартное отклонение.

Из числа испытуемых и стандартного отклонения можно вывести величину различия, которая при спра­ведливости нуль-гипотезы может быть превышена лишь с вероятностью 0,05. Нахождение этой величины назы­вается статистическим выводом. Такая величина для эксперимента Флннера и Кернса оказалась порядка ±3. (Она была определена с помощью статистической про­цедуры нахождения так называемого {-критерия. Опи­сание ее можно найти в статистическом приложении к данной главе. Это одни из многих критериев стати­стической значимости, используемых экспериментато­рами.)

Диаграмма на с. 241 показывает, как в эксперименте Флинера и Кернса применялось правило статистиче­ского решения для получения одного из трех возмож­ных выводов.

Как видно, различие +3,40 для старших детей по­падает в одну из двух областей отвержения нуль-гипо­тезы. Если бы нуль-гипотеза была верна, только 0,05 части всех экспериментов дала бы различия, попадаю­щие в ту или другую область отвержения. Для данного эксперимента вероятность (р) для каждой области от­вержения будет 0,025 и для области «неотвержения» нуль-гипотезы — 0,95. Используя правило решения 0,05, мы говорим, что полученное различие значимо, по­скольку мы можем отвергнуть нуль-гипотезу. Меньшее различие +0,93, как это видно, не попадает в область отвержения. Следовательно, статистическое решение в этом случае состоит в том, чтобы не отвергать нуль-гипотезу. Этот результат мог бы быть получен с ве­роятностью более высокой, чем 0,05, если бы нуль-гипо­теза была верна.

Итак, мы можем заключить, что старшие дети пла­чут сильнее, если ухолит мать. Что касается младшей группы, то мы не можем сделать ни этого, ни противо­положного вывода (что они плачут сильнее с уходом ассистентки). Факторы, влияющие на величину требуемого различия

Предыдущая диаграмма продемонстрировала вели­чину различия между средними, необходимую для от­вержения нуль-гипотезы в условиях частного конкрет­ного набора данных. При более надежных данных для отвержения нуль-гипотезы оказывается достаточным меньшее различие. Однако если для отвержения нуль-гипотезы используется более строгий критерий, то необ­ходимо большее различие между средними. Эти два фактора иллюстрируются на рис. 6.1.

Влияние надежности. Если бы увеличили число об­следованных детей или стандартное отклонение внутри каждой группы оказалось меньше, то надежность уве­личилась бы. Это- означает, что в наборе бесконечно повторяемых экспериментов средние значения варьиро­вали бы меньше. А в таком случае варьировали бы меньше и различия между средними. Вокруг каждой общей средней было бы более плотное распределение. В результате при справедливости нуль-гипотезы две ли­нии, показывающие на диаграмме, куда попадает (с плюсом или с минусом) 0,025 части всех реальных средних, должны оказаться ближе к нулю.
На рис. 6.1 верхняя диаграмма (а) уже была пред­ставлена; на ней показаны результаты обследования 15 детей. На средней диаграмме (б) линиями показа­ны области отвержения нуль-гипотезы при условии, что число детей было увеличено до 60 или что стандартное отклонение для каждой пробы было уменьшено напо­ловину. И в том и в другом случае требуемое разли­чие уменьшается вдвое, примерно до ±1,5. Видно, что различие 0,93, обнаруженное в младшей группе, тем не

менее остается вне области отвержения нулевой гипоте­зы, что опять не дает возможность подтвердить гипоте­зу о том, что ребенок больше плачет при уходе матери. Тем не менее если бы выборка была увеличена еще больше или стандартное отклонение оказалось меньше. различие 0,93 (если бы оно, конечно, было получено) оказалось бы значимым. Сложность в том, что при бо­лее надежных данных было бы менее вероятно полу­чить различие такого уровня, если нулевая гипотеза была верна.

Влияние правила решения. До сих пор фигурирова­ло только одно правило решения: нуль-гипотеза отвер­гается, если вероятность получения различия, при кото­ром нуль-гипотеза верна, меньше 0,05. Вероятность, ис­пользуемая для отвержения нуль-гипотезы, называется альфа-уровнем. Если применяется более строгий крите­рий, это означает, что нуль-гипотеза отвергается, если подтверждающая ее разница встречается в меньшей доле случаев. Наиболее часто это 0,01 (I эксперимент из 100) вместо 0,05 (1 из 20).

Результат использования в правиле решения альфа-уровня 0,01 вместо прежнего 0,05 виден на нижней диа­грамме (в) рис. 6.1. (Первоначальная выборка из 15 де­тей и первоначальные стандартные отклонения здесь сохранены.) При альфа-уровне 0,01 для отвержения нуль-гипотезы требуется различие, большее ±4. При этом, более строгом критерии уже нельзя сделать за­ключение в пользу гипотезы о более сильном плаче с уходом матери.

Способ, каким в большинстве статей сообщается о статистически значимом различии, выглядит так:

«р<0,05» или «р<0,01». Это означает, что вероятность случаев, когда нуль-гипотеза верна, меньше 0,05 или меньше 0,01. Незначимое различие представляется как «р>0,05» или «р>0,01».

ОТ РЕШЕНИИ К ВЫВОДАМ


Люди, которые не любят статистику, считают, что все эти модные проверки статистической значимости не имеют особого смысла. Они не правы. С другой стороны, люди, поклоняющиеся статистике, считают, что за каждым статистическим решением автоматически сле­дует экспериментальный вывод. Они тоже не чравы. Мы попытаемся показать, что истина находится между этими крайностями. Наш девиз: используйте статистику, но сделайте так, чтобы uh-л стала вашей служанкой, а не вашей госпожой.

Игнорирование проверки на значимость


Предположим, что Флинер и Керне не стали бы рас­сматривать нуль-гипотезу. Они решили бы расценивать любое различие в пользу ухода матери как подтверж­дающее их экспериментальную гипотезу- В таком слу­чае они приняли бы различие 0,93 для младшей груп­пы тоже как значимое. Это было бы довольно риско­ванно. При дальнейшем знакомстве с их статьей можно увидеть, что для самой младшей исследовавшейся груп­пы детей (в возрасте от трех до пяти месяцев) разли­чие оказалось равным 1,78 с противоположным знаком, т. е. плач был больше при уходе ассистентки. Таким образом, выбирая тактику постоянного игнорирования нуль-гипотезы, экспериментаторы вынуждены были бы прийти к подтверждению противоположной гипотезы, которая в данном случае выглядит довольно бессмыс­ленно.

Мы можем сразу увидеть, к каким последствиям приведет противоположная тактика, при которой нуль-гипотеза никогда .не отвергается. Польза от проверки нуль-гипотезы всегда видна сразу. Если нуль-гипотеза окажется верной, экспериментальные выводы, не учи­тывающие ее, всегда будут ложными: будет считаться, что получила подтверждение либо экспериментальная гипотеза, либо противоположная ей гипотеза. Более то­го, когда нуль-гипотеза неверна и существует некото­рое действительное различие в пользу того или иного условия, выводы тоже зачастую могут оказаться лож­ными, Предположим, что для младших детей бесконеч­ный эксперимент показал небольшое преобладание плача при уходе матери. В любом конкретном эксперименте это различие вполне могло оказаться с про­тивоположным знаком. Эта последняя ошибка будет делаться тем чаще, чем меньше надежность данных. Вообще говоря, в младшую группу входило только де­вять детей, так что надежность полученных по ним дан­ных довольно сомнительна.

Итак, в научных экспериментах мы не можем обой­тись без проверки на значимость.

Разновидности риска и типы ошибок


Поскольку нам известно, что реальные эксперимен­ты не бывают ни идеальными, ни бесконечными, мы знаем, что некоторые из наших решений окажутся оши­бочными независимо от применявшегося правила реше­ния. Может быть, Флинер и Керне не следовало отвер­гать нуль-гипотезу для старшей группы. Может быть, нуль-гипотеза была верна. Если бы они использовали 0,01 альфа-уровень, они не смогли бы отвергнуть нуль-гипотезу. И было бы прекрасно, если бы нуль-гипотеза и в самом деле была правильной. Ну а что, если нет? При обоих альфа-уровнях они рисковали бы — но про­тивоположным образом.

Ошибки I типа. Первый риск состоит в возможности ошибки 1 типа: отверженце нуль-гипотезы, когда она верна. Если исследователь использует в правиле реше­ния уровень 0,05, это означает, что он готов сделать та­кую ошибку не более чем в пяти процентах его экспе­риментов. Когда он затем принимает отвержение нуль-гипотезы в качестве подтверждения экспериментальной гипотезы (например плач более сильный при уходе ма­тери), это показывает его чрезмерный оптимизм. Ведь существует 1 шанс из 20, что такое доказательство оши­бочно.

В любом эксперименте, направленном на проверку совершенно новой гипотезы, противоречащей общепри­нятому представлению, можно посоветовать быть более осторожным. Ломать научные традиции — вещь очень серьезная, и для этого нужно быть абсолютно уверен­ным в своих фактах. В таких случаях рекомендуется использовать более строгое правило решения, с 0,01 альфа-уровнем. Наука еще может выдержать 1 процет результатов, которые ошибочно приняты за подтверж­дающие экспериментальную гипотезу, но 5 процентов — это уж слишком!

Ошибки II типа. Если мы настаиваем на 0,01 аль­фа-уровне (или даже более строгом уровне, таком, как 0,001), появляется новый риск: наше желание быть абсолютно уверенными может привести нас к ошибоч­ному неотверженнго нуль-гипотезы, когда она на самом деле неверна. Вполне естественно, что это называют ошибкой II типа. Если нуль-гипотеза ошибочна, верна должна быть какая-то другая гипотеза. Риск не отверг­нуть нуль-гипотезу, когда верна другая гипотеза (на­пример определенное различие в плаче при уходе ма­тери и ассистента), может быть также выражен через вероятность, называемую бета-уровнем.

Для данной совокупности экспериментальных резуль­татов уменьшение альфа-уровня означает увеличение бета-вероятности для любой ненулевой гипотезы. Ис­пользование очень строгого правила решения означает. что экспериментатор готов пойти на значительный риск, заключающийся в неотвержении нулевой гипотезы, ког­да верна какая-то другая гипотеза. Таким образом, прп низком альфа-уровне экспериментатор будет часто оши­бочно заключать, что результаты не подтверждают экс­периментальную гипотезу, В отличие от альфа-уровня, для бета-уровня невозможно задать некоторое общее значение вероятности; она различается для каждой кон­кретной ненулевой гипотезы о различии между усло­виями. Так, если окажется верной гипотеза о большом различии между условиями (скажем, разница в интен­сивности плача +5 ед.), вероятность не отвергнуть нуль-гипотезу (бета) будет низкой даже при использо­вании строгого альфа-уровня 0,01. С другой стороны, если действительная разность окажется небольшой (ска­жем, +1,0), вероятность ошибочного решения не от­вергнуть нуль-гипотезу будет намниго больше. Однако, логика отношений сохраняется: при одних и тех же дан­ных уменьшение альфа-уровня увеличивает бета-ве­роятность для всех статистических гипотез, отличных от нуль-гипотезы.

О статистической проверке экспериментальных ре­зультатов говорят как об имеющей силу в той степени, в какой бета-величина остается низкой для ненулевых гипотез. При хорошей силе выявляются реальные раз­личия, Конечно, сила автоматически повышается с ис­пользованием нестрогого правила решения (например 0,10 альфа-уровня), но это увеличивает риск ошибки I типа. Существует два более удачных способа увели­чения силы. Один состоит в увеличении надежности данных. Как мы видели на рис. 6.1 (в), даже при не­большом различии между условиями оказывается воз­можным отвергнуть нуль-гипотезу либо путем увеличе­ния числа испытуемых, либо путем уменьшения случай­ных вариаций. Другой способ состоит в использовании наиболее эффективных экспериментальных схем и про­верок. Те и другие описаны в специальной литературе (см., например. Коэн, 1977).

В предыдущем параграфе уже говорилось, что ошиб­ки I типа следует избегать в том случае, когда отвержение нуль-гипотезы связано с отрицанием существую­щих идей или результатов предыдущих экспериментов. С другой стороны, если экспериментатор не обнаружи­вает значимых различий между условиями, которые обычно признаются эффективными, это его заключение должно основываться на использовании высокого (или нестрогого) альфа-уровня, чтобы уменьшить риск ошиб­ки II типа. Почти любой полученный ранее правильный результат может быть «опровергнут» путем ошибочного неотвержения нуль-гипотезы: либо через использование ненадежных данных, либо через применение слишком строгого правила решения, либо (самый худший вари­ант) через то и другое вместе.

Теперь давайте рассмотрим, какие выводы должен сделать экспериментатор при отвержении нуль-гипо­тезы.

Заключения при неотвержении нуль-гипотезы. По­жалуйста, заметьте: в отношении нуль-гипотезы прини­мается только два статистических решения — отверг­нуть ее или не отвергнуть. Никогда не бывает решения принять нуль-гипотезу. Все же для экспериментатора иногда полезно заключить, что независимая переменная не оказывает никакого влияния. Как видно из диаграм­мы на с. 241, неотвержение нуль-гипотезы привело бы к заключению, что не подтверждается ни эксперимен­тальная гипотеза, ни противоположная ей гипотеза. Например, для младшей группы детей небольшое раз­личие в интенсивности плача не благоприятствует ни гипотезе о более сильном плаче при уходе матери, ни противоположной гипотезе о более сильном плаче при уходе ассистентки. Однако из подобных неподтверж­дений можно вывести различные заключения.

Во-первых, экспериментатор может сделать вывод» что он не знает, оказывает ли независимая переменная вообще какое-либо влияние на поведение. Этот вывод особенно подходит к случаю, когда надежность низка из-за небольшого количества испытуемых или из-за большей, чем ожидалось, вариабельности поведения. Так, Флинер и Керне могли бы решить продолжить экс­перимент на новых детях, относящихся к той же млад­шей группе, и попытаться уменьшить случайные вариа­ции, насколько это возможно.

Во-вторых, экспериментатор может заключить, что надежность была вполне удовлетворительной и что неот­вержение нуль-гипотезы означает, что исследовавшиеся условия действительно не различаются. Это заключение может оказаться наиболее справедливым, особенно если более ранние эксперименты показали неэффективность независимой переменной.

Итак, статистическое решение снова состоит в неот-вержении нуль-гипотезы. Однако обстоятельства экспе­римента заставляют сделать вывод, что независимая пе­ременная оказалась недейственной.

Валидность выводов


Вернемся к определению внутренней валидности, данному в главе 2: это степень уверенности, что заклю­чение об экспериментальной гипотезе совпадает с вы­водом, который был бы получен в идеальном или бес­конечном эксперименте. В предыдущих главах мы видели, как увеличивается внутренняя валидность с по­мощью процедур, повышающих надежность данных и уменьшающих смешение. Понятно, что заключения из экспериментальных данных не могут быть лучше самих данных. В настоящей главе мы видели, как разумное использование правил статистического решения ведет к обоснованным заключениям об экспериментальной ги­потезе. Это — тоже способ увеличения внутренней ва­лидности, поскольку заключение составляет наиболее важную часть эксперимента. Остановимся на этом бо­лее подробно.

Бесконечный эксперимент одновременно и опреде­ляет полную внутреннюю валидность, и обеспечивает основу для проверки нуль-гипотезы. Конечно, для этой последней цели существует особый вид бесконечного эксперимента. Он 'разбивается на отдельные конкрет­ные эксперименты. Каждый из них такой же, как'и реально проводимый эксперимент, но только в каждом эксперименте берутся другие испытуемые, выбранные из той же популяции (или другие пробы, если мы обращаемся к интраиндивидуальной схеме экспери­мента).

При проверке нуль-гипотезы мы должны предполо­жить, что из бесконечного эксперимента, безусловно. следует заключение, что экспериментальные условия не различаются. Естественно, общая средняя разность между условиями по всем этим экспериментам должна равняться нулю- Однако для каждого отдельного экс­перимента это будет не так. Разности между средними будут лишь распределяться вокруг нуля, но при этом некоторые эксперименты будут благоприятствовать од­ному условию, другие — другому. А теперь нам нужно соотнести различие, полученное в нашем собственном эксперименте, со всем набором различий, которые мог­ли бы быть получены в этом типе бесконечного экспе­римента.

Достоверные заключения, когда нуль-гипотеза вер­на. Если оказалось, что нуль-гипотеза верна, т. е - если общая средняя разность между условиями в бесконеч­ном эксперименте равна нулю, мы хотели бы иметь воз­можность прийти к такому же заключению и в нашем эксперименте. Ведь мы не хотим заключить в пользу гипотезы о различии между условиями, если много шан­сов за то, что на основе бесконечного эксперимента мы пришли бы к выводу об отсутствии различия. Таким образом, из надежных данных мы сделаем вывод, что экспериментальная гипотеза о различии условий не­верна, если разность такой величины, как в нашем экс­перименте, при верности нуль-гипотезы может появить­ся с вероятностью 0,05 или 0,01. Мы хотели бы быть уверенными в таком заключении при проверке новой экспериментальной гипотезы, особенно если она идет вразрез с общепринятым убеждением. Вот почему в та­ком случае альфа-уровень должен быть 0,01 или ниже. При уровне 0,05—5 процентов заключений будут невер-н-ы. В бесконечном числе экспериментов 5 процентов дали бы результаты, которые привели бы к отвержению нуль-гипотезы в единичном эксперименте.

Достоверные выводы, когда нуль-гипотеза неверна. Если нуль-гипотеза оказывается ложной, т. е. если об­щая средняя разность между условиями такова, как предсказывает экспериментальная гипотеза, хотелось бы прийти к такому же выводу и в нашем эксперимен­те. Это не так важно при проверке какой-то новой идеи. Если она верна, то се время все равно придет. Однако если различие между условиями ожидается на основе уже имеющихся знаний, мы хотим быть совершенно уверенными в своем выводе в пользу эксперименталь­ной гипотезы.

Как мы уже видели, для этого требуются надежные данные. Кроме того, необходимо использовать менее строгое правило решения, например альфа-уровень 0,05. Если нуль-гипотеза окажется верной, мы, конечно, хотели бы сделать именно такое заключение. Однако мы готовы увеличить риск ошибочного отвержения нуль-гипотезы для того, чтобы уменьшить риск ошибоч­ного вывода об отсутствии различия между условиями, т. е. в ситуации, когда бесконечный эксперимент такие различия бы показал.