Отбор

Контроль

Субъектные переменные Переменные, поддающиеся и не поддающиеся манипуляциям

Возраст в качестве переменной

Результаты

Главный эффект

Взаимодействие

Причины искажения валидности

Резюме

Упражнения

Глава 2

Общие принципы

Знакомство с несколькими конкретными исследованиями поможет уяснить суть последующего материала. Поэтому ниже приведены два примера исследований в области психологии развития. Оба описания представлены в несколько упрощенном виде с тем, чтобы облегчить уяснение основных моментов.

Дюфресн и Кобасигава (Dufresne & Kobasigawa, 1989) пытались выявить детерминанты развития памяти в детском возрасте. Почему старшие дети запоминают лучше младших? Конкретная детерминанта, на которой сосредоточивалось исследование, обозначена как время, отпущенное на запоминание. Вопрос стоит следующим образом: что делают дети, получая возможность изучить материал для запоминания? Сколько, например, времени у них уходит на изучение материала, прежде чем они решают, что готовы отвечать, и насколько рационально они распределяют свои усилия по запоминанию? Возможно, одной из причин того, что старшие дети запоминают лучше младших, является более рациональное использование времени, отпущенного на запоминание.

Для проверки своей гипотезы Дюфресн и Кобасигава выбрали методику парных ассоциаций. Выполнение задания осуществляется в два этапа: на первом предъявляется ряд из пар слов, а на втором — предъявляется только один элемент каждой пары и ребенок должен попытаться вспомнить недостающий элемент. В своем исследовании Дюфресн и Кобасигава использовали два типа пар: «легкие», элементы которых были связаны по смыслу (например, кошка—собака, туфля-носок), и «трудные», элементы которых не имели ничего общего (например, книга—лягушка, коньки—младенец). Всем испытуемым (ученикам 1-х, 3-х, 5-х и 7-х классов) предъявлялись оба набора, и в обоих случаях на предварительное изучение материала давалось неограниченное время.

В табл. 2.1 представлены средние временные показатели при запоминании пар обоих типов. На основании этих данных можно сделать несколько выводов. Как и следовало ожидать, старшие дети обычно дольше изучали материал. Неудивительно и то, что на запоминание «трудных» пар им требовалось больше времени. Наконец, у самых младших испытуемых разница между запоминанием легких и

трудных пар не наблюдалась; только дети из двух старших возрастных групп уделяли больше внимания трудным заданиям. В конце главы мы еще вернемся к последнему на выводу.

Второе исследование также было направлено на изучение памяти, но в других возрастных группах. Черри и Парк (Cherry, Park, 1989) изучали память на пространственную локализацию у выборки молодых (средний возраст 21 год) и пожилых (средний возраст 69 лет) людей. Сначала испытуемым показывали определенную расстановку 24-х обычных предметов, затем предметы перемешивали, а задачей испытуемых было разложить все предметы по прежним местам. Сравнивались результаты при двух типах экспериментальных условий. Половина испытуемых видела предметы па фоне цветной объемной модели со множеством ориентиров. Другая половина — двухмерную черно-белую схему объемной модели. Исследователей интересовало два вопроса. Лучше ли пространственная память в ситуации, когда нужно запомнить местоположение объектов, находящихся в естественных, детализированных условиях? И (как говорят некоторые исследования) будет ли облегчающий эффект удобного контекста у пожилых испытуемых выше, чем у молодых?

В табл. 2.2 представлены полученные результаты. Можно заметить, что контекст действительно имел значение: выполнение на фоне модели было лучше, чем на фоне схемы. Имел значение и возраст; молодые испытуемые превосходили пожилых. Наконец, хотя средняя результативность групп различалась, реакция на изменения контекста была общей. И молодые, и пожилые лучше справлялись с заданием при наличии объемной модели.

Таблица 2.1 Среднее время ознакомления с материалом (в секундах) у детей из исследования Дюфресна и Кобасигавы (A. Dufresne & A. Kobasigawa, 1989, Journal of Experimental Child Psychology, 47, p. 282)

Тип материала
Группа	«Легкие» пары	«Трудные» пары	Среднее
1-й класс	5,40	5,20	5,30
3-й класс	5,53	6,96	6,25
5-й класс	4,23	8,42	6,33
7-й класс	4,45	12,48	8,47
Среднее	4,90	8,27

Таблица 2.2 Среднее количество предметов, правильно расставленных испытуемыми

из исследования Черри и Парк (К. Е. Cherry & D. С. Park, 1989 Psychology and Aging, 8, p. 520)


Группа	Схема	Объемная модель	Среднее
Молодые	14,5	15,9	15,2
Пожилые	ПД	14,5	12,8
Среднее	12,8	15,2

Переменные

Начнем рассмотрение общих принципов с введения некоторых терминов. Психологическое исследование связано с переменными и отношениями между ними. Существует два вида переменных: зависимые и независимые. Зависимые переменные — результирующие — те, показатели которых составляет результат исследования. В первом примере зависимой переменной было количество секунд, в течение которых ребенок заучивал каждую пару; во втором примере зависимой переменной было количество предметов, положение которых смог восстановить по памяти каждый испытуемый. Эти переменные являются зависимыми в том смысле, что вариации их значений зависят от других факторов. Центральной задачей исследователя является выяснение этих факторов. Они в любом случае изменяемы: если бы колебание значений зависимой переменной было бы невозможно, не было бы смысла и проводить исследование.

Зависимую переменную исследователь измеряет, но не контролирует непосредственно. Независимые переменные, напротив, находятся под контролем исследователя. Цель исследования — определить, действительно ли изменения значений выбранных независимых переменных обусловливают изменения в значении зависимой переменной. В исследовании, которое провели Дюфресн и Кобасигава, независимыми переменными были возраст ребенка и контраст трудного и легкого материала для запоминания, тогда как в исследовании Черри и Парк таковыми были возраст и тип контекста. Эти переменные независимы в том смысле, что их величина заранее определена, а не является результатом исследования. Опять же «изменчивость» необходима: если независимая переменная неизменна, нет никакой возможности выяснить, оказывает ли она воздействие. Изменение и сравнение — неотъемлемая часть любого исследования.

Разделение переменных на зависимые и независимые оправдано во многих, но не во всех исследованиях. Предположим, вы хотите узнать, есть ли связь между IQ ребенка и его успеваемостью в школе. Вы могли бы протестировать выборку школьников и получить два показателя: результаты IQ теста и школьные отметки. Здесь интересен вопрос, связаны ли изменения одного показателя их с изменениями другого, учатся ли лучше дети с высоким IQ? В таком исследовании нет независимой переменной, величину которой мог бы контролировать экспериментатор; IQ, отметки и связь между ними — все это результирующие переменные. Особенности такого «корреляционного» исследования детально рассматриваются далее. Сейчас же важно то, что не для всех исследований подходит схема независимая переменная — зависимая переменная.

Приведенные примеры исследований могут служить в качестве иллюстрации другой особенности независимых переменных. Различные значения независимой переменной можно задать двумя способами. Первый — через экспериментальные манипуляции, которые в буквальном смысле создают переменную. Это то, к чему прибегли Дюфресн и Кобасигава, составляя свои трудные и легкие пары, а также Черри и Парк, создавая плоский и объемный фон. Однако с другой независимой переменной из обоих исследований — хронологическим возрастом — дело обстояло иначе. Очевидно, что исследователи не могут противопоставить два возраста так же, как легкие и трудные задания. С такими переменными контроль осуществляется не через манипуляции, а через отбор испытуемых с желательными характеристиками (например, в возрасте 20 или 70 лет). Поскольку отбор является единственным возможным способом контроля, возраст и другие «субъектные переменные» могут создавать особую проблему при интерпретации — к этому вопросу мы еще вернемся.

Прежде чем идти дальше, введем несколько новых терминов. Независимые переменные также называют факторами, а конкретные значения, которые они принимают, — уровнями. Поэтому исследование Дюфресна и Кобаснгавы можно охарактеризовать как 4 х 2-факторное, то есть эксперимент с двумя факторами, один из которых имеет 4 уровня (возраст), а другой — 2 уровня (условия). Аналогично, исследование Черри и Парк можно охарактеризовать как 2 (возраст) х 2(условия)-факторное. Заметьте, что такого рода обозначение формата говорит нам о количестве экспериментальных ячеек или групп. Например, в исследовании Черри и Парк было 4(2x2) отдельные группы: молодые люди, видевшие модель, молодые люди, видевшие схему, пожилые люди, видевшие модель, и пожилые люди, видевшие схему.

Валидность

В каждом исследовании есть переменные и отношения между ними. Поэтому, когда мы хотим описать исследование, центральным является конструкт переменных: какого вида различия изучаются и какими способами? Если мы хотим выйти за рамки описания и перейти к оценке исследования, центральным конструктом становится валидность. Вопрос валидности — это вопрос точности: направлено ли исследование на изучение того, что, как предполагается, изучается с его помощью? Все обсуждаемые в книге частные методологические моменты возвращают нас к базовому вопросу точности выводов, которые делаются на основе исследования.

Существует множество форм валидности (Cook & Campbell, 1979). В этой главе рассматриваются три: внутренняя, внешняя и конструктная. В главе 7 к ним добавляется еще одна форма: валидность статистического вывода.

Внутренняя валидность характеризует внутренний контекст исследования. Речь идет о том, действительно ли независимые переменные связаны с зависимыми так, как это предполагается. Получим ли мы правильные выводы о причинном воздействии (или отсутствии причинного воздействия) одних переменных на другие? Возьмем в качестве примера исследование Дюфресна и Кобасигавы. Их выводы внутренне валидны, если трудные пары действительно требовали больше времени на запоминание, если среднее время запоминания действительно увеличивалось как функция от возраста и если способность отличать легкие пары от трудных действительно улучшалась с возрастом. Если существует альтернативное объяснение любого из этих выводов, тогда внутренняя валидность исследования ставится под сомнение. Предположим, что испытуемые 7-классники были бы в основном из классов для «одаренных» детей, а младшие дети обладали бы средними способностями. Тогда у нас было бы альтернативное объяснение кажущемуся улучшению с возрастом: различия отражают не естественные возрастные изменения, а разницу в уровне способностей. (Эта проблема называется «систематической ошибкой отбора», далее она обсуждается подробнее.)

Вопрос внешней валидности — это вопрос возможности обобщения. Поэтому он встает, как только мы выходим за рамки конкретного исследования. Теперь важно, правомерны ли полученные выводы для другой выборки, других ситуаций и другого поведения — не для любых, конечно, выборок, ситуаций и поведения, а для тех, результат изучения которых, по нашему мнению, должен быть прогностичным. Возьмем, к примеру, исследование Черри и Парк. Их результаты внешне валидны, если у молодых людей действительно в целом лучше пространственная память, а также, если и молодым и пожилым действительно в целом помогает отчетливость и выразительность фона. В обоих случаях «в целом» означает то, что данное явление обнаруживается во всех выборках молодых и пожилых людей, при любых способах измерения пространственной памяти и при любых признаках фона. Если какой-то из результатов нельзя принять за правило по какому-либо параметру, тогда этот результат внешне невалиден. Возможно, к примеру, что характеристики фона имеют значение только в «мелкомасштабной» среде, таких как масштабы предъявлявшиеся Черри и Парк модели и схемы, а также, что этот эффект не сравним с ситуацией естественных размеров предметов обстановки в реальной жизни. Если бы это ограничение имело место (в другом исследовании было показано, что это не так), тогда исследование Черри и Парк ограничивало бы внешнюю валидность.

Добротное исследование должно отвечать требованиям и внутренней, и внешней валидности. Как замечают Кэмпбелл и Стэнли (Campbell & Stanley, 1966), «внутренняя валидность — это базовый минимум, без которого невозможно интерпретировать ни один эксперимент» (р. 5). С точки зрения логики, при отсутствии внутренней валидности невозможно обобщить результаты исследования, поскольку они вообще невалидны. Однако внешняя валидность также играет огромную роль. Внутренне валидные выводы бессмысленны, если они не работают за пределами экспериментальной ситуации.

Внутренняя валидность также является необходимым условием третьей формы валидности — конструктной. Конструктная валидность имеет отношение к теоретической точности: правильно ли мы объясняем причинно-следственные связи, которые были обнаружены в исследовании? Иными словами, если допустить, что выводы внутренне валидны, знаем ли мы, почему получили определенные результаты? Предположим, мы уверены в том, что манипуляции с контекстом в исследовании Черри и Парк действительно обусловливают различия в успешности запоминания. Почему контекст имел значение? Вероятно, наиболее очевидное объяснение — которым руководствуются в большинстве подобных исследований — заключается в том, что важны именно отчетливость и детальность визуальной информации: местоположение предмета лучше всего запоминается тогда, когда он помещен в достаточно дифференцированную среду. Однако вероятно и другое обоснование. Возможно, модель была более интересна и привлекательна, чем схема, что вызывало более пристальное внимание, а отсюда лучшее запоминание. Согласно этой точке зрения, любые манипуляции, которые повышают уровень внимания, должны повышать и успешность выполнения задания вне зависимости от отчетливости фона или наличия ориентиров. Возможно также, что испытуемые чувствовали себя более уверенно перед пространственной моделью, так как она более привычна, чем абстрактная схема, и именно повышение уверенности улучшало результаты. Если правдоподобные альтернативные объяснения нельзя исключить, тогда исследование характеризует недостаточная конструктная валидность. Сказанное выше — всего лишь предварительные замечания о конструктах, которые в дальнейшем мы будем рассматривать с разных точек зрения. Пока же сделаем еще одно замечание, касающееся валидности. Оно имеет отношение к трудности достижения в одном исследовании всех форм валидности. Эта трудность обусловлена тем, что меры, принимаемые исследователем с целью повышения одной формы валидности, работают против другой формы. Необходимость компромиссного выбора наиболее очевидна в отношении внутренней и внешней валидности. В целом, чем жестче контроль, тем выше внутренняя валидность исследования — то есть тем больше уверенности может быть у экспериментатора в том, что переменные связаны между собой именно так, как он предполагает. В то же время искусственный характер ситуации жестко контролируемого эксперимента ставит под угрозу возможность перенесения результатов на внелабораторные условия. И наоборот, исследование, проведенное в естественной обстановке при естественном поведении, не ставит под сомнение возможность обобщения, поскольку ситуации, на которые исследователь хочет перенести свои выводы, максимально приближены к тем, которые он изучает. Однако недостаток экспериментального контроля может крайне затруднить установление валидных отношений.

Отбор

При принятии решений, касающихся переменных, нужно отвечать на вопрос «какие»: какие независимые переменные я буду изменять и какие потенциальные следствия этих изменений я буду измерять? Но важен также ответ на вопрос «кто»: на ком я буду изучать связи между независимыми и зависимыми переменными?

Формирование группы участников эксперимента называется отбором. Отбор важен по причине ограниченности рамок исследования. За очень редкими исключениями психологи не имеют возможности обследовать всех людей, которые их интересуют. Изучающий период младенчества, к примеру, не будет обследовать всех младенцев в мире, даже всех, родившихся в США, или (вероятно) даже тех, кто родился в определенном регионе. Вместо этого он обследует выборку, на основе результатов которой он надеется сделать общие выводы об интересующей его популяции. Обобщение правомерно, если выборка репрезентативна в отношении популяции. Это, как явствует, вопрос внешней валидности.

Как исследователю убедиться в том, что выборка репрезентирует популяцию? Следуя логике, сначала нужно определить, что представляет из себя сама популяция. Она необязательно должна быть столь велика, как все младенцы мира, скорее всего это что-то вроде «всех доношенных 3-месячных младенцев США». Следующим Шагом после очерчивания границ популяции является случайный отбор. Как подразумевает сам термин, случайный отбор означает, что представители популяции имеют равные шансы попасть в выборку. При этом наиболее вероятно, что в результате процесса отбора характеристики выборки будут отражать

характеристики популяции. Заметьте, однако, что вероятность этого напрямую зависит от размера выборки. Случайная выборка, состоящая из 100 человек, будет значительно более репрезентативна, чем случайная выборка, состоящая из 10 человек. Этот принцип — лишь один из ряда доводов (мы столкнемся с некоторыми из них в главе 7) в пользу больших выборок.

Насколько репрезентативны выборки, на практике используемые в исследованиях? Некоторое представление об этом дает нам обзор журналов Child Development и Developmental Psychology. В первую очередь, какую информацию мы получаем об этих выборках? Во всех проанализированных статьях нам сообщают количество участников и их возраст; в 91 % случаев указывается соотношение количества представителей обоих полов. В 70 % случаев предоставляются некоторые сведения о социальном статусе испытуемых и в 72 % — об их расе. Сравнение с результатами контент-анализа в первом издании книги (которые основывались на анализе тех же журналов за 1983 год) говорит о том, что в последние годы исследования отчетов стали информативнее. Соответствующими показателями из обзора 1983 года были 75 % для пола, 52 % для социального статуса и 24 % для расы. Тем не менее, неопределенность при описании расового или социально-экономического состава выборки является скорее правилом, чем исключением. Например, типичны фразы «преимущественно белые», «преимущественно среднего класса»; реже можно встретить точные численные значения и способы подсчета. Опубликованные в недавнем номере Child Development критерии рас и социальных классов (Entwisle & Astone, 1994) могут со временем привести к конкретизации исследовательских отчетов.

Неопределенность характерна и для сведений о способе привлечения испытуемых. Как отмечалось в главе 1, испытуемые не появляются по волшебству, исследователь постоянно должен задаваться вопросом, к кому и как обратиться. Имеют значение три момента. Во-первых, каково было исходное количество кандидатов, к которым обращались с просьбой принять участие в эксперименте? Изучая период младенчества, к примеру, использовал ли исследователь объявления о рождении детей в местной газете, списки в роддомах или информацию, полученную у педиатров? Популяции, которые можно выделить, пользуясь этими источниками, могут существенно различаться. Второй вопрос касается процента тех, кто в итоге согласился на участие. Если исследователь обратился, к примеру, к 100 новоиспеченным матерям, сколько из них принесли своих малышей на обследование? И, наконец, каков процент испытуемых, прошедших все исследование, — или, иначе говоря, сколько испытуемых отказалось сотрудничать в ходе исследования? В некоторых видах исследования, практически во всех, где фигурируют младенцы, выбывание испытуемых может явиться довольно серьезной проблемой. И, тем не менее, информация об отборе испытуемых и количестве выбывших встречается в отчетах редко. Только в 34 % статей сообщаются более или менее точные сведения о способе отбора и о доле согласившихся из числа тех, к кому обратились с просьбой об участии. Только в 50% соответствующих случаев дается информация о том, сколько участников выбыло в ходе исследования.

Учитывая эти недостатки в отчетах, что можно сказать о выборках при изучении развития? Эти выборки, как правило, достаточных размеров, обычно включают лиц и мужского, и женского пола. Испытуемые преимущественно из среднего класса, жители городов, в которых располагаются университеты, а значит, и исследовательские лаборатории. Наконец, в выборки в большинстве своем входит белое население, за исключением тех случаев, когда исследование направлено на выявление возможных групповых различий между белыми и афро-американскими детьми. В этом отношении выводы из этого обзора повторяют выводы контент-анализа других психологических исследований, проведенных за последнее время (Graham, 1992; Hagen & Conley, 1994)[ 2 ].

О чем говорит этот обзор? Очевидно, что изучаемые психологами выборки зачастую по тем или иным признакам не соответствуют критерию репрезентативности. Однако насколько серьезны последствия этих несоответствий? Действительно ли они ставят под сомнение внешнюю валидность большей части данных, накопленных исследователями в области психологии развития? По многим причинам ответ, скорее всего, отрицательный. Поскольку параметры практически любой выборки так или иначе будут отклонятся от абсолютной репрезентативности, вопрос может быть сформулирован так: существует ли вообще вероятность того, что определенные отклонения отражаются на возможности обобщения результатов? Часто такая вероятность минимальна. Обобщение предполагает нечто большее, чем то, о чем с логической точки зрения свидетельствуют полученные данные, и во многих случаях гораздо разумнее обобщить, чем не обобщать. Тем не менее к репрезентативности не стоит относиться излишне легкомысленно. «Часто» не то же самое, что «всегда», а «вероятный» не то же самое, что «гарантированный». Характер выборки всегда является тем, что важно учитывать, планируете ли вы свой эксперимент или оцениваете чужой.

Контроль

В предыдущих разделах мы уже затрагивали понятие контроля. Вспомним, что независимая переменная определяется как переменная, которую контролирует исследователь. А обеспечение репрезентативности выборки является одним из видов контроля, который должен осуществлять исследователь. Целью этого раздела является рассмотрение остальных форм контроля, которые приобретают значение с момента получения выборки.

Как явствует из табл. 2.3, для осуществления исследования важны три формы контроля. В таблице перечисляются эти формы и приводятся примеры их использования в исследовании. Формы и примеры их использования довольно сложны; их суть прояснится по ходу изложения. Таблица предназначена для общей ориентации, благодаря которой можно увидеть вводимые разграничения.

Один из видов контроля имеет отношение именно к конкретной форме переменной. Если, к примеру, интерес представляет эффект определенного подкрепления, тогда исследователь должен иметь возможность применить именно такое подкрепление. Если имеют место какие-либо непредусмотренные отклонения — в форме, хронометраже, последовательности и т. д., — исследователь больше не сможет с уверенностью сказать, что представляет из себя независимая переменная. Или рассмотрим вновь параметр времени изучения в исследовании Дюфресна и Кобасигавы. Поскольку исследователей интересовал возможный эффект трудности запоминаемого материала, необходимым условием являлось предъявление всем детям одних и тех же пар, отличавшихся именно по трудности. Вывод, который отсюда можно сделать, незамысловат; он заключается в том, что, желая исследовать эффект чего-либо, следует прежде всего получить возможность сгенерировать это «что-либо». Однако заметьте, что сделать это не всегда так просто, как в приведенных примерах, в которых уровни независимой переменной определялись всего лишь различием стимульного материала. Если экспериментальные манипуляции сложнее, использование переменной в одном и том же виде со всеми испытуемыми может оказаться проблематичным.

Вторая форма контроля имеет отношение ко всем факторам экспериментальных условий, за исключением независимой переменной. Независимые переменные не находятся в вакууме; для них всегда существует контекст, и задачей исследователя является точное определение того, что это будет за контекст. Проверяя память, (как, например, в двух описанных выше исследованиях), исследователь должен решить не только то, какой использовать тест, но и то, какова будет обстановка тестирования. Простой выход в этом конкретном случае — сделать обстановку как можно более спокойной с тем, чтобы минимизировать отвлекающие моменты. Приняв это решение, экспериментатор берет на себя ответственность по обеспечению равно спокойной обстановки для каждого испытуемого.

Теперь введем еще несколько терминов. Вариации значения зависимой переменной называются дисперсией. Те вариации, которые можно объяснить действием независимой переменной, называются первичной дисперсией; те же, которые являются результатом действия других факторов, называются вторичной

дисперсией, или дисперсией ошибки. Контролируя уровень других потенциальных переменных, экспериментатор пытается максимизировать долю первичной дисперсии. Возможно даже большее значение имеет то, что он стремится свести к минимуму вероятность устойчивой связи между любой из независимых переменных и другими источниками дисперсии. Допустим, что Черри и Парк тестировали бы всех своих молодых испытуемых в тихой университетской лаборатории, а пожилых испытуемых — в шумной комнате клуба пенсионеров. Очевидно, что в этом случае были бы две независимые переменные — возраст и условия тестирования, — тогда как подразумевалось наличие только одной. Любые непредусмотренные связи между двумя потенциально значимыми переменными называются смешением. Одной из первоочередных целей качественного исследовательского плана является исключение возможности смешения.

Как явствует из табл. 2.3, контроль нежелательных переменных может принимать несколько форм. Нередко имеется возможность контролировать переменную, делая ее одинаковой для всех испытуемых. Этот случай иллюстрирует пример с памятью, в котором шум в экспериментальных условиях поддерживался на одном уровне для всех испытуемых. Однако иногда такое точное уравнивание нецелесообразно. За примером можно вновь обратиться к исследованию Дюфресна и Кобасигавы. На успешность выполнения теста школьниками могло влиять время суток, в которое проходило тестирование. Склонность к сотрудничеству и внимание в конце учебного дня не обязательно те же, что и перед уроками, непосредственно перед переменой — не те же, что сразу после нее, в пятницу — не те же, что в понедельник. Очевидно, что Дюфресн и Кобасигава внесли бы потенциально значимое смешение, если бы тестировали всех своих первоклассников утром, а всех 7-класс-ников днем. Один из способов избегания этой проблемы — тестирование всех детей в одно и то же время суток в один и тот же день недели, к примеру, в час дня в среду. Однако с таким подходом для завершения большинства исследований потребовались бы месяцы, и даже тогда постоянными для всех испытуемых оставались бы лишь время суток и день недели, а не время года (которое тоже может иметь значение). Разумным альтернативным ходом было бы допустить колебания времени тестирования, однако сделать так, чтобы эти колебания были бы одинаковы во всех сравниваемых группах — в данном случае 1-, 3-, 5- и 7-классников. В этой ситуации контроль переменной «время тестирования» состоял бы не в приравнивании, а в рандомизации — то есть в равномерном распределении ее вариаций по группам испытуемых.

Таблица 2.3 Формы экспериментального контроля

Тип контроля	Методы достижения	Примеры
Независимой переменной	Сделать значимые элементы экспериментальных манипуляций одинаковыми для всех испытуемых	В эксперименте Дюфресна и Кобасигавы одним и тем же способом предлагать всем детям одни и тот же набор легких и трудных нар
Потенциально значимых	Сохранять факторы постоянными для всех	В эксперименте Черри и Парк тестировать всех испытуемых в одной тихой комнате
факторов экспериментальных условии	испытуемых
	Равномерно распределить по группам вариации других факторов	В эксперименте Дюфресна и Кобасигавы случайным образом выбирать время тестирования во всех группах детей

Изначальных индивидуальных	Случайным образом причислять испытуемых к группам, обследуемым в разных экспериментальных условиях	В эксперименте, Черри и Парк случайным образом включить половину испытуемых обоих возрастов в группу наблюдающих модель и в группу наблюдающих схему
различий между испытуемыми
	Подобрать испытуемых таким образом, чтобы они соответствовали друг другу по потенциально значимым качествам	В эксперименте Черри и Парк измерить IQ испытуемых и причислить испытуемых с равными IQ к разным группам (на практике этого сделано не было)

	Провести обследование каждого испытуемого при всех экспериментальных условиях	В эксперименте Дюфресна и Кобасигавы протестировать каждого ребенка с использованием и трудного, и легкого экспериментального материала

Общие принципы, о которых говорилось выше, должны казаться знакомыми. То, о чем здесь говорится, это просто классический научный метод: выявить эффекты некоторого фактора, систематически изменять этот фактор (первая форма контроля), сохраняя постоянными другие потенциально значимые факторы (вторая форма контроля).

Существует и третья форма контроля, которая также играет важную роль. До сих пор «другие, потенциально значимые факторы», о которых шла речь, находились внутри экспериментальной ситуации, например уровень шума в комнате для тестирования. В любом эксперименте еще одним значимым источником дисперсии являются индивидуальные различия между испытуемыми. Испытуемые заведомо неодинаковы, и различия между ними обусловливают наличие дисперсии ошибки в конечных результатах. Поскольку этих различий нельзя избежать, метод контроля вновь должен заключаться не в уравнивании, а в распределении. Экспериментатор должен убедиться в том, что различия равномерно распределены по группам — или, говоря это же иными словами, что к моменту начала обследования группы эквивалентны. Для выполнения этого требования необходимо, чтобы экспериментатор контролировал не только экспериментальное воздействие, но и тех, на кого оно направлено.

Как экспериментатору распределить людей по группам таким образом, чтобы эти группы оказались изначально эквивалентными? Ответ состоит в том, что, хотя возможность стопроцентной гарантии эквивалентности отсутствует, есть определенные способы приблизиться к ней настолько, насколько разумно было бы ожидать. Наиболее распространенный метод — случайное причисление испытуемых к разным группам. Случайное причисление означает, что у всех испытуемых равные шансы попасть в каждую группу. При этом характеристики каждого испытуемого (IQ, пол, опыт выполнения подобного задания — все, что может отразиться на результатах) с одинаковой вероятностью могут попасть в любую из групп. Отсюда, результатом случайного причисления, скорее всего, будет равномерное распределение характеристик по группам, что, естественно, и является целью исследования. Ясно, что логика случайного причисления та же, что и логика случайного отбора, и успешность этого процесса также зависит от размера выборки. Нельзя произвольно разделить 8 испытуемых на две группы и считать с какой-либо долей уверенности, что в результате рандомизации были получены эквивалентные группы. С выборкой, состоящей из 80 человек, шансы на успех гораздо выше.

На практике исследователи в области психологии развития, формируя группы, редко используют абсолютно случайное причисление. Обычно исследователь стремится работать с уравненными экспериментальными группами. Независимо от размеров выборки случайное причисление не может гарантировать, что к концу исследования количество испытуемых не уменьшится. Однако можно поставить условие, согласно которому размеры группы к концу исследования должны быть равными, при этом сохраняя случайность причисления всех испытуемых, Аналогично, даже если исследователя не интересуют половые различия, имеет смысл обеспечить равное соотношение мальчиков и девочек во всех сравниваемых группах. Или, проводя обследование в школе, полезно удостовериться в равноценности обстановки в разных классных комнатах. Соответствие любому из этих требований можно гарантировать установлением определенных ограничений на случайное причисление.

При обсуждении необходимости ограничения влияния случайности встает закономерный вопрос: зачем вообще использовать случайное причисление? В конечном счете, цель исследователя — обеспечить изначальную эквивалентность групп, но в то же время мы видим, что случайность не гарантирует эквивалентность. Если мы можем уравнять соотношение полов испытуемых и обстановку классных комнат, почему не пойти дальше и не привести в соответствие все имеющие значение характеристики, таким образом обеспечивая эквивалентность групп? Общий ответ заключается в том, что привести в соответствие все параметры — труднее, чем может показаться на первый взгляд, и попытка сделать это иногда усложняет, а не упрощает дело. Более конкретный ответ дан в главе 3, где мы возвращаемся к вопросу об отборе и причислении испытуемых. Кроме того, в главе 3 рассматривается третий метод достижения эквивалентности: обследование каждого испытуемого во всех экспериментальных условиях.

Субъектные переменные
Переменные, поддающиеся и не поддающиеся манипуляциям

До сих пор при обсуждении вопроса экспериментального контроля мы говорили в основном об идеальной для исследователя ситуации: когда он имеет возможность систематически изменять независимые переменные, сохраняя постоянными другие факторы, и включать испытуемых в группы с разными экспериментальными условиями, либо случайным образом, либо произвольно, но в рамках определенных ограничений. При использовании многих переменных такой контроль не только желателен, но и вполне осуществим. Мы видим элементы подобного рода контроля в обоих описанных исследованиях: контраст «легкое—трудное» в эксперименте Дюфресна и Кобасигавы, а также контраст «модель—схема» в эксперименте Черри и Парк.

Однако жизнь психолога осложняется тем фактом, что не все переменные находятся во власти исследователя, чего требует хороший исследовательский план. И вновь оба описанные исследования иллюстрируют эту ситуацию, и в этом случае примером служит хронологический возраст. Ясно, что возраст — не является характеристикой, устанавливаемой исследователем; наоборот, это характеристика самого человека, влияющая на экспериментальные условия. Возраст — это лишь один пример того, что называется субъектными (или классификационными) переменными: неотъемлемыми качествами испытуемых, не поддающимися экспериментальным манипуляциям; качествами, которые должны учитываться в своем естественном виде. Другими характерными примерами являются расовая и половая (если не учитывать успехи хирургии последних лет) принадлежность. Как уже отмечалось, исследователь, который хочет работать с такими характеристиками в качестве независимых переменных, лишает себя возможности контролировать их через манипуляции. Единственный способ контроля в этих случаях — контроль через отбор испытуемых, уже обладающих нужными характеристиками.

Другие переменные хотя и не являются в буквальном смысле не поддающимися манипуляциям, в экспериментах с людьми фактически никогда не контролируются. С теоретической точки зрения, к примеру, было бы весьма интересно узнать, развиваются ли младенцы без матери так же, как и с матерью. За исключением эксперимента Фридриха II (см. сноску на с. 13), у нас нет исследований, посвященных этому вопросу, с использованием манипуляций. Тем не менее уже давно существует литература по «материнской депривации» и ее воздействии на ребенка. Работа исследователей заключалась в том, чтобы выявить ситуации, в которых младенцы остались без матери (обычно в приютах), а затем воспользоваться этими «естественными условиями» для изучения развития детей. Существует масса примеров, когда психологи «эксплуатировали» естественно сложившиеся обстоятельства — исследования недостаточного питания в младенчестве, отсутствия отца в детском возрасте, социальной изоляции в старости и т. д. Во всех случаях независимая переменная создается через отбор, а не посредством манипуляций.

Исследования с не поддающимися манипуляциям переменными не соответствуют критериям «подлинного эксперимента», поскольку исключают возможность контролируемых манипуляций, составляющих суть эксперимента. По этой причине Кемпбелл и Стэнли (Campbell & Stanley, 1966), рассматривая экспериментальный план, назвали такие исследования доэкспериментальными. Из-за недостатка контроля мы не можем говорить об установленных причинно-следственных связях с той же долей уверенности, что и в классическом эксперименте.

Каковы конкретные минусы исследования с переменными, не поддающимися манипуляциям? Проблемы можно разделить на две основные категории. Во-первых, испытуемых нельзя произвольно распределять по группам. Поскольку случайное причисление невозможно, нельзя быть уверенными и в том, что изучаемые группы эквивалентны не только по интересующей нас переменной (например, наличие или отсутствие матери), но и по другим параметрам, и поэтому нельзя быть уверенными в том, что причиной различий между группами является именно эта переменная. Данное обстоятельство фактически и являлось поводом для критики исследований ранней материнской депривации. Отбор из популяции только тех малышей, которые воспитываются в приютах, не соответствует критерию случайности, и в результате формируется группа детей, в которой, как правило, выше процент генетических и органических нарушений. Поэтому отличие детей из приюта от остальных нельзя с какой-либо долей уверенности отнести на счет эффекта воспитания без матери. В хорошо спланированном эксперименте такое смешение должно было бы исключаться процедурой случайного причисления. Это, очевидно, проблема с внутренней валидностью: мы не можем утверждать, что наша независимая переменная действительно является причинным фактором.

Другая трудность связана с тем, что воздействие большинства субъектных переменных носит множественный и длительный характер. Воспитание в приюте, отсутствие отца, социальная изоляция, черный (или белый) цвет кожи, принадлежность к мужскому (или женскому) полу — все это факторы, которые способны оказывать значимое влияние на развитие человека. Поэтому, даже обнаружив значимый эффект, связанный с определенной субъектной переменной, мы все еще не

будем знать, каковы конкретные причинные факторы. Это еще одна слабая сторона исследований материнской депривации. Хотя пагубные последствия определенных аспектов воспитания в приюте не вызывают сомнений, уже долгое время ведутся споры о том, являются они результатом нехватки материнского тепла (как, например, утверждал Боулби (Bowlby, 1952)), или более общей когнитивно-перцептивной депривации (как утверждал, например, Кэслер, (Casler, 1961, 1961)). Даже если бы мы могли сделать вывод о значимости матери самой по себе, мы все еще не знали бы, отсутствие какого из факторов, связанных с наличием матери, обусловливает обнаруженные негативные последствия. Вновь имеет место смешение факторов, которые разграничиваются в хорошо спланированном эксперименте. Исследователь, держащий переменные под контролем, вряд ли выберет в качестве независимой такую глобальную переменную, которая не позволит интерпретировать возможные эффекты ее воздействия. Это, очевидно, проблема с конструктной валидностью: мы не знаем, правильно ли интерпретируем результаты.

Это рассуждение не имело своей целью убедить в том, что демонстрирование наличия связи между материнской депривацией, половой принадлежностью или возрастом и развитием ребенка бессмысленно. Однако следует отдавать себе отчет в том, что оно является лишь начальным этапом исследовательской программы.

Возраст в качестве переменной

В связи со своей значимостью в психологии развития такая переменная, как хронологический возраст, заслуживает особого упоминания. Целью многих исследований в области психологии развития является определение того, отличаются или не отличаются испытуемые разных возрастов по изучаемым зависимым переменным. Обзор журналов Child Development и Developmental Psychology (см. табл. 1.3) свидетельствует о том, что 69 % исследований включали по крайней мере две возрастные группы; в 31 % было три и более возрастные группы. Но эти цифры, естественно, не отражают в полной мере масштабы использования возрастных сравнений, поскольку сравнение между возрастами зачастую бывает неявным. Например, исследование новорожденных может не включать сравниваемую группу старших детей, однако результаты будут интерпретироваться исходя из сведений об особенностях старших детей. Если взять простой пример, вряд ли кто-нибудь пытался бы определить, есть ли у младенцев цветовое зрение (например, Bornstein, 1978), если бы не был уверен в том, что цветовое зрение, в конечном счете, входит в среду возможностей человека.

Специалисты в области психологии развития иногда оправдываются за то, что большинство исследований направлено «только лишь на выявление возрастных различий». Однако сведения об истинных возрастных изменениях, очевидно, имеют для науки о развитии неоспоримую ценность. Описание — не просто неотъемлемая часть любой науки; точное описание дает в распоряжение исследователя феномен, который должна объяснить теоретическая модель. Только зная о том, например, что маленькие дети не понимают принципа сохранения (Piaget & Szeminska, 1952), мы можем начать выстраивать модель, объясняющую этот факт него причины.

Хотя нужно согласиться с тем, что изучение возрастных изменений оправданно, важно прояснить, что конкретно подразумевается под «истинными возрастными изменениями». При этом, конечно, не подразумевается, что хронологический возраст в буквальном смысле является причиной изменений. Подразумевается, что изменения обусловлены влиянием переменных, стабильно и естественно связанных с возрастом. Тогда задача исследователя состоит в определении того, какая из потенциально значимых переменных действительно имеет значение.

Выше мы подчеркивали, что основной целью экспериментального контроля является формирование групп, эквивалентных по всем параметрам кроме исследуемой независимой переменной. Эта цель приобретает особую значимость в случае такой глобальной субъектной переменной, как возраст. Представьте, что вам нужно сравнить 7-летних и 12-летних детей. Если вы хотите добиться эквивалентности групп по всем параметрам кроме возраста, вам придется найти 7- и 12-летних детей одного уровня биологической зрелости, посещавших школу одинаковое количество лет, со сходным жизненным опытом и т. д. Очевидно, что эта цель не только нереалистична, но и неверна. Биологическая зрелость, количество лет обучения в школе и жизненный опыт относят к переменным, «стабильно и естественно связанным с возрастом». В этом качестве их и следует изучать, а не исключать посредством экспериментального контроля.

С другой стороны, есть и другие потенциально значимые факторы, которые могут привести к смешению при сравнении возрастных групп. Произошло бы явное смешение, если бы все 7-летние дети были мальчиками, а 12-летние — девочками. Принадлежность к мужскому полу не является обязательной для 7-летнего ребенка, равно как и принадлежность к женскому полу необязательна для 12-летнего, поэтому следует исключить возможность параллельного изменения этого фактора и возраста. Несколько менее явное смешение произошло бы, если всех 7-летних детей взяли из одной школы, а всех 12-летних — из другой. Факт обучения в разных школах, вероятно, не играет большой роли, и в любом случае это различие может оказаться неизбежным в определенном возрастном диапазоне. Тем не менее, важно подбирать школы как можно более близкие по таким параметрам, как подход к обучению, местоположение и социально-экономический статус обслуживаемого населения. Если этот критерий не учитывается, тогда кажущиеся возрастные изменения могут действительно оказаться «ложными».

Как следует из примеров, принять решение о том, что приводить в соответствие при сравнении возрастных групп, а что нет, обычно бывает довольно просто. Однако, как мы увидим, это решение не всегда очевидно, не всегда легко и привести в соответствие то, что намечено. К вопросу о возрастном сравнении мы вернемся в главе 3.

Результаты

Исследователи измеряют независимые переменные с тем, чтобы определить, как при этом изменяется значение зависимой переменной. Но как оно может изменяться? В факторном исследовании — то есть в исследовании с двумя и более независимыми переменными — воздействие независимой переменной может принимать две формы: главный эффект и взаимодействие.

Главный эффект

Главный эффект - это результат непосредственного воздействия независимой переменной. Это то, что интересует исследователей при сравнении показателей по уровням отдельной независимой переменной - независимой от других независимых переменных (или итоговой для всех их значений). Оба исследования, приведенные в качестве примера, иллюстрируют понятие главного эффекта. В эксперименте Черри и Парк главным был эффект возраста: молодые испытуемые справлялись с заданием лучше пожилых. Средние значения для этого эффекта представлены в правом столбце табл. 2.2; это итоговые показатели для всех молодых и всех пожилых испытуемых при разных уровнях другой независимой переменной (модель/схема). Подобно тому имел место и главный эффект экспериментальных условий; значения для этого эффекта представлены на нижней строчке таблицы: это итоговые показатели всех испытуемых в ситуации с моделью и в ситуации со схемой для двух уровней возраста.

В эксперименте Дюфресна и Кобасигавы также был главный эффект возраста и главный эффект экспериментальных условий. Итоговые показатели для этих эффектов представлены в табл. 2.1 в столбце и строчке «среднее». Таким образом в обоих случаях можно говорить о том, что эффект имели обе переменные- значение зависимой переменной изменялось как функция от возраста и экспериментальных условий. Заметьте, однако, что в исследовании Дюфресна и Кобасигавы эффект возраста сложнее других главных эффектов, поскольку независимая переменная имеет 4 уровня а не 2. Главный эффект переменных, имеющих более двух уровней представляет особые трудности для статистической обработки и интерпретации -к этой проблеме мы вернемся в главе 7.

Взаимодействие

Главный эффект - это эффект отдельно взятой независимой переменной. Взаимодействие же возможно при одновременном учете двух и более независимых переменных. Взаимодействие имеет место всегда, когда эффект одной независимой переменной зависит от уровня другой независимой переменной.

Помимо двух главных эффектов в эксперименте Дюфресна и Кобасигавы есть и взаимодействие. Здесь эффект трудности задания изменяется вместе с возрастным уровнем - незначительный эффект в двух младших и значительный эффект в двух старших группах. Любое взаимодействие можно описать двумя способами эффект возраста изменялся с уровнем трудности задания - никакого различия при выполнении легких заданий, существенное различие при выполнении трудных задании. Такое двунаправленное («двунаправленное», поскольку имеются две независимее переменные) взаимодействие в виде графиков изображено на рис 2 1 Данные те же, что и в табл. 2.1, однако графическое изображение демонстрирует характер взаимодействия более наглядно. Обратите особое внимание на то, что линии непараллельны. Графическим признаком взаимодействия является отклонение от параллельности - расхождение или пересечение графиков, отражающее зависимость эффекта одной переменной от значения уровня другой.

Рис. 2.1. Взаимодействие возраста и экспериментальных условий в исследовании Дюфресна и Кобасигавы. (A. Dufresne & A. Kobasigawa, 1989,Joumal of Experimental Child Psychology, 47, 274-296)

Рис. 2.2. Главные эффекты в исследовании Черри и Парк. (К. Е. Cherry & D. С. Park, 1993, Psychology

and Aging, 8, 515-526)

Рис. 2.3. Взаимодействие экспериментальных условий в исследовании Пэттерсон и Картер. (C.J. Patterson & D. В. Carter, 1979, Child Development, 50, 272-275)

Как бы выглядели графики при отсутствии взаимодействия? Ответом может служить рис. 2.2, на котором представлены графики средних показателей из эксперимента Черри и Парк. Вспомним, что в их исследовании было обнаружено одинаковое улучшение в ситуации с моделью и у молодых, и у пожилых испытуемых — поэтому здесь два главных эффекта (возраст и условия), но нет взаимодействия. Эта ситуация отражена в том, что линии на рис. 2.2 почти параллельны (то, что они не строго параллельны, обусловлено незначительной тенденцией к взаимодействию — тем, что у пожилых испытуемых улучшение в ситуации с моделью более заметно).

В исследовании Дюфресна и Кобасигавы субъектная переменная взаимодействовала с экспериментально манипулируемой. Однако взаимодействие происходит не только по такой схеме; оно может существовать между любыми независимыми переменными. Поэтому его вероятность велика в любом многофакторном эксперименте. Рис. 2.3 иллюстрирует взаимодействие двух экспериментально манипулируемых переменных, а рис. 2.4 — двух субъектных переменных. Главным результатом исследования Паттерсона и Картера (Patterson & Carter, 1979), которое иллюстрируется рис. 2.3, было то, что наличие желаемого вознаграждения ослабляло самоконтроль детей, когда они лишь ожидали его, но усиливало самоконтроль, когда они выполняли ради его получения определенное задание. Одним из результатов исследования, проведенного Андервудом, Койе и Хербсменом (Underwood, Coie & Herbsman, 1992), (см рис. 2.4) явилось выявление изменения склонности детей к демонстративному поведению с целью скрытия грусти, связанного с возрастом и полом испытуемых. В двух младших классах девочки несколько чаще мальчиков говорили о том, что предпочтут скрывать свою грусть; однако в 7-м классе по этой характеристике уже мальчики превосходили девочек.

Интерпретация любого взаимодействия может вызвать трудности и статистические, и теоретические (Levin, 1985; Rosnow & Rosenthal, 1995). Ограничимся одним важным замечанием.

Рис. 2.4. Взаимодействие возраста и пола в исследовании Андервуда, Койе и Хербсмена. (М. К. Underwood, J. D. Coie, & С. R. Herbsman, 1992, Child Development, 63, 366-380)

Наиболее общим правилом, которого следует придерживаться в ситуации значимого взаимодействия переменных, является осторожность в интерпретациях. В исследовании Дюфресна и Кобасигавы, к примеру, присутствовал главный эффект и возраста, и трудности задания, однако, как следует из рис. 2.1, эффект возраста проявлялся только при выполнении трудных заданий, а эффект трудности проявлялся только у детей из старших возрастных групп. В исследовании Паттерсона и Картера, напротив, главный эффект наличия/отсутствия вознаграждения был несущественным, что свидетельствовало бы о том, что эта переменная не играет роли, если бы этому не противоречили результаты анализа, отдельно — ситуации выполнения заданий и отдельно — ситуации простого ожидания. Таким образом, взаимодействие говорит нам о том, что мир сложнее, чем можно было ожидать. Изучение отдельной независимой переменной не дает полной картины действия переменных.

Причины искажения валидности

Как мы увидели, конечной целью планирования исследования всегда является достижение валидных выводов об изучаемом феномене. Неудачный исследовательский план ставит валидность под сомнение, не устраняя спорных моментов и ограничивая возможности обобщения, В этой главе мы уже коснулись некоторых причин искажения валидности, а в дальнейшем рассмотрим значительно больше. Для ознакомления с последующим текстом может быть полезной краткая сводка факторов, которые следует иметь в виду — общий перечень и ряд определений, к которым можно обращаться при необходимости. Эту роль выполняет табл. 2.4.

Таблица 2.4 составлена по работам Кемпбелла и Стэнли (Campbell & Stanley, 1966), а также Кука и Кемпбелла (Cook & Campbell, 1979). Она не содержит полный перечень помех для исследования (Кук и Кемпбелл описывают 33 вида причин искажения валидности!), однако включает в себя многие из проблем, которые будут обсуждаться по ходу текста. Таблица вряд ли не потребует разъяснений; ее цель - введение понятий, на которые в дальнейшем будет обращено более пристальное внимание.

Таблица 2.4 Причины искажения валидности

Систематическая ошибка при отборе	Отбор для сравнения изначально неэквивалентных испытуемых в группы
Избирательные выбывания из исследования	Неслучайная, систематическое выбывание испытуемых в ходе исследования
История	Потенциально значимые помимо изучаемых независимых переменных события в период между проводимыми измерениями
Созревание	Естественное развитие испытуемых как функция от времени, продолжения исследования
Тестирование	Эффект повторного выполнения одного и того же теста
Реактивность	Непредусмотренное влияние экспериментальной обстановки на ответы испытуемых
Инструментарий	Непредусмотренная смена экспериментаторов, наблюдателей или способов измерения в ходе исследования
Статистическая регрессия	Тенденция приближения к среднему значению первоначально крайних показателей при повторных тестированиях
Низкая надежность	Ошибки измерения при оценке зависимой переменной
Ограниченность статистических возможностей	Низкая вероятность выявления истинных эффектов, обусловленная особенностями экспериментального плана и статистических критериев
Монооперациональное	Использование только одного способа операционализации либо независимой, либо зависимой переменной
искажение
Моно -методическое искажение	Использование только одного экспериментального метода для изучения связей между независимыми и зависимыми переменными

Резюме

Глава начинается с введения некоторых базовых терминов и понятий. Все исследования предполагают наличие переменных. Зависимые переменные - результирующие, например, количество агрессивных действий при изучении агрессии. Независимые переменные - это потенциальные причинные факторы, которые контролирует исследователь - например, подкрепление агрессии. Цель большинства исследований — определить, связаны ли изменения независимой переменной с изменением значения зависимой переменной — например, повышается ли уровень агрессии после получения подкрепления?

Главным вопросом во всех исследованиях является вопрос валидности. Валидность — это обоснованность выводов, которые можно сделать из данного исследования. В главе рассматриваются три вида валидности: внутренняя валидность, которая имеет отношение к точности выводов о причинно-следственных связях внутри контекста исследования; внешняя валидность, которая касается возможности генерализовать сделанные выводы; и конструктная валидность, которая имеет отношение к безупречности теоретических интерпретаций и выводов.

Важнейшее решение, которое должен принять исследователь, касается участников исследования. Целью отбора испытуемых является получение выборки, репрезентативной в отношении популяции, на которую исследователь хочет перенести свои заключения. Общим принципом достижения репрезентативности является случайный отбор из интересующей популяции. На практике в большинстве исследований в области психологии развития используется не абсолютно случайный отбор, а большинство выборок по тем или иным признакам не соответствуют критерию репрезентативности. Насколько значимы эти несоответствия, несомненно зависит от изучаемых проблем. Тем не менее, репрезентативность и внешняя валидность остаются существенными моментами, которые нужно учитывать в любом исследовании.

Затем было рассмотрено понятие контроля. Под контролем находится независимая переменная. Для получения четкой информации о причинно-следственных связях важно три вида контроля. Первый — контроль точности независимой переменной. Второй — контроль других потенциально значимых факторов в экспериментальной ситуации. Анализируется два метода осуществления второй формы контроля: поддержание на одном уровне других факторов или случайное распределение их значений между испытуемыми. Третий вид контроля — контроль изначальных индивидуальных различий между испытуемыми. Один из методов его осуществления — случайное причисление — рассматривается в этой главе; два других вида (приведение в соответствие и внутрисубъектное тестирование) будут рассмотрены в следующих главах.

В некоторых исследованиях степень контроля ограничена характером переменных. Термин субъектная переменная имеет отношение к изначальным различиям между людьми, характеристикам, которыми нельзя манипулировать; в качестве примера можно привести пол, возраст, расу. Единственной формой контроля таких переменных является отбор, что имеет значение также в тех ситуациях, когда экспериментальное воздействие было бы неэтичным (например, материнская депривация). Хотя у специалистов в области психологии развития не поддающиеся манипуляциям переменные зачастую вызывают особый интерес, установление причинно-следственных связей при отсутствии экспериментальных манипуляций довольно затруднительно. Выявление причин наблюдаемых феноменов проблематично, если влияние переменной множественно и длительно; кроме того, бывает трудно исключить возможность наличия других причинных факторов.

Субъектные переменные представляют особый интерес, когда вступают во взаимодействие. Взаимодействие определяется как зависимость эффекта одной независимой переменной от уровня другой. Главный эффект, напротив, является результатом воздействия одной независимой переменной, не связанной с другими

факторами. Взаимодействие может происходить между независимыми переменными любого вида и принимать разные формы. Взаимодействие говорит о сложности отношений между переменными и о необходимости быть осторожными в своих выводах о любой из них.

В конце главы автор возвращается к понятию валидности. Имеется множества факторов, искажающих валидность, здесь перечислены важнейшие из них. Далее они будут рассматриваться более подробно.

Упражнения

Найдите в популярных изданиях (газетах, журналах) по крайней мере, три заметки, знакомящие читателей с результатами каких-либо исследований в области психологии развития. Составьте список возможных причин искажения валидности. Если предоставленной информации недостаточно, чтобы можно было оценить некоторые формы валидности, определите, какие дополнительные сведения вам необходимы.

Подумайте над задачей привлечения испытуемых из следующих возрастных групп: 6 месяцев, 4 года, 12 лет, 70 лет. Для каждой группы составьте перечень способов формирования выборки. Оцените вероятную репрезентативность выборок при каждом методе отбора.

Один и тот же конструкт может выступать в роли и независимой и зависимой переменной, что определяется способом его использования. Возьмем в качестве примера следующие конструкты: тревожность, уровень активности, готовность к школьному обучению. Для каждого из конструктов спланируйте исследование, в котором он выступал бы в роли: а) зависимой переменной; б) независимой переменной; в) субъектной переменной; г) корреляционной переменной.

Предположим, в исследовании две независимые переменные, А и В, у каждой из которых два уровня — то есть план 2x2. Зависимая переменная С может принимать значение от 0 до 50. Начертите графики, иллюстрирующие каждый из приведенных ниже возможных результатов, а затем объясните, что означают эти результаты:

а) значимые главные эффекты А и В при отсутствии взаимодействия;

б) значимое взаимодействие между Аи В при отсутствии главных эффектов;

в) значимый главный эффект А и значимое взаимодействие между А и В.

Примечания:

Я должен добавить, что в последние годы Child Development выпускает специальные номера: один посвящен детям из этнических меньшинств (McLoyd & Spencer, 1990), другой — детям из малообеспеченных семей (Huston, McLoyd, & Coll, 1994). Эти специальные выпуски призваны стимулировать изучение недостаточно исследованных тем.

Оглавление

Главная | Контакты | Прислать материал | Добавить в избранное | Сообщить об ошибке