Определение валидности в психологии простыми словами

Валидизация – это проверка валидности. Понятие валидности широко используется в психологии, статистике, логике.

Валидность в психологии – это один из основных критериев, который позволяет определить достоверность тестов и методик. Другими словами, уровень валидности показывает, насколько верно выбран или разработан вид исследования для измерения исследуемого качества: чем больше валидность, тем точнее методика, эксперимент или тест.

В этой статье:

Надёжность и валидностьОсновные критерии валидностиВнешние критерии и валидностьОсновные виды валидностиОсновные способы валидизацииПсихологический тест и валидностьВажность валидизации для методики в психологии

Надёжность и валидность

Фото Girl with red hat on Unsplash
Валидность важный показатель достоверности полученных результатов. Безупречный эксперимент должен обладать безупречной валидностью и надёжностью. Надёжность, как и валидность, определяет качество и пригодность разработанной методики к применению на практике.

Показатель валидности – это уверенность экспериментатора в том, что он, с помощью заданной методики, произвёл измерение именно необходимой характеристики или параметра. Например, тест для определения темперамента, должен измерять темперамент, а не другое качество личности человека.

Сущность понятия «валидность»

Определение 1
Валидность – это комплексная характеристика методики, которая включает сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.

Данное понятие относится к тому, что эта методика измеряет и как хорошо она это делает. Те тесты, которые не обладают валидностью, для практического использования не годятся.

Уровень валидности – это её коэффициент.

На валидность теста оказывают влияние систематические факторы, привносящие в результаты искажения. К ним относятся другие психические свойства, мешающие в результатах теста проявиться тому свойству, на которое направлен тест.

Например, необходимо измерить потенциал обученности, но время исполнения строго ограничено, и допущенную ошибку исправить невозможно. Таким образом, искомое психическое свойство смешается с другим – «стрессоустойчивостью». Те, у кого стрессоустойчивость высокая, выполнять тест будут лучше. Здесь проявляется эффект систематического искажения. Отсюда, единого и универсального подхода к определению валидности не существует.

Ты эксперт в этой предметной области? Предлагаем стать автором Справочника Условия работы

Исходя из того, какая сторона валидности будет рассматриваться, будут использоваться и соответствующие способы доказательства.

Замечание 1

Методика имеет столько валидностей, сколько существует критериев.

В первом понимании валидность относится к самой методике – это валидность измерительного инструмента, а проверка получила название теоретической валидизации. Второе понимание относится уже не столько к методике, сколько к цели её использования – это прагматическая валидизация.

Для использования психодиагностических методик в практических целях, они должны быть проверены по ряду формальных критериев, которые являются главным элементом методик и доказывают их эффективность и высокое качество.

Основными критериями оценок являются надежность и валидность.

Критерий валидности представляет собой источник информации об измеряемом психическом свойстве, он не зависит от теста и по отношению к нему является внешним. Говорить о валидности теста можно только тогда, когда его результаты будут сравнимы с источником истиной информации об измеряемом свойстве, т.е. с критерием.

Готовые работы на аналогичную тему

Курсовая работа Внешняя валидность и виды обобщений за пределами исследовательской ситуации 420 ₽ Реферат Внешняя валидность и виды обобщений за пределами исследовательской ситуации 240 ₽ Контрольная работа Внешняя валидность и виды обобщений за пределами исследовательской ситуации 220 ₽

Получить выполненную работу или консультацию специалиста по вашему учебному проекту Узнать стоимость

В качестве критерия валидности на практике часто используется прагматический критерий, представляющий собой очевидный признак, проявляемый испытуемым независимо от исследуемого качества. Например, данные о выполнении разных заданий, контрольных проб и данные, полученные при помощи других методик, валидность которых доказана.

Основные критерии валидности

Выделяются четыре основных критерия, которые могут повлиять на уровень показателя валидности:

критерий исполнителя, который характеризует квалификацию и опыт исследователя;
субъективность, то есть отношение испытуемого к предмету исследования, и это может отразиться на конечном результате методики;
физиологический: физическое, психологическое и эмоциональное состояние испытуемого на момент проведения методики;
критерий случайности, который иметь место быть в определении вероятности совершения любого события.

Подробности

Считается, что выводы обладают внутренней достоверностью, если причинно-следственная связь между двумя переменные правильно продемонстрировано.[1][2] Действительный причинный вывод может быть произведено при соблюдении трех критериев:

«причина» предшествует «следствию» во времени (приоритет во времени),
«причина» и «следствие» имеют тенденцию происходить вместе (ковариация), и
нет никаких правдоподобных альтернативных объяснений наблюдаемой ковариации (непредсказуемости).[2]

В условиях научных экспериментов исследователи часто изменяют состояние одной переменной ( независимая переменная), чтобы увидеть, как он влияет на вторую переменную ( зависимая переменная).[3] Например, исследователь может манипулировать дозировкой определенного лекарства между разными группами людей, чтобы увидеть, какое влияние он оказывает на здоровье. В этом примере исследователь хочет сделать причинно-следственный вывод, а именно, что могут применяться разные дозы препарата. нести ответственность

для наблюдаемых изменений или различий. Когда исследователь может уверенно отнести наблюдаемые изменения или различия в зависимой переменной к независимой переменной (то есть, когда исследователь наблюдает связь между этими переменными и может исключить другие объяснения или
конкурирующие гипотезы
), то причинный вывод считается внутренне достоверным.[4]

Однако во многих случаях размер эффектов найденный в зависимой переменной может зависеть не только от

вариации независимой переменной,
то мощность инструментов и статистических процедур, используемых для измерения и обнаружения эффектов, и
выбор статистических методов (см .: Достоверность статистического заключения).

Скорее, ряд неконтролируемых (или неконтролируемых) переменных или обстоятельств может привести к дополнительным или альтернативным объяснениям (а) обнаруженных эффектов и / или (b) величины обнаруженных эффектов. Следовательно, внутренняя валидность больше зависит от степени, чем от «либо-либо», и именно поэтому исследовательские планы, отличные от истинных экспериментов, также могут давать результаты с высокой степенью внутренней достоверности.

Чтобы сделать выводы с высокой степенью внутренней достоверности, при разработке исследования могут быть приняты меры предосторожности. Как правило, выводы, основанные на прямом манипулировании независимой переменной, допускают большую внутреннюю достоверность, чем выводы, основанные на ассоциации, наблюдаемой без манипуляций.

Если рассматривать только внутреннюю валидность, строго контролируемые истинные экспериментальные планы (то есть со случайным выбором, случайным распределением в контрольную или экспериментальную группы, надежные инструменты, надежные процессы манипуляции и гарантии против мешающих факторов) могут быть «золотым стандартом» научных исследований. . Однако сами методы, используемые для повышения внутренней достоверности, могут также ограничивать возможность обобщения или внешняя валидность выводов. Например, изучение поведения животных в зоопарке может облегчить получение достоверных причинно-следственных выводов в этом контексте, но эти выводы могут не распространяться на поведение животных в дикой природе. В общем, типичный эксперимент в лаборатории по изучению конкретного процесса может не учитывать многие переменные, которые обычно сильно влияют на этот процесс в природе.

Внешние критерии и валидность

Чтобы минимизировать влияние внешних критериев на качество производимого теста или методики, а, соответственно, и на показатель валидности, к ним применяются следующие требования:

соответствие тому направлению, в котором производится заданное исследование;
все участники должны находиться в схожих условиях и соответствовать заданным параметрам;

предмет исследования должен быть постоянным и надёжным: не подвергаться резким перепадам или изменениям.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Основные виды валидности

В психологии различается несколько видов валидности:

внутренняя валидность – показатель того, насколько направленное экспериментальное воздействие или влияние послужило причиной к данным изменениям в проводимом эксперименте.

Что такое валидность в психологии?

Высокий показатель внутренней валидности характеризует надлежащее качество исследования. На показатель внутренней валидности непосредственно влияют неконтролируемые ситуативные факторы: чем больше влияние этих факторов, тем ниже показатель внутренней валидности;

внешняя валидность – показатель, обобщающий вывод популяции или иных независимых переменных.

Внешняя валидность обеспечивает успешность применения результатов исследования в реальную жизнь;

эмпирическая валидность определяется как соответствие между коррекцией баллов по тесту и показателями внешнего параметра, который избирается в качестве критерия валидности.

К определению экспериментальной валидности, как правило, прибегают из-за противоречия между показателями внешней и внутренней валидизацией, так как увеличение одной, непременно влияет на показатели другой. В связи с этим, проводиться эмпирическая проверка методики;

конструктная валидность – это теоретический конструкт, который включается в процессе поиска факторов, объясняющих поведение испытуемого при проведении теста или методики.

Примером психологического конструкта может служить интеллект, существование которого признаётся и принимается во внимание для объяснения несхожести поведения людей;

ретроспективная валидность используется при получении данных в предсказательных методиках.

При определении этого типа валидности используются критерии, которые отображают события, свойства состояния в прошлом времени. Таким образом могут вычисляться характеристики того, насколько эффективнее стали результаты заданных процессов в настоящем времени по сравнению с прошлым;

экологическая валидность применяется для характеристики того, насколько выбранный организм является подготовленным к проявлению различных форм поведения в возможных средах обитания или контекстах.

Экологическая валидность считается подтверждённой результатами полевых исследований.

Валидность методики это

Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.

Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.

В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.

Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.

Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).

Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).

Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.

При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения

Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.

Психологический тест и валидность

Психологический тест – задание, сформулированное на основе определённых стандартов, результатом которого является получение данных о психофизиологических показателях состояния человека и свойств его личности, навыков, знаний и способностей.

Валидность определяет качество теста, то есть степень соответствия исследуемого свойства психики или поведения к тесту, при помощи которого они определяются. Качественные тесты имеют показатель валидности восемьдесят процентов. Важно учитывать состав испытуемого материала, его характеристики: от этого тест может быть достоверным или патологически невалидным.

Валидность теста очень важна потому, что она определяет собственно тест как измерительный инструмент и даёт возможность считать его пригодным для применения в обычной практике.

Пример нарушения внутренней валидности

Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.

Угрожающие факторы

В первую очередь сюда относят эффекты, которые связаны с особенностями исследуемого объекта:

эмоциональная реакция на ситуации;
способность к обучению;
наличие памяти.

Основные причины, угрожающие внешней валидности, это влияние:

Предварительного тестирования – когда восприимчивость испытуемых к экспериментальному воздействию уменьшается или увеличивается под его влиянием.
Условий проведения исследований – когда они вызывают реакцию на эксперимент у испытуемого.
Взаимодействия отбора испытуемых и экспериментального фактора.
Наложение экспериментальных воздействий – особо относится к планам исследований в одной группе, когда им подвергаются одни и те же испытуемые.

Если для экспериментов отбираются далекие от реальной жизни, слишком лабораторные, ситуации – внешняя валидность находится под угрозой. Общность выводов неизбежно снижается при фиксации внешних переменных.

Теоретическая и прагматическая валидизация

Валидизация – это проверка валидности методики. Разделяется на теоретическую и прагматическую.

Теоретическая валидизация относится к самой методике. Исследователя интересует свойство, которое измеряется.

Прагматическая валидизация относится к цели использования методики. Акцент делается на доказательство того, что измеряемое методикой нечто связано с определенными областями практики.

Основной тип валидности: внутренняя

Рассматривается как междисциплинарный, поскольку активно используется и в экспериментальной психологии, и в других науках. Вид валидности, показывающий, насколько независимая переменная влияет на зависимую. Для ее обеспечения необходимо контролировать все важные внешние факторы.

Чем выше вероятность изменения зависимой переменной от независимой, а не от каких-то других факторов, тем выше внутренняя валидность исследования. Однако невозможно с полной уверенностью утверждать, что она соблюдена в науке, особенно в психологии. Поэтому ученые при любом психологическом эксперименте могут лишь постараться минимизировать различные причины, несущие угрозу внутренней валидности.

Угрожающие факторы

Следует учитывать и максимально нейтрализовать влияние следующих моментов:

Статистическая регрессия – отбор групп происходит на основании «крайних» показателей.
Фон – некие события, происходящие между двумя измерениями вместе с экспериментальным воздействием.
Изменения испытуемых в ходе естественного развития, которые являются следствием течения времени и не связаны с какими-нибудь событиями (например, взросление).
Тестирование – влияние на результаты повторного испытания уже выполненных заданий, которые применяются для измерения.
Отбор испытуемых – повторяющаяся ошибка в результатах происходит из-за неэквивалентности групп по составу.
Отсев в ходе эксперимента – испытуемые неравномерно выбывают из сравниваемых групп.
Инструментальная погрешность – изменения в результатах могут быть вызваны нестабильностью измерительного инструмента.
Взаимодействие нескольких из перечисленных факторов – приводит к ошибочному восприятию эффекта экспериментальной переменной.

Психометрические свойства методик психодиагностики

К ним относятся надежность, валидность и репрезентативность.

Надежность методики – это количественно-статистический показатель устойчивости результатов, который измеряется при помощи различных коэффициентов корреляции. Он, однако, не отвечает на вопрос, какое психическое свойство измеряется.

Такую информацию можно узнать, изучив показатель валидности. Он также измеряется при помощи коэффициентов корреляции, только принимается во внимание большее количество теоретических и практических соображений.

В психологии валидность — это соответствие поставленным задачам разработанных методик и результатов их исследования.

Ее важная особенность – невозможность разового установления и использования этого доказательства конечным аргументом «за» качество методики или эксперимента. Рассматривая соответствие результатов исследования поставленным задачам, можно судить о степени валидности. Но она не измеряется ни в каких условных единицах.

Проверку репрезентативности часто сводят к нормальному распределению тестовых баллов. Но это можно считать ее частным случаем, достаточным условием, но необязательным.

На сегодняшний день психометрические характеристики рассматривают как главный признак научной обоснованности. В мировой психодиагностике это является обязательным условием для получения сертификата в национальных комиссиях по тестированию в качестве пригодной для практического использования методики.

Классификация валидности

В экспериментальной психологии валидность – это одно из фундаментальных понятий.

Оно включает в себя огромное количество всевозможной информации о тесте. Говоря простыми словами, она указывает, что измеряется и насколько хорошо. Способы получения и категории этих сведений формируют виды валидности. Она делится на 4 основных вида:

внутреннюю;
внешнюю;
операциональную;
конструктную.

Также в экспериментальной психологии используют виды валидности:

дифференциальную;
инкрементную;
экологическую.

Психодиагностика использует другую классификацию. Здесь валидность бывает:

1.Конструктная. Делится на:

конвергентную;
дивергентную.

2.Критериальная (эмпирическая). Делится на:

текущую;
прогностическую;
ретроспективную.

3.Содержательная.

Проверка каузальных отношения

Эксперименты являются средством проверки каузальных гипотез. По традиции предполагается, что существуют три необходимых условия для утверждения с определенной долей уверенности о том, что отношение между двумя переменными является каузальным и что направление причинности от А к В. Первое условие относится к временной последовательности и формулируется следующим образом: причина должна предшествовать по времени эффекту. Обычно это условие соблюсти нетрудно, если исследователь знает, когда испытуемые подвергались экспериментальному воздействию. В квазиэкспериментах исследователь может сочетать такого рода знание со своим знанием результатов испытуемых до и после экспериментального воздействия и может связать воздействие с некоторыми показателями изменения зависимой переменной. Исследователь, проводящий истинный эксперимент, знает, что соответствующая рандомизация обеспечивает, в вероятностном плане, предварительную (до введения экспериментального воздействия) эквивалентность различных экспериментальных групп. Поэтому если после экспериментального воздействия обнаружатся различия, связанные с воздействием, то он полагает, что такие различия, по всей вероятности, вызваны экспериментальным воздействием.
Второе необходимое условие для обоснованного вывода о причинной зависимости В от А состоит в том, что воздействие или воздействия должны быть статистически связаны с эффектом, так как, если возможная причина и эффект не связаны друг с другом, одно не может быть причиной другого. Для проверки существования такой ковариации используются статистические показатели; разработаны критерии для принятия решения о существовании «действительной» ковариации в результатах (например, р Третье необходимое условие каузального вывода состоит в том, что не должно быть правдоподобного альтернативного объяснения появления В помимо А. Это условие труднее всего соблюсти в связи с двумя обстоятельствами. Первое — относящееся в основном к квазиэкспериментам — связано с валидностью альтернативных интерпретаций, которые предполагают, что кажущаяся каузальная связь А и В фактически может быть обусловлена действием третьей переменной, которая и вызывает изменения В. К примеру, можно установить на фабрике новую машину и отмечать, связано ли это с ростом производительности труда. Если это так, то можно приписать это увеличение нововведению. Однако всегда существует вероятность того, что это увеличение никак не связано с новой машиной и может быть обусловлено сезонным ростом производительности, который происходит в такое время каждый год. И это только один из примеров такой третьей переменной, и в дальнейшем мы представим систематизированный перечень таких дополнительных переменных, обозначая их как угрозы для внутренней валидности.

Существование угроз для внутренней валидности наводит на мысль, что предполагаемая каузальная связь может быть лишь видимой. Это отличается от второго значения «альтернативной интерпретации», когда А, которым манипулируют, и В, которое измеряется, и в самом деле каузально связаны, но существуют сомнения, действительно ли эмпирические операции осуществляются с объектами, представленными конструктами А и В, которые исследователь пытался применить для обозначения А к В. Большинство теоретических контроверсий в психологии именно такого рода — например, контроверсий о том, можно ли объяснить связь между увеличением оплаты и более высокой производительностью тем, что высокая зарплата формирует чувство неравенства или разрушает ожидания или «я-концепцию» и т. д. В таких исследованиях речь идет не о внутренней валидности, то есть не о том, являются ли изменения в оплате причиной изменений в производительности. Скорее, это вопрос о том, как оплата должна быть выражена в терминах соответствующей теории, доступных обобщению. Другой пример: для некоторых исследователей проблема интерпретации известных хоуторнских экспериментов Ротлисбергера и Диксона заключается в обозначении того, что заставило женщин увеличить производительность труда, а не в определении того, действительно ли экспериментальное вмешательство привело к этому увеличению. Был ли каузальной переменной сам факт изменения независимо от его характера, или обратная связь, несущая информацию о поведении обследуемого и содержавшаяся в новых изменениях, или же это следствие возрастания групповой сплоченности, или следствие нового восприятия интересов руководства, или еще что-нибудь? Мы рассматриваем опасности для конструктной валидности, которые следует понимать как угрозы для правильного обозначения причины и эффекта с помощью абстрактных терминов, взятых из обыденного языка или из формальной теории. В действительности проблема конструктной валидности несколько шире и, очевидно, имеет отношение к попыткам обозначения любых аспектов эксперимента, включая характер обстановки, в которой проводится эксперимент, особенности участвующих лиц и т. д. Стоит отметить, что термин «внутренняя валидность» в прошлом употреблялся не вполне правильно, потому что с его помощью выражали как сомнения в правильности вывода о причинных связях между А И В, так и сомнения в том, как следует обозначать причину и следствия. Такое смешение понятий может возникнуть вследствие того, что альтернативные интерпретации должны быть отброшены в процессе установления как внутренней, так и конструктной валидности.

Однако установление внутренней валидности предполагает отбрасывание альтернативных интерпретаций вероятных каузальных связей между А, которым манипулируют, и В, которое измеряется, а установление конструктной валидности предполагает отбрасывание альтернативных интерпретаций того, как А и В соотносятся с гипотетическими понятиями. Поскольку в экспериментах крайне важно выяснить, является ли связь между двумя переменными каузальной, необходимым условием для выведения заключения о каузальности является отбрасывание альтернативных интерпретаций связи между переменными (то есть устранение угроз для внутренней валидности), а не отбрасывание альтернативных интерпретаций операций с причиной и следствием (то есть угроз для конструктной валидности).

Хороший эксперимент (а) делает ясной временную последовательность; (б) достаточно чувствителен и действен для того, чтобы показать, что вероятные причина и эффект взаимосвязаны (ковариантны); (в) исключает возможность влияния третьих переменных, которыми можно было бы объяснить связь между причиной и эффектом; а также (г) исключает альтернативные гипотезы о конструктах, включенных в эту связь. Полезно сделать еще один шаг. Заключение о каузальной связи в какой-то промежуток времени, в одной обстановке и при одной выборке испытуемых дает мало уверенности в том, что обнаруживаемая каузальная связь является устойчивой. Вопрос о возможности обобщения результатов для различных периодов времени, различных условий и групп мы рассматриваем как вопрос о внешней валидности и вкратце перечислим угрозы и для этого вида валидности.

Сказанное не должно создавать впечатления, что эксперимент является единственным средством установления каузальности. Такая наука, как астрономия, развивалась без экспериментирования отчасти потому, что ей посчастливилось иметь надежные методы наблюдения и количественные теории, позволяющие предсказывать точное место¬положение, точные орбиты и временные интервалы движения в пространстве. Точность численных предсказаний означает, во-первых, что предсказания могут быть проверены самым тщательным образом и, во-вторых, что различные теории, на основе которых делаются различные численные предсказания, могут быть противопоставлены друг другу. Это не значит, что в астрономии решены все проблемы валидности или что исследователь может отказаться от детального анализа всех возможных альтернативных гипотез и тщательного сопоставления их с данными для того, чтобы выяснить, могут ли они быть отброшены. Мы хотим сказать только, что было бы меньше угроз валидности, если бы измерения были такими же надежными, как в астрономии, а теории столь же точными.

К сожалению, социальным наукам не посчастливилось иметь столь же точные теории, столь же надежные измерения или повторяющийся циклический порядок в результатах наблюдений. Представьте себе, что обнаружено различие в производительности труда работника до и после того, как он прошел специальное обучение. Как мы можем определить, что в этом различии следует отнести за счет собственно обучения, что за счет естественного развития работника, или улучшений в навыке выполнения задания при обследовании, или в результате различных событий в жизни человека, которые оказывают влияние на зависимую переменную между предварительным тестированием и тестированием после экспериментального воздействия, и что объясняется любым сочетанием этих факторов? Более того, даже если бы мы могли определить конкретные численные величины, связанные с каждым из перечисленных выше объяснений, можно ли быть уверенными в том, что нам удастся измерить соответствующие результаты с такой надежностью, которая позволила бы осуществить выбор между теориями? Ответ на эти вопросы зависит, конечно, от величины предсказываемых различий в приросте производительности труда и от конкретного вида проверки. Мы полагаем, однако, что в социальных науках найдется не много неэкспериментальных условий, в которых точные предсказания могли бы быть с успехом использованы для проверки конкурентных гипотез.

Хотя предшествующее изложение наводит на мысль, что эксперименты более пригодны для проверки предположений о причинности, чем неэкспериментальные исследования, из этого не следует делать вывод, что эксперименты являются надежным средством получения ответов на все вопросы, связанные с проверкой гипотез о каузальных связях. Перечень угроз внутренней и внешней валидности, валидности статистического вывода и конструктной валидности, а также выявление взаимосвязей между этими видами валидности делают очевидным несовершенство экспериментирования. Экспериментальные планы нуждаются в улучшении, могут и должны быть улучшены, чтобы способствовать установлению каузальной зависимости. Но мы заблуждались бы, если бы считали, что один эксперимент или даже целая исследовательская программа, рассчитанная на несколько лет, могли бы дать окончательный ответ на основные вопросы, связанные с надежным установлением каузальной связи, обозначением ее составляющих и определением возможности обобщения вывода.

Относительность деления валидности на виды

Универсального подхода к характеристике валидности не существует. Для валидизации отдельных видов психодиагностических процедур и тестов используются различные ее виды. Сведения, которые входят в ее комплекс, можно описать или оценить при помощи коэффициента валидности количественно и качественно. Но в целом валидность методики сложно измерить — о ней можно лишь судить — в силу сложности, комплексности, ситуативности в отношении конкретных условий ее применения.

Только в результате накопления опыта работы с тестами реальная валидность может раскрыться, однако она изменяется с течением времени в силу устаревания методик. Это связано с изменением социальных норм, образцов поведения, требований к профессиям. Именно поэтому необходимо периодически контролировать валидность методик.