Валидность - тесты являются популярным способом различных проверок, как в организациях, так и в образовательной сфере. Одним из главных требований к любому тесту является валидность его результатов, т.е. тест должен измерять именно то, что он измерять предназначен. К примеру, тест по вождению измеряет водительские способности, и не касается физических способностей кандидата. Точно так же тест по химии должен включать в себя вопросы только лишь касательно предмета химии.
Оценка валидности - Валидность оценивается несколькими способами. Например, можно обратиться к экспертам с вопросом, соответствует ли предмет тестирования тому, что тест на самом деле проверяет (проверка по содержанию), или путем оценки корреляции между результатами теста и другим критерием (проверка по критерию). Примером оценки по критерию может быть анализ, сколько людей, участвовавших в ДТП, прошли тест на вождение, а сколько - нет. Предполагается, что те, кто прошли, реже были участниками ДТП.
"Face validity" - т.е. насколько тест на самом деле исследует именно те аспекты, для которых он предусмотрен. В основном этот тип валидности предусмотрен для людей, проходящих тест. Соответствует ли то, что, по мнению тестируемых, проверяет этот тест, с тем, что он на самом деле проверяет.
Важность "face validity" - то насколько важным тест кажется тестируемому, является очень важным фактором. Если тест воспринимается тестируемым, как несоответствующий и незрелый, то в результате у тестируемого это может снизить мотивацию и готовность сотрудничать. В таком случае валидность результатов тестирования находится под угрозой.
Например, проективные тесты, применяемые при отборе персонала, отличаются низким уровнем "face validity". Когда человеку дается задание нарисовать дерево или человека, или рассказать, что он видит на черно-белой картинке, то он не понимает связи между заданием и требованиями к должности, на которую он претендует. Следовательно, даже подходящий кандидат может отнестись к тесту несерьезно, что отразится на результатах в отрицательную сторону - тот же самый кандидат даст совершенно иные результаты, если будет верить в значительность тестирования. Таким образом, ситуация с низким уровнем "face validity" значительно понижает валидность самого процесса отбора персонала.
Исследование, проведенное во Франции в 2005 году Борн и Деруа, показало, что объяснения, которые дают тестируемому перед тестом, влияют на мотивацию и вообще на прохождение теста. Тестируемые, которым рассказали о тесте, выявляли большую готовность прикладывать усилия, что давало возможность увидеть их истинный потенциал.
Оценка "face validity" - уровень "face validity" оценивается с помощью вопросников обратной связи или интервью с кандидатом. Так можно выяснить отношение кандидата к тесту, что, по его мнению, тест измеряет, и, соответственно, подходит ли тест для оценки требуемого критерия. Обычно рекомендуются пилотные тесты обратной связи.
Тестовые предпочтения - исследования доказывают, что тесты на проверку знаний имеют высокий уровень "face validity", в то время как проективные тесты имеют низкий.
В исследованиях, одновременно проводимых в 2004 году в Испании и в Португалии Сальгадо и Москосо, тестируемых просили проранжировать свои предпочтения в различных тестах по оценке персонала. В двух разных странах результаты оказались сходными.
Наиболее предпочтительным видом техник по отбору персонала среди тестируемых оказалось личное интервью, резюме и решение ролевых ситуаций (дается задание из реальных ситуаций, возникающих на должности, на которую претендует кандидат). Самым непопулярным методом были тесты на благонадежность и графологические тесты. Эти исследования так же были подкреплены еще одним исследованием, проведенным в 2004 году.
Но следует принять во внимание то обстоятельство, что все участники этих исследований на самом деле не проходили эти тесты до момента их опроса, а только лишь выполняли просьбу проранжировать эти тесты.
Совершенно по другому выглядит картина отношениях к различным методам оценки персонала среди тестируемых, которые на самом деле прошли эти тесты. И эта вариативность обычно относится к тестам на благонадежность, часто вызывающим чувство обиды и возмущения.
Значительная вариативность присутствует в отношениях к различным методам оценки персонала среди тестируемых, на самом деле прошедших эти методики, в сравнении с теми, кто в тот момент не проходил эти тесты. Эта вариативность обычно относится к тестам на благонадежность, часто вызывающих чувство обиды и возмущения.
Исследования, проводимые в США, подтвердили, что тестируемые, которые проходили в своей жизни тесты на благонадежность или их симуляции, не реагировали негативно на эти тесты.
Тест на благонадежность кандидата, разработанный Midot, включает в себя вопросник, который среди прочих вопросов спрашивает, в какой мере тот или иной кандидат испытывал готовность или сопротивление при ответе на вопросы. Приблизительно 90% выразили готовность отвечать на вопросы. Аналогично, на вопрос об общей целесообразности таких тестов на благонадежность 62% ответили, что видят целесообразность в такого рода тестах, 12% указали, что не уверены в ответе, и 26% ответили, что не видят необходимости в такого рода тестах.
Уровень"face validity" теста Integritest на благонадежность персонала, разработанный Midot, был пилотно проверен на 414 дополнительных тестируемых, которым были заданы четыре вопроса, указанные ниже:
1. В какой степени вопросник поможет установить систему норм и правил в компании? 86% ответов были положительными.
2. В какой степени вопросник поможет отобрать наиболее честных и надежных кандидатов? 82% ответов были положительными.
3. Насколько хорошо Вы понимали требования теста? 92% ответов были положительными.
4. В какой мере Вы чувствовали готовность отвечать на вопросы? 97% ответов были положительными.
Вообще говоря, "face validity" может считаться высокой в соответствии со следующими параметрами.
В 1999 году исследование обнаружило различие между уровнем "face validity" тестов, открыто проверяющих благонадежность (включая вопросы, которые напрямую или опосредовано проверяют склонность к неблагонадежному поведению), и личностных тестов, исследующих благонадежность скрыто, неявно, на основе соответствующих психологических характеристик. Участники, прошедшие оба вида тестов, определили, что уровень "face validity" тестов, открыто проверяющих благонадежность, был выше уровня "face validity" личностных скрытых тестов.
Не только тип теста влияет на уровень "face validity", но так же структура теста. Обзор тестов по оценке персонала, который в 2007 году сделали Бери, Сакетт и Вайман, показал, что тест с пятью вариантами ответов воспринимался тестируемыми, как тест с большим уровнем "face validity", чем тест с двумя вариантами ответов. Исследователи сделали вывод, что участники исследования не находили в двух вариантах ответа полного описания своих чувств.
Другое исследование показало, что участники, которые проходили тест на компьютере, реагировали более позитивно, чем те, которые проходили тесты на бумаге.
Увеличение уровня "face validity" - есть несколько способов повысить уровень "face validity". Один из способов - это включить в тест только те вопросы, которые соответствуют обстоятельствам, культуре и роду занятия кандидата. Другой способ - это рассказать о тесте и дать логическое обоснование в его необходимости. Прозрачность обычно помогает, хотя прозрачность может противоречить цели тестирования (сделать предмет исследования неявным). Это свойственно тестам, проверяющим специфические знания или умения (например, письменный тест на выражение для программиста). Если батарея тестов включает в себя тесты с низким уровнем "face validity", рекомендуется сообщить кандидату заранее, что не все тесты имеют отношение к непосредственной проверке необходимых знаний и умений для вакантной должности, но также проверяется широкий спектр умений, что потребует от кандидата больших стараний при ответе на вопросы.
В заключении - разрабатывая или выбирая тест, важно учитывать фактор "face validity" и выявлять, как реагируют тестируемые путем пилотных вопросников. Если отмечается низкий уровень "face validity", то важно понять, следует ли применять его в данной ситуации, или как его можно усовершенствовать.
* Автором является социально-индустриальный психолог, консультант по R&D для Midot