Генезис и развитие метода тестирования

Термин «тест» [< англ. test – проба, проверка, опыт, испытание, исследование] был введен основателем тестовой диагностики американским психологом Д.Кеттелом в конце XIX века. Позднее тесты совершенствовали французский психолог А.Бине, позже другой американский психолог Э.Торндайк и его ученики. Тест – это стандартизированное задание или система контрольных заданий, нацеленных на измерение актуального уровня знаний, умений и навыков, а также способностей испытуемого. Соответственно, под тестированием понимается метод психолого-педагогической диагностики, применяющий стандартизированные задания.

Тестовая методика с момента зарождения постоянно находилась в процессе совершенствования. Альфред Бинэ (18571911) один из основоположников учения о тестах. Им разработана (в вариантах теста 1908 и 1911 гг.) система возрастных шкал для диагностики детей. Он сгруппировал тестовые задания по возрастным группам, в которых «нормальные» дети решали их на 5090%. Если данную задачу решало около 75% определенного количества детей одинакового возраста, она считалась показательной для данного возраста. По числу заданий, которые решил ребенок, вычислялся возраст его интеллектуального развития. Задания, как правило, предполагали владение логическими, логико-перцептивными и арифметическими действиями, выявляли общую осведомленность, ориентировку в практических ситуациях, произвольную память и пр. Таким образом была составлена серия тестов для каждого возраста.

Однако этот возраст интеллектуального развития может сообщить что-то об умственных способностях ребенка и перспективах его развития только в том случае, если его сопоставить с возрастом жизни ребенка. Поэтому немецкий психолог Вильям Штерн (18711938) предложил разделить возраст интеллектуального развития на возраст жизни и получить таким образом сопоставимый коэффициент интеллектуального развития. Чтобы получить целые числа, полученную величину умножали на 100. Величина, равная 100, соответствовала совпадению возраста интеллектуального развития и возраста жизни и обозначала тем самым средний уровень интеллектуального развития. Английский психолог Берт, а также американский ученый Термен попытались усовершенствовать эту систему. По их именам названы шкалы Бине-Берта и Бине-Термена.

Шкала тестов Бине-Термена устроена таким образом, что на каждый период детского возраста дает шесть тестов. Каждый тест считается за два месяца. Вначале испытуемому предъявляли задания, которые соответствовали возрасту на год меньшему, чем его собственный. Он должен был дать подряд пять правильных ответов. Этим фиксировался умственный «базовый возраст». Далее необходимо было к числу тестов «базового возраста» прибавить число всех правильных ответов. К примеру, если ребенок решил все задачи его возраста, допустим, для 6 лет и примерно три теста для более старших детей, то его умственный возраст считается равным 6 годам и 6 месяцам. В этом случае коэффициент интеллекта для данного ребенка высчитывается по формуле:

где УВ – умственный возраст (в соответствии с тестами);

ХВ – хронологический (паспортный) возраст.

IQ  «Ай-кью»  равняется умственному возрасту (в данном случае 6,5 лет), умноженному на 100 и деленному на действительный хронологический возраст ребенка (в нашем примере 6 лет). Для нашего примера коэффициент умственного развития ребенка будет равен приблизительно 108%, что является чуть выше нормы.

Впервые шкала IQ была применена в 1916 г. при адаптации теста Бине-Термена. Но применение данной шкалы сразу натолкнуло исследователей на тот недостаток, что невозможно рассчитать возраст жизни старше 16 или 19 лет, так как не было заданий, могущих выявить прогресс в возрасте интеллектуального развития. Вследствие чего невозможно было разработать шкалу коэффициента интеллекта для взрослых.

Д. Векслер в 1939 г. рассчитал для этого теста стандарты, полученные при вычислении отклонений от средней величины конкретной взрослой группы. Тем самым, он полностью отказался от определения возраста интеллектуального развития и деления его на возраст жизни. В этом случае название «коэффициент интеллекта» более не соответствовало существу полученной величины, но было сохранено ввиду широкой распространенности этого термина. Эту новую величину, сразу же вошедшую в научный обиход, называют «IQ-отклонением». Она характеризуется средней величиной, определяемой при выверке репрезентативной выборки, которая умножается на 100 и имеет стандартное отклонение в положительную или отрицательную стороны равную примерно 15 единицам.

На первом этапе создания тестов IQ испытуемого исчисляли путем деления умственного возраста на хронологический возраст, при этом основное внимание уделялось повышению качества измерений на основе главным образом классического аппарата теории погрешностей измерений. С накоплением экспериментального опыта теория тестов стала развиваться на базе латентно-структурного анализа (П. Лазарсфельд и др.) и связанного с этим анализом ряда математических моделей измерения. Теперь используется математическая теория оценки качества заданий и параметров личности. На этой основе делаются все современные тесты. Отклонения от коэффициента интеллектуального развития вычисляются при подсчете отклонения отдельных результатов от средней величины (нормально распределенных) данных. На шкале, с помощью которой определяется отклонение от коэффициента интеллектуального развития, средняя величина составляет 100, а стандартное отклонение в обе стороны примерно 15 единиц IQ.

Типы тестирования

Существуют три основных сферы тестирования: 1) тестирование в образовании; 2) профессиональное тестирование; 3) психологическое тестирование. Во всех трех сферах применяют следующие виды тестов: личностные, проективные, тесты интеллекта, тесты достижений, тесты креативности, тесты критериально-ориентированные.

Личностные тесты – методы психодиагностики, с помощью которых измеряют различные стороны личности индивида: установки, ценности, отношения, эмоциональные, мотивационные и межличностные свойства, типичные формы поведения. Обычно личностные тесты применяются в одной из форм: 1) шкалы и опросники; 2) ситуационные тесты или тесты действия, использующие перцептивные, когнитивные или оценочные задачи (определяется усвоение знаний), оценку себя, своих личностных конструктов и пр.

Проективные тесты – [< лат. projectio – выбрасывание вперед] – совокупность методик целостного изучения личности, основанного на психологической интерпретации результатов проекции. Составители проективных тестов исходят из предположения о том, что человек всегда преобразует (хотя бы в восприятии и представлении) ситуацию, в которой он оказался, «насыщает» ее собственными проблемами, «проецирует» на нее содержание своей личности, так как процесс восприятия всегда обусловлен следами прошлых впечатлений. Сюда относятся, например, тест чернильных пятен Роршаха, тест по объяснению сюжета на картинках и др. Проективные тесты конструируются в двух видах. В ассоциативном проективном тесте предлагаются незаконченные предложения, рассказы, рисунки и др. В экспрессивном тесте предлагается принять участие в психодраме, игре, рисовании на свободную тему и др. Достоинством методики проективных тестов является то, что они облегчают демонстрацию скрытого содержания внутреннего мира субъекта, которые он не может выразить открыто. Это позволяет сориентироваться в сложных свойствах личности, не поддающихся точной оценке.

Тесты интеллекта – методики психодиагностики, ориентированные на выявление умственного потенциала индивида. Обычно в интеллектуальных тестах испытуемому предлагается установить логические отношения классификации, аналогии, обобщения и др. между терминами и понятиями, из которых составлены задачи теста. Иногда в задачах теста необходимо правильно составить рисунок, собрать геометрическую фигуру, сложить из представленных деталей изображение предмета и др.

Тесты достижений – одна из методик психодиагностики, выявляющая степень владения испытуемым конкретными знаниями, умениями, навыками. Направлены на выявление уровня усвоенности конкретных навыков, а не обобщенных умений, которые человек приобретает в итоге разнообразного жизненного опыта. Тесты достижений проводятся в трех формах: 1) тесты действия; 2) тесты письменные и 3) тесты устные. Тесты действия выявляют умения оперировать инструментами, механизмами, материалами. В письменных тестах необходимо выбрать верный ответ среди нескольких предложенных либо отметить что-то на графике, либо указать что-то в предложенном рисунке. Устные тесты достижений – заранее подготовленная система вопросов, на который испытуемый должен дать правильные ответы.

Тесты креативности [< лат. creatio – сотворение, создание] – методики для изучения и оценки творческих способностей личности. Диагностика творческих способностей ведется в двух направлениях: анализ жизненного опыта и индивидуальных особенностей творческой личности; анализ творческого мышления и его продуктов. Вопрос о креативности как о самостоятельном, независимом от интеллекта свойстве, пока остается нерешенным. Тесты креативности до сих пор остаются не надежными. При их помощи можно измерить такие качества, как беглость, гибкость мышления, оригинальность, чувствительность к проблемам и некоторые другие, но творческие достижения требуют более сложного сочетания способностей и свойств личности.

Более-менее корректному измерению доступны далеко не все творческие достижения, а только конвергентные. Конвергентными [<лат. convergere – приближаться, сходиться] называются такие достижения, которые могут быть выражены в правильном или однозначно лучшем результате. Это громадная сфера в самых различных специальных областях и на различных уровнях, которая простирается от знания фактов до аргументированной оценки. Конвергентные успехи в учебе вполне доступны измерению. Иначе обстоит дело с дивергентными творческими достижениями.

Дивергентные [< лат. divergere – отклоняться, расходиться] достижения те, которые могут привести ко многим в принципе равноправным результатам. Типичным примером является сфера креативного, художественного творчества. Одна и та же тема может быть разработана с помощью музыкальных, поэтических, изобразительных средств в различных вариациях, которые не могут быть классифицированы по принципу «правильно-неправильно» или «лучше-хуже», если абстрагироваться от более «ремесленного» аспекта, имеющего лишь второстепенное значение. Очень редко удается измерить дивергентные креативные способности, иногда с помощью вспомогательных проблемных конструкций.

Тесты критериально-ориентированные – методики психодиагностики, направленные на выявление уровня владения знаниями и навыками умственных действий, которые необходимы и достаточны для выполнения определенных классов учебных или профессиональных заданий. Критерием служит наличие или отсутствие этих знаний. Это инструмент обратной связи в организации процессов обучения. Результаты тестирования, проведенного с помощью этих методик, оцениваются не по порядковому месту испытуемого в выборке и не по отношению этих результатов к статистической норме, а по отношению ко всей сумме тестовых задач. Критериально-ориентированное тестирование позволяет обнаружить при анализе результатов недочеты умственного развития как отдельных индивидов, так и целых групп, и наметить меры для их ликвидации.

Тесты могут быть вербальные (словесные, смысловые) и невербальные (фигурные, рисуночные), то есть без слов.

По методике выполнения теста выделяют рефлективный и верификационный методы. Рефлективные тестовые задания подразделяются на два вида: 1) элективные [< лат. electus – избранный] задания на распознавание с выбором верного ответа из нескольких данных альтернатив, установление логической или иной связи; 2) инвентивные [< лат. inventiv – выдумка, изобретение] задания на дополнение, преобразование и на свободную форму ответа. Сущность верификационного метода выполнения тестовых заданий заключается в том, что ученик должен дать ответ типа «верно-неверно», «да-нет».