Развитие тестирования за рубежом
Метод тестирования широко известен за рубежом. Однако в нашей стране в силу различных причин тесты разного назначения и качества появились не так давно. Современная тестология, равно как и другие науки, имеет свою историю.
Проникновению измерительных методов в педагогику и психологию способствовало быстрое развитие естествознания, возникновение и распространение теорий, объясняющих процесс развития человека как изменяющийся и усложняющийся во времени. Одними из первых ученых, попытавшихся измерить различия между людьми в области элементарных психических процессов, были Френсис Гальтон, Джеймс Мак-Кин Кэттелл. Собственно это не были тесты в современном понимании, скорее это были попытки поиска новых методик для описания интересующих качеств индивида.
Однако еще в 1864 г. появляются «sсаlе bоокs» (шкалированные книги) англичанина Джорджа Фамера. В 1894 г. публикуются таблицы по проверке орфографических знаний учащихся американца Дж. М. Раиса. Данных исследователей можно назвать пионерами зарождения современной тестовой теории.
Важным этапом представляются работы Френсиса Гальтона, чей научный интерес лежал в области изучения наследственности. В рамках данной работы автор проводил систематические антропологические исследования, пытаясь установить определенные закономерности.
На Всемирной выставке 1884 г. Ф. Гальтон организовывает антропологическую лабораторию. Все желающие за определенную плату могли измерить некоторые свои физические характеристики: зрительную, слуховую, тактильную чувствительности, определить мускульную силу, время реакции и др. Кроме того, оценивались способности запоминать буквы и различать цвета, ряд физиологических особенностей организма и некоторые психические свойства.
Ф. Гальтон сам разрабатывал простые тесты, которые применялись в его исследованиях. Многие из этих тестов находят свое применение и сегодня. После закрытия выставки лаборатория переехала в Лондон и продолжала работать еще 6 лет. Всего за годы своей работы Ф. Гальтону удалось провести обследование около 10 тысяч человек, что позволило автору обобщить полученный опыт и сделать ряд выводов, касающихся как антропологических измерений, так и методики применения тестов.
Измеряя физические характеристики отдельного индивида, Ф. Гальтон проводил параллели с умственным развитием человека. Фактически, на основании физиологических данных делался вывод о развитии интеллекта человека. В этом отношении Ф. Гальтон отчасти опирался на учение Д. Локка, полагая, что сенсорные отличия и время реакции равны интеллекту.
Кроме того, Ф. Гальтон заложил и основу теории статистической обработки результатов, полученных при тестировании. Исследователь разрабатывает метод статистического сравнения двух рядов переменных, вводит индекс совместного отношения, получившего название коэффициента корреляции. Также Ф. Гальтон изучает взаимосвязь переменных и построение линий регрессии одной переменной на другую.
А. Н. Майоров называет три основных принципа, выделенных Ф. Гальтоном и внесших существенный вклад в развитие теории тестов:
· применение серии одинаковых испытаний к большому количеству испытуемых;
· статистическая обработка результатов;
· выделение эталонов оценки.[18]
Ф. Гальтон отмечал, что методически упорядоченное тестирование требует определенных условий эксперимента. Это был существенный отход от тысячелетней практики испытаний и проверок, основанных на интуиции. Хотя не все аппаратурные испытания Гальтона можно назвать тестами с позиции сегодняшнего дня, он сделал первый шаг на пути создания объективных методов оценки способностей и свойств личности.
Ф. Гальтон впервые предложил термин «тест» для обозначения своих исследований. Однако в 1894 г. выходит статья Джеймса Мак-Кина Кеттелла «Умственные тесты и измерения». Именно после выхода данной статьи термин «тест» приобретает наибольшую популярность. Работы американского психолога Дж. М. Кеттелла объединили модное тогда направление экспериментального психологического тестирования. Под влиянием Ф. Гальтона он занимался созданием лаборатории экспериментальной психологии и распространения тестов.
Дж. М. Кеттелл работал над проблемой описания личности, используя лишь минимальное число экспериментов. Выход из этой проблемы был найден – исследователь разработал набор заданий, которые он использовал для описания интеллектуальной характеристики личности. Так, например, в работе, опубликованной в 1890 году, он дает список 50 лабораторных тестов, которые были еще и снабжены стандартными инструкциями. Необходимо отметить, что данные задания разрабатывались в течение нескольких лет различными лабораториями в одинаковых условиях, что позволило получить качественный инструментарий. Тем не менее данные тестовые задания позволяли описать лишь элементарные проявления психики и не затрагивали высшие психические функции. Увлечение описанием только элементарных психологических состояний в целом характерно для психологической науки того времени. Простые функции могли быть измерены с большой точностью, а разработка объективных методов измерения более сложных функций казалась безнадежной задачей.
Равно как и Ф. Гальтон, Дж. М. Кеттелл работал над требованиями, позволяющими использовать тест в проведении научных исследований. Такими требованиями явились:
· одинаковость условий для всех испытуемых;
· ограничение времени тестирования приблизительно одним часом;
· в лаборатории, где проводится эксперимент, не должно быть зрителей;
· оборудование должно быть хорошим и располагать людей к тестированию;
· одинаковые инструкции и четкое понимание испытуемыми, что нужно делать;
· результаты тестирования подвергаются статистическому анализу, находят минимальный, максимальный и средний результаты, рассчитывают среднее арифметическое и среднее отклонение.
Начиная с первого десятилетия XX века представление о тесте и его научное определение стали заметно отличаться друг от друга. Хотя всякий тест включает в себя задания как элементы испытаний, он перестает сводиться только к этому. Все чаще тест применяется как метод научного исследования, включающий в себя ряд требований измерения.
Первая попытка научного измерения интеллектуальных способностей детей была сделана в начале XX века во Франции. Авторы созданного для этой цели теста А. Бине и Т. Симон провели эмпирическую проверку заданий, претендующих на включение в тест. Для оценки работоспособности ученика авторы использовали два основных критерия: 1) эмпирическую меру трудности каждого задания, определявшуюся на группах детей разного возраста, и 2) информацию о степени совпадения результатов теста с мнением преподавателей. Для достижения сопоставимости данных, полученных ими, с данными других исследователей и минимизации ошибок измерения А. Бине и Т. Симон приложили к тесту, стандартную инструкцию по проведению тестирования.
Необходимо отметить, что первоначально А. Бине занимается изучением простых физических реакций. Ученым был разработан ряд оригинальных методик, направленных на изучение интеллекта. Были испробованы многие методы, в том числе, например, изучение формы черепа, лица, рук, анализ почерка. Однако в процессе своих исследований А. Бине ставит перед собой задачу измерения, пусть даже грубого, высших интеллектуальных качеств личности.
В 1896 г. А. Бине публикует статью, где критикует работы Ф. Гальтона и Дж. М. Кеттелла. Критике подверглась возможность адекватного исследования интеллекта в целом посредством измерения элементарных психических процессов.
В 1904 г. А. Бине приступает к работе по созданию тестов, позволяющих дифференцировать детей, не желающих трудиться, от детей, страдающих врожденными умственными недостатками. Работа проводилась в рамках создания в Париже специальных школ для умственно неполноценных детей. А. Бине и его коллега Т. Симон разработали серию заданий для детей разных возрастных групп. Впервые был применен принцип возрастающей трудности при составлении тестовых заданий. То есть задания подбирались таким образом, чтобы вероятность успешного выполнения задания возрастала с хронологическим возрастом. Трудность определялась по сравнению с контрольными группами, состоящими в основном из «нормальных» детей и небольшого количества детей слабоумных. Данная шкала получила название шкала 1905 года.
В 1908 году А. Бине и Т. Симон модернизируют тест. Общее количество тестов было увеличено, неудачные тесты были заменены, и все тесты были сгруппированы по возрастным уровням. Таким образом, исследователи определили нормы для детей разных возрастов. А. Бине и Т. Симон вводят понятие умствен|ного уровня, соответствующего возрасту нормальных детей. Позже появился более популярный термин умственного возраста, В целом можно выделить следующие преимущества разработанных А. Бине и Т Симоном тестов:
· дифференцировались по трудности заданий (от более простых к более сложным;
· дифференцировались по возрастным группам;
· была предпринята попытка стандартизировать тест, разработать стандартизированные шкалы;
· применялись статистические методы обработки результатов.
Тесты Бине-Симона пользовались огромной популярностью во всем мире. Появляются различные переводы и модификации данных тестов.
Одной из таких модификаций является предложенный в Америке Левисом Мадисоном Терменом свой вариант теста. Он получил название Станфордской шкалы интеллекта Бине или шкалы Станфорда-Бине. В данной редакции исследователь увеличивает количество тестов, разрабатывает инструкции для проведения отдельных субтестов, проводит ряд других усовершенствований. Именно в этом-варианте впервые было введено понятие коэффициента интеллектуальности IQ, которое рассматривалось как отношение между умственным и физическим возрастами.
Одновременно с попытками создания качественного тестового инструментария проводятся работы в области статистической обработки результатов и определения валидности.
Так, в 1896 г. Карл Пирсон закладывает основы теории корреляции. Коэффициент Пирсона показывает не только положение индивида в группе, но и степень его отклонения от группового значения.
В 1904 г. Чарльзом Эдвардом Спирменом была фактически обоснована двухфакторная теория. Согласно этой теории корреляция между двумя переменными свидетельствует о наличии общего фактора (причины, определяющей величины этих переменных) и специфических факторов, присущих каждой переменной.
Впоследствии Луис Левой Терстоун развил далее идею факторного анализа. Работам Л. Терстоуна по статистике предшествовала разработанная теория интеллекта. Согласно данной теории интеллект рассматривался как целое, объединяющее различные индивидуальные характеристики (вербальные, перцептивные способности, способности к восприятию пространства, памяти, беглой речи). Все эти факторы равноправны, не существует единого фактора интеллекта. С помощью факторного анализа не просто устанавливается связь изменения одной переменной с изменением другой, а определяется мера этой связи и обнаруживаются основные причины, лежащие в основе указанных изменений. Достижения корреляционного и факторного анализа находят свое применение и в современных исследованиях.
Следующим мощным толчком развития теории о тестах явилось интенсивное техническое перевооружение ведущих капиталистических стран. Все острее стала осознаваться мысль о том, что не каждый желающий сможет управлять сложными техническими устройствами: для этого необходимы знания, способности и соответствующие навыки, а значит, нужны тесты, профессиональный отбор и профессиональная подготовка. Существенное влияние на развитие тестологии оказали объективные потребности в подготовке квалифицированных специалистов в годы Первой и Второй мировых войн. Большинство тестов, разрабатываемых в то время в США, призваны были удовлетворить нужду армии в здоровых, квалифицированных служащих.
Важная задача, стоявшая перед исследователями в этот период, – разработка и внедрение групповых тестов. В 1917 г. Американской психологической ассоциацией был назначен комитет для рассмотрения тех средств, которыми психология может помочь ведению войны. Данный комитет столкнулся с необходимостью оперативного определения интеллектуального уровня полутора миллионов новобранцев, качественного распределения их по родам войск, выявления способных к командованию и т.д.
В 1917 – 1919 гг. в США появляются первые групповые тесты для нужд армии. Наибольшее применение нашли тесты Артура Синтона Отиса. Им были предложены два набора тестов – армейский Альфа-тест и армейский Бета-тест – для владеющих английским языком и для не владеющих или плохо владеющих названным языком. Основные принципы, использованные при составлении этих тестов, были систематизированы и впоследствии легли в основу всей методологии групповых тестов.
1. Принцип ограничения во времени (чтобы только 5% испытуемых могли окончить проработку всего теста).
2. Принцип детализированной инструкции в отношении проведения и в отношении подсчета.
3. Введены тесты с выборочным методом формирования ответа с указанием подчеркивать наугад в случае незнания или сомнения.
4. Подбор тестов после тщательной статистической обработки и экспериментальной проверки.
В это же время широко развиваются методики обработки результатов тестирования, создания тестовых систем.
С начала XX века определилось и педагогическое направление в развитии тестологии. А. А. Маккол разделил тесты на педагогические и психологические – по определению уровня умственного развития. Основной задачей педагогических тестов являлось измерение успешности учащихся по школьным дисциплинам за определенный период обучения, а также успешность применения определенных методов преподавания и организации.
Разработка первого педагогического теста – теста Стоуна на решение арифметических задач, снабженного «нормами», принадлежит американскому психологу Эдуарду Ли Торндайку. Он считается основоположником педагогических измерений.
В 1918 г. А. Отис публикует серию групповых тестов для школы. Американские психологи работают над созданием «интеллектуальных» тестов для школ всей страны, названных «национальные тесты». «Национальные тесты» были составлены в 2 сериях по 2 варианта в каждой серии. Совершенствуя методику, американские тестологи в этих тестах впервые перед каждым разделом теста дают примерные упражнения.
В 60-е гг. американскими психологами Дж. Кратволем и Б. Блумом были разработаны тестовые задания на основе модели полного усвоения. Дж. Кратволь предложил сделать постоянным, фиксированным параметром именно результаты обучения. В таком случае все параметры условий будут меняться, подстраиваясь под достижение всеми учащимися заранее заданного результата. Этот подход был поддержан и развит Б. С. Блумом. Текущие тестовые задания носили диагностический характер и не служили основой для выставления отметок. Оценочное суждение, которое делал учитель по результатам теста, принадлежало к типу «зачет – незачет» (или «усвоил – не усвоил»). Тестовые задания, разработанные Б. Блумом, Дж. Кратволем, имели дифференцированный характер: одни задания были нацелены на запоминание и воспроизведение изученного материала, другие – на способность понимать значение изученного, третьи – на умение использовать изученный материал в конкретных условиях и новых ситуациях, четвертые – на умение разбить материал на составляющие, пятые – на умение комбинировать элементы, чтобы получить целое, обладающее новизной, шестые – на умение оценивать значение того или иного материала. Основное назначение текущих тестовых заданий – выявить необходимость коррекционной работы, вспомогательных учебных процедур. Следующий шаг в разработке тестовых заданий по методике обучения на основе полного усвоения – подготовка альтернативных «коррекционных» учебных материалов по каждому из тестовых вопросов; эти материалы рассчитаны на такую дополнительную проработку неусвоенного материала, которая отличается от первоначального способа его изучения, дает возможность ученику подобрать подходящий для него способ работы[19].
Последовавшее за открытием тестов как метода измерения в психологии и педагогике быстрое развитие психотехники, педологии, экспериментальной педагогики вызвало настоящий ажиотаж. Массовое использование тестов в практике психодиагностики и школы происходило одновременно с интенсивным развитием не столько теории, сколько технологии тестирования.