Тест для белых

Претензии к ЕГЭ как к способу контроля знаний зазвучали в России относительно недавно — с момента введения экзамена. На Западе подобного рода тесты применяются довольно давно. Но споры о том, насколько объективное представление об абитуриенте они могут дать, не прекращаются. 

Вот задача на способность логически мыслить. Дана пара слов: "бегун" и "марафон". Предлагается еще четыре пары существительных: "посол" и "посольство", "мученик" и "резня", "гребец" и "регата", "рефери" и "турнир", "лошадь" и "конюшня". Необходимо выбрать пару, в которой предлагаемые слова по смыслу соотносятся друг с другом так же, как в изначальной паре "бегун" и "марафон". Задание не слишком серьезное, но это реальный пример из американского экзамена SAT (Scholastic Aptitude Test, Scholastic Assessment Test), выполняющего ту же функцию, что и российский ЕГЭ: полученная по итогам этого текста оценка определяет шансы старшеклассника на поступление в вуз его мечты. Другое дело, насколько объективно при этом оцениваются знания и интеллект абитуриента. 


Завершившаяся недавно общероссийская кампания по сдаче ЕГЭ породила множество споров. По результатам экзамена критики ЕГЭ выявили два его главных недостатка. Во-первых, указывают на многочисленные нарушения при сдаче ЕГЭ. Во-вторых, ставят под сомнение саму уместность теста как метода оценки знаний и тем более как вступительного экзамена в вуз — по мнению критиков, ЕГЭ проверяет знание только цифр и фактов, а этого недостаточно. Претензии первого рода трудно назвать неожиданными, особенно в российских условиях. Рискнем даже предположить, что сдача ЕГЭ сопровождалась ничуть не большими нарушениями, чем проведение обычных экзаменов в прошлые годы. 

Претензии второго рода интереснее. Человек всегда необъективен: оценивая, мы неизбежно учитываем собственные представления о том, что такое хорошо и что такое плохо, что такое красиво, а что — нет, что креативно, а что скучно. Собственно, тестирование как метод оценки и было изобретено для того, чтобы попытаться решить эту проблему, исключив влияние человеческого фактора — усталости преподавателя, его больного зуба, его домашних проблем. Поэтому главный вопрос — можно ли вообще формализовать и стандартизовать оценку человеческих способностей, или такая оценка неизбежно будет включать элемент произвола, инстинкта, субъективного мнения о креативности оцениваемой работы. Любой, кому доводилось принимать экзамены, признает, правда, что, проверяя в условиях цейтнота десятки творческих работ, например вступительных сочинений по литературе, экзаменатор вынужден вырабатывать узкий набор формальных критериев. В итоге сочинение все равно превращается в тест: назвал ли автор отчество Тютчева, правильно ли указана дата написания "Войны и мира", сколько цитат из пушкинского "Памятника". Три цитаты — молодец, ни одной цитаты и год написания не упомянут — на балл меньше. 

Теоретический вопрос, однако, остается: что отражают тесты и могут ли они отражать хоть что-то? Споры об этом идут с самого появления формализованных экзаменов, то есть уже порядка ста лет (впервые абитуриентов тестировали в США в 1901 году, экзамен SAT был первый раз проведен в 1926 году). Бурные споры, например, вызвал в начале 1990-х приведенный выше вопрос о бегуне и марафоне. Дело в том, что правильный выбор в данном случае — пара "гребец" и "регата". Но гребные регаты в англосаксонском мире воспринимаются как атрибут дорогих, престижных частных школ — на память сразу приходит традиционная регата, где соревнуются команды Оксфорда и Кембриджа. Соответственно, у выходцев из привилегированных семей было гораздо больше шансов ответить на этот вопрос правильно просто потому, что "регата" — это понятие из их реальности, тогда как выходец из бедных кварталов никогда в жизни ни о каких регатах мог и не слышать. И действительно, правильно на этот вопрос ответили 53% белых студентов и лишь 22% афроамериканцев. Получается, что даже самые невинные на первый взгляд вопросы могут быть "необъективными". 

Задачки подобного рода с тех пор были исключены из SAT, но вопросы остались. В частности, пример с парой "гребец" — "регата" хорошо иллюстрирует одну из основных претензий, предъявляемых к стандартизованным экзаменам в США: многочисленные исследования показывают, что представители разных этнических и социальных групп сдают эти экзамены по-разному. Отсюда неизбежный вопрос: значит ли это, что представители одних групп умнее других, или дело в том, что составители тестов закладывают в них те или иные искажения, как это было в случае с регатой? И можно ли вообще избежать таких искажений, составить нейтральные вопросы? В частности, больше всего споров вызывают различия в оценках между мужчинами и женщинами, а также между белыми и афроамериканцами. Например, в 1976 году были обнародованы данные, согласно которым средний результат SAT у афроамериканцев был на 240 баллов, или на 20%, ниже, чем у белых. В начале 1980-х разрыв сократился до 200 баллов (17%), к 1988 году он составлял 189. Политики и педагоги, разумеется, объясняли сокращение разрыва собственными усилиями по построению гармоничных межрасовых отношений. Однако с 1989 года тренд необъяснимым образом изменился: сокращение разрыва прекратилось и к 2004 году он даже несколько вырос, до 204 баллов. Разрыв между афроамериканцами и американцами азиатского происхождения, впрочем, был еще больше, в середине 2000-х он составлял 229 баллов, или 19%, а абитуриенты индейского происхождения и потомки коренных жителей Аляски получают в среднем на 104 балла больше, чем афроамериканцы. 

Если же посмотреть не на средние баллы, а на количество студентов, получающих высшие баллы, то ситуация еще хуже. В 2005 году во всех США лишь 244 афроамериканца получили по математике 750 баллов — это уровень, необходимый для поступления в наиболее престижные университеты. Белых, получивших такой балл, было в 61 (!) раз больше. С женщинами история примерно та же. В ходе многолетнего исследования математически одаренных детей в США школьники сдавали SAT в возрасте 12-14 лет, на семь лет раньше срока. Тем самым авторы исследования устраняли эффект специализации в старшей школе, где девочки, возможно, реже записываются в математические классы, поскольку не связывают будущую карьеру с этой дисциплиной. В 1983 году на каждую девочку—участницу исследования, получившую по математике 700 баллов или выше, приходилось 13 мальчиков. К 2005 году, правда, это соотношение снизилось и составило 2,8 мальчика на одну девочку. Разумеется, предпринимались попытки объяснить эти неприглядные факты тем обстоятельством, что доходы афроамериканцев в среднем гораздо ниже, чем доходы белых, а разница в доходах — условие образовательных успехов. Однако это объяснение не срабатывает: результаты, показанные на экзамене SAT юношами и девушками из беднейших белых семей (ежегодный доход — менее $10 тыс. на семью), в среднем на 129 баллов выше, чем среди афроамериканцев в целом, и на 61 балл выше, чем среди афроамериканцев из семей с доходом $80-100 тыс. в год. Значит ли это, что тесты (которые придуманы белыми состоятельными мужчинами) по природе своей дискриминационны? Или же разные группы в среднем обладают разными способностями, в частности женщины в среднем менее способны к математике? 

Говоря о практической применимости формализованных экзаменов, важно понять, могут ли они вообще быть критерием приема в университеты. К настоящему времени существует целый ряд исследований, которые показывают, что результаты SAT с достаточно высокой степенью вероятности предсказывают последующие успехи студента в вузе, включая его оценки по итогам первого курса и всего обучения, получение им академических наград, вероятность бросить учебу, вероятность поступления в аспирантуру и т. д. Впрочем, оценки, полученные студентами в школе, предсказывают эти образовательные результаты даже чуть точнее, а самым надежным показателем оказывается сочетание SAT и школьных оценок. Более того, результаты математического компонента SAT предсказывают успехи в вузе даже чуть лучше, чем SAT в целом. При этом в среднем юноши в вузе имеют тенденцию учиться чуть хуже, чем можно было бы судить по их результатам SAT, а девушки — чуть лучше. 

Наконец, недавно была предпринята попытка выяснить, насколько результаты SAT отражают интеллектуальные способности. Психологи Мередит Фрей и Дуглас Деттерман решили проверить, как соотносятся результаты SAT с так называемым коэффициентом g, отражающим, как считается, общий уровень умственного развития человека (по сути, речь идет о пресловутом IQ). Корреляция оказалась высокой, Фрей и Деттерман даже вывели относительно несложную формулу, с которой результаты SAT можно конвертировать в примерный показатель IQ, и наоборот. Однако в своей работе исследователи вынуждены были пользоваться данными тестирования интеллекта, проводившегося армией США. При этом IQ тоже тест, к которому также существует множество методологических претензий. В частности, по мнению многих ученых, IQ не учитывает все аспекты когнитивных способностей человека. Поэтому специалисты все чаще дополняют его еще одним коэффициентом — EQ, отражающим так называемый эмоциональный интеллект, то есть способность распознавать и выражать собственные эмоции, управлять ими. Предполагается, что способности эти столь же необходимы для успешного взаимодействия с внешней средой, как и чистый интеллект. В итоге все эти результаты не снимают, конечно, претензий к формализованным экзаменам. В частности, критики предполагают, что структура теста не учитывает особенностей женского мышления (документально установлено, что, сдавая тесты, девочки вдвое чаще меняют свои ответы, а также оставляют больше вопросов без ответа вообще). 

Более вероятно, однако, что формализованные экзамены просто отражают существующие культурные стереотипы. Так, субкультура афроамериканских подростков построена на отказе от успеха в белом обществе. В частности, хорошая учеба воспринимается как нечто "белое". Точно так же математика считается (или считалась) в обществе неженской наукой, а потому девочки заранее подсознательно ожидают здесь трудностей и на экзамене чувствуют себя неуверенно. В пользу последнего вывода говорит, в частности, статья большой группы исследователей, опубликованная в июньском выпуске вестника Национальной академии наук США. Исследователи обработали данные по 34 странам, включая результаты, полученные девочками и мальчиками в ходе международного обследования знаний по математике и естественным наукам (TIMSS), и данные опросов, отражающих гендерные стереотипы в обществе. Оказалось, что наличие разрыва в оценках по математике, получаемых мальчиками и девочками, прямо зависит от распространенности в обществе стереотипов: чем больше общество уверено в неспособности девочек к математике, тем хуже их результаты TIMSS. Таким образом, уровень знаний и способностей во многом обусловлен социальной средой. 

Интересно, что в России с ее повышенной любовью к социальной справедливости обсуждение адекватности или неадекватности ЕГЭ совершенно не затрагивает вопрос о том, как введение теста и его формат сказываются, например, на выходцах из беднейших семей, из глубинки, из национальных меньшинств, не говоря уже о женщинах. Впрочем, именно благодаря введению формализованного экзамена мы через несколько лет и получим возможность обоснованно рассуждать о положении этих групп в нашем обществе. 

Игорь Федюкин 

Огонек

Поделиться
Комментировать

Популярное в разделе