LINEBURG


<< Пред. стр.

страница 5
(всего 11)

ОГЛАВЛЕНИЕ

След. стр. >>

Р
Ч
Е
С
К
И
Е


в
ы
с
о
к
и
е
Вера в свои возможности
Хороший самоконтроль
Хорошая социальная
интеграция
Высокая способность к
концентрации внимания и
большой интерес ко
всему новому
Постоянный конфликт
между собственным
представлением о мире и
школьными требованиями
Недостаточная вера в себя
и недостаточное самоуважение
Боязнь оценки со стороны
окружающих
С
П
О
С
О
Б
Н
О
С
Т
И


н
и
з
к
и
е
Энергия направлена на
достижение успеха в
учебе
Неудачи воспринимаются как катастрофа
Боязнь риска и высказывания своего мнения
Пониженная общительность
Боязнь удара по самооценке
Хорошая (по крайней мере
по внешним признакам)
адаптация и
удовлетворенность жизнью
Недостаточный интеллект
компенсируется
социальной общительностью или некоторой пассивностью

Дети с высоким уровнем интеллекта и низким уровнем креативности стремятся к школьным успехам, которые должны выразиться в форме отличной оценки, то есть в учебе у них доминирует соревновательная мотивация. Они крайне тяжело воспринимают неудачу, можно сказать, что у них преобладает не надежда на успех, а страх перед неудачей, то есть мотивация избегания доминирует над мотивацией достижения. Они избегают риска, не любят высказывать публично свои мысли. Они сдержанны, скрытны и дистанцируются от своих одноклассников. У них очень мало близких друзей. Они не любят быть предоставлены самим себе и страдают без внешней адекватной оценки своих поступков, результатов учения или деятельности. Можно сказать, что эти дети имеют дисциплинированный и исполнительный, но недостаточно инициативный и открытый когнитивный стиль (недостаточно открытый новому опыту).
Дети, обладающие низким уровнем интеллекта, но высоким уровнем креативности, часто попадают в позицию «изгоев». Они с трудом приспосабливаются к школьным требованиям, часто имеют увлечения «на стороне» (занятия в кружках, хобби и т. д.), где они в свободной обстановке могут проявить свой творческий потенциал. Они наиболее тревожны, страдают от неверия в себя, «комплекса неполноценности». Часто учителя характеризуют их как тупых, невнимательных, поскольку они с неохотой выполняют рутинные задания и не могут сосредоточиться. Можно сказать, что высокий инновационный потенциал, инициативный когнитивный стиль здесь вступают в противоречие с низкой дисциплинированностью ума, низким самоконтролем.
Дети с низким уровнем и интеллекта и творческих способностей внешне хорошо адаптируются, держатся в «середняках» и довольны своим положением. Они имеют адекватную самооценку. Низкий уровень предметных способностей компенсируется развитием социального интеллекта, общительностью, пассивностью в учебе.
Практически все авторы отмечают высокий энергетический уровень одаренных детей и малую продолжительность сна. Это явление не стоит путать с гиперактивностью и повышенной возбудимостью. Одаренные дети обычно спят немного и рано отказываются от дневного сна. Высокий энергетический уровень сопровождается не только повышенной познавательной активностью, но и так называемой ИНТЕЛЛЕКТУАЛЬНОЙ ИНИЦИАТИВОЙ: склонностью ставить перед собой новые сложные задачи, что, по мнению Д. Б. Богоявленской, является неотъемлемым признаком таланта.
У интеллектуально одаренных детей умственное развитие опережает коммуникативное и физическое, которое обычно соответствует норме для возраста, хотя среди интеллектуалов встречаются и больные, и здоровые дети.
Благодаря умственной инициативе одаренные дети ставят перед собой задачи, которые еще не способны разрешить.
Еще одна особенность интеллектуально одаренных — большой когнитивный ресурс: они могут одновременно следить за несколькими рядами событий (хорошее распределение внимания); как правило, у них отличная память; они имеют большой словарный запас, отличаются неуемной страстью к чтению энциклопедий, коллекционированию; любят решать задачи самостоятельно и отвергают навязанный ответ, причем часто погружаются в задачу так, что не замечают окружающих.
Поскольку дети в возрасте 3—6 лет имеют наивные убеждения, что их взгляд на мир такой же, как и у всех людей (тогда как на самом деле положение обратное!), одаренным очень трудно общаться со сверстниками: они любят прерывать собеседника, поправлять и критиковать взрослых и считать себя всегда правыми. Однако они предпочитают общаться со взрослыми, у которых находят интеллектуальное понимание, а не со сверстниками.
От конфликтов с ровесниками их спасает развитое чувство справедливости и не по-детски широкие взгляды на жизнь, а также чувство юмора.
Пожалуй, развитое чувство юмора и так называемый перфекционизм (стремление доводить любое дело до совершенства) являются самыми главными личностными чертами — спутниками ранней интеллектуальной одаренности.
[Примечание научного редактора. Отдельного комментария заслуживает вопрос о специальных видах одаренности, проявляющейся в отдельных видах деятельности. Когда удается точно определить ту сферу деятельности, в которой ребенок может проявить себя незаурядно высоким уровнем достижений, то в ней ребенок приобретает уже в детском возрасте все социальные черты поведения, присущие одаренным людям. То занятие, которое обладает для него внутренней ценностью и удовлетворяет мотивацию самореализации, временами поглощает его настолько, что он проявляет черты нонконформизма — поведения, неудобного для педагогов и взрослых. В одаренных детях, рано нашедших свое призвание, приходится видеть и признавать личность с высочайшим уровнем самоуважения, который непостижим для многих «обтесанных» жизнью взрослых. Любые антипедагогические попытки «сломать» эту нестандартность образа мысли и действия, подорвать самоуважение только вредят: продуктивность снижается, а невротическая конфликтность обостряется.]

Ключевые термины: способности, функциональные системы, обучаемость, креативность, тестовый интеллект, коэффициент интеллектуальности, генеральный фактор «G», специальная способность, умственный темп, факторный анализ, конвергентное и дивергентное мышление, связанный и свободный интеллект, парциальные факторы, инволюция, иерархическое мышление, модели интеллекта, интеллектуальная инициатива.




3.5. ДИАГНОСТИКА УМСТВЕННОГО
РАЗВИТИЯ И ПРЕДМЕТНОЙ
УСПЕВАЕМОСТИ УЧАЩИХСЯ

От научного редактора:
Обследования с целью выявления умственно отсталых и особо одаренных детей — важные, но относительно эпизодические и не самые типичные виды психодиагностических обследований. Они предпринимаются в начальных классах и на рубежах перехода из младшей школы в среднюю, а затем — в старшие классы. Более типовая и регулярная задача — это задача ежегодного контроля за тем, как влияет процесс школьного обучения на умственное развитие школьников. Известный психолого-педагогический постулат «Обучение должно вести за собой развитие» на практике должен приводить к тщательному контролю за тем, чтобы не возникало обратной ситуации — когда обучение, недогружающее уже имеющийся интеллектуальный потенциал данного школьника, «тормозит» развитие или, наоборот, далеко оторвавшись от реальных возможностей, ничего не дает развитию, так как выходит за пределы зоны ближайшего развития.
В настоящем параграфе даются сведения о том, как должен быть методически обеспечен контроль за соответствием предметных знаний и умений школьника его интеллектуальному потенциалу.
В предыдущем параграфе 3.3 мы познакомились с группой наиболее известных зарубежных подходов к проблеме интеллекта и одаренности. Здесь же больше внимания уделяется теоретической концепции и конкретным методическим разработкам отечественных специалистов. Это прежде всего специалисты, представленные лабораторией Психологического института Российской академии образования, которую много лет возглавлял К. М. Гуревич (в дальнейшем эта лаборатория будет сокращенно именоваться ЛПИ). Критериально-ориентированный подход при создании тестов умственного развития, разработанный этим коллективом, представляет собой принципиально иную методологию, означающую отказ от использования статистических норм для принятия диагностических заключений. Это сближает разработанные тесты с традиционной для обучения задачей контроля усвоения нормативно заданного учебного материала, предусмотренного учебной программой.

Проблема диагностики умственного развития

Для диагностики умственного развития и оценки предметной успеваемости в школе используются тесты интеллекта и учебных достижений (последние носят название педагогических, или дидактических, тестов).
В настоящее время можно выделить две главные функции этих групп тестов в системе образования. Во-первых, обеспечение эффективного усвоения учебных знаний и навыков, а также полноценного умственного и личностного развития. Во-вторых — оценка качества самого образования, то есть выявление того, насколько та или иная образовательная система обеспечивает всестороннее развитие ребенка.
В соответствии с этим можно выделить два класса психодиагностических задач, решение которых требует применения тестов интеллекта и учебных достижений. В первый входят: диагностика готовности к школе, определение причин школьной неуспеваемости, выявление одаренных детей, дифференциация обучения, выявление сложностей и отклонений в развитии и др. Во второй можно отнести осуществление оценки эффективности программ и методов обучения, контроля за умственным развитием и приобретенными знаниями и навыками.
Как уже отмечалось в предыдущих главах, в психологии нет однозначного мнения о том, что же такое интеллект. Каждый исследователь или коллектив исследователей, приступающий к разработке диагностического инструментария в этой сфере, пытается выработать свое собственное рабочее определение интеллекта.
К. М. Гуревич определяет интеллект как «присущий каждому человеку психофизиологический механизм, который находится в действии постоянно и служит условием, предпосылкой приобретения, переработки и применения поступающей информации» (К. М. Гуревич, Б. И. Горбачева, 1992, с.17).
Здесь, под УМСТВЕННЫМ РАЗВИТИЕМ понимается совокупность как знаний, умений, так и умственных действий, сформировавшихся в процессе приобретения этих умений и знаний. Если интеллект — это условие усвоения знаний и умений, то умственное развитие характеризует в первую очередь содержание, способы и формы мышления.
Специальный анализ, проведенный российскими психологами (работы К. М. Гуревича, Д. Б. Эльконина, Н. Ф. Талызиной и др.) по проблемам диагностики интеллекта, привел к формулированию важного вывода о том, что тесты интеллекта измеряют главным образом степень приобщенности испытуемого к той культуре, которая представлена в тесте, уровень усвоения достижений этой культуры. При этом сам тест не показывает, почему один сумел это сделать лучше, чем другой. Называть ли результат тестирования оценкой интеллекта или степенью приобщенности человека к культуре, представленной в заданиях теста, — на этот вопрос тестовые результаты не дают ответа. Тем самым глобальную прогностичность тестов интеллекта в масштабе всей жизни нельзя считать доказанной. Часто тестируется не потенциал, а результат развития. Наряду с этой критикой признано, что тестовые испытания могут дать ценный материал о ДОСТИГНУТОМ уровне развития тех или иных особенностей детей, что может быть эффективно использовано для разных задач обучения и воспитания.
За рубежом критическое отношение к тестам интеллекта было вызвано главным образом их дискриминационной направленностью по отношению к представителям национальных меньшинств, иммигрантам, детям из бедных семей и т. д. (публикации Л. Кэмина, Дж. Лолера, Дж. Наэма и др.). В предыдущих главах уже неоднократно отмечалось, какой остроты достигла социально-политическая критика тестов интеллекта в Советской России в 30-е годы.
Новые тенденции развития психодиагностики позволяют снять многие критические замечания, высказываемые в адрес тестирования. Так, например, внедрение компьютерного тестирования открывает возможности изучения процессуальной стороны деятельности, которую моделирует тест, позволяет выявлять индивидуальные стратегии решения заданий, анализировать затруднения, которые испытывает субъект при выполнении заданий разного типа.
Большой прогресс наблюдается и в преодолении одного из основных недостатков тестирования — выявления наличного уровня достижений без ориентировки на потенциальные возможности человека, которые при традиционном подходе остаются скрытыми. Это удается реализовать в тестах обучаемости, основанных на идее «зоны ближайшего развития». В них вводится звено педагогического воздействия и отслеживается успешность дальнейшего продвижения испытуемого после вмешательства взрослого.
В основе программы исследований, осуществляемой коллективом ЛПИ К. М. Гуревича, лежит представление о нормативности психического и личностного развития. Главной исследовательской задачей в связи с этим является разработка теоретических принципов критериально-ориентированной диагностики и их реализация в конкретных методах. В качестве критерия предложено использовать так называемый «СОЦИАЛЬНО-ПСИХОЛОГИЧЕСКИЙ НОРМАТИВ» (СПН).
В сжатом виде СПН можно определить как систему требований, которые общество предъявляет к психическому и личностному развитию каждого из его членов. Чтобы не быть отвергнутым от существующей вне его общности, человек должен овладеть теми требованиями, которые к нему предъявляются. Эти требования и могут составлять содержание СПН, которые в сущности являются идеальной моделью требований социальной общности к личности. Следовательно, оценка результатов тестирования должна проводиться по степени близости к СПН, который дифференцируется в образовательно-возрастных границах. Такие требования могут быть закреплены в форме правил, предписаний, требований к человеку и включать самые разнообразные аспекты: умственное развитие, нравственное, эстетическое и т. д. Теоретической основой такого определения СПН служит то понимание развития, которое сложилось в психологии и которое А. Н. Леонтьев характеризует как специфический процесс усвоения или присвоения ребенком достижений предшествующих поколений.
Следует отметить, что о нормативности умственного развития писал Л. С. Выготский, который отмечал, что «...для динамики умственного развития в школе и для продвижения ребенка в школьном обучении определяющей является не столько сама по себе величина IQ, т. е. уровень развития на сегодняшний день, сколько отношение уровня подготовки и развития ребенка к уровню требований, которые предъявляются школой. Эту последнюю величину — уровень требований, предъявляемых школой, предложили в педологии называть сейчас идеальным умственным возрастом» (Выготский, 1990, с. 404).
Требования, составляющие содержание СПН, вполне решены, они присутствуют в образовательных программах, в квалификационных профессиональных характеристиках, собирательном мнении учителей, воспитателей, родителей. Такие нормативы историчны, они меняются вместе с развитием общества. Жизнь нормативов, т. е. время их существования, зависит от отнесенности к той или иной сфере психического, с одной стороны, и от темпов развития общества, с другой.
Так, наиболее динамичны нормативы умственного развития, поскольку научно-технический прогресс выдвигает все новые требования к человеку, его подготовленности, знаниям, умениям, а это влечет за собой пересмотр учебных программ, квалификационных требований. Можно предположить большую консервативность нормативов, относящихся к нравственной и другим сферам личности.
Учитывая роль обучения в развитии ребенка, при выявлении норматива необходимо опираться на анализ современных программ обучения, которые, учитывая даже их несовершенство, призваны давать учащимся в систематизированном виде основополагающие понятия и умственные действия, способные служить показателями умственного развития на разных возрастных ступенях.
В целом следует признать, что создатели традиционных психодиагностических методик стихийно ориентировались на существующие в их странах на тот период времени СПН, однако никакого теоретического обоснования этому в трудах зарубежных психологов найти не удается. Когда речь идет о содержании тестов, опросников, то обычно упоминаются всякого рода формальные правила составления вопросов, избегания повторов, подсказок и т. д.
Иногда высказывается мнение, что нормативный подход ведет к ограниченному пониманию развития. Следует согласиться с тем, что этот подход не может, разумеется, охватить умственное развитие во всем его многообразии, но мы и рассматриваем СПН как некий обязательный минимум, но не предел развития.
В целом трудно переоценить введение принципа нормативности в диагностику. По существу его введение заставляет исследователя пересмотреть цели тестирования и все этапы конструирования, проверки, интерпретации методик. И в первую очередь позволяет подойти к содержательной диагностике, предусматривающей обязательное теоретическое обоснование содержания, вводимого в задания теста.
Введение принципа нормативности заставляет пересмотреть способы обработки результатов. Явно приоритетным становится качественный анализ результатов тестирования. Поскольку мы закладываем в тест совершенно определенное содержание (понятия, логико-функциональные отношения и пр.), то качественный анализ позволит нам выявить трудности, недостатки развития, наиболее типичные ошибки, наименее усвоенные содержательные характеристики и т. д. Все это ведет к открытию возможностей построения коррекционной работы, которая была явно оторвана от психодиагностики при традиционном тестировании. Более того, принцип коррекционности выдвигается как один из важнейших принципов разработки нормативной методики.
[Примечание редактора. Внимательный читатель, по-видимому, обратит внимание на заостренную полемичность в противопоставлении автором данного параграфа разделяемого им подхода традиционному тестированию. В разделах 1.1 и 2.1 редактор издания пытался раскрыть мнимый характер категоричного противопоставления качественного и количественного подходов в психодиагностике. Те самые современные компьютерные тесты, которые упоминает сам автор данного параграфа, предоставляют широкие возможности для так называемого анализа ответов на задания (item-response analysis), что позволяет обследователю быстро выделить конкретное подмножество заданий, на которых испытуемый допустил ошибки, и увидеть, каковы эти ошибки. Кроме того, введение особых шкальных ключей для учета «стиля ошибок» позволяет выделять из результатов теста ценнейшую информацию для психокоррекции абсолютно стандартизированным способом — путем подсчета суммарных баллов по особым «стилевым» шкалам.]

Система возрастной диагностики умственного развития

Рассмотрим психодиагностические методики по их отнесенности к разным возрастам. Для диагностики умственного развития учащихся младших классов может быть применен тест Д. Векслера и тест Дж. Равена. Тест Векслера необычайно популярен во многих странах мира, поэтому рассмотрим его подробнее.
В 1939 году была опубликована первая форма шкал Дэвида Векслера, известная как шкала интеллекта Векслера—Беллевью. Первым отличием теста от других было то, что это один из немногих тестов, которые разрабатывались сначала для взрослых и лишь позднее переделывались для детей разного возраста. Еще одно отличие теста от всех других состояло в том, что он включал две шкалы: вербальную и невербальную (шкалу действия), при этом предусматривалось вычисление IQ для каждой шкалы в отдельности и суммарного IQ. Задания одного типа не сгруппированы по возрастам (как в тесте Бине), а объединены в субтесты и расположены в порядке возрастающей трудности. И, наконец, тест предусматривал возможность установления психиатрического диагноза, связанного с умственной отсталостью. Тест индивидуальный (может проводиться только с одним испытуемым).
В 1955 году была опубликована одна из последних шкал интеллекта для взрослых (WAIS), в которую вошло 11 субтестов.
Помимо шкал для взрослых, Векслером были созданы шкалы для детей (от 6,5 до 16,5 лет). Последнее издание WISC было опубликовано в 1974 году. В него были включены 12 субтестов. По сравнению со шкалой для взрослых тест для детей включает еще один дополнительный субтест — «лабиринты».
Итак, детский вариант теста включает 12 субтестов:
1. «Осведомленность». Испытуемому задаются 30 вопросов из разных областей знаний (житейских, научных) и диагностируются особенности памяти и мышления.
2. «Понятливость». Субтест включает 14 вопросов, ответы на которые требуют умения строить умозаключения.
3. «Арифметический» субтест представляет из себя 16 задач, решение которых требует умения оперировать числовым материалом, сообразительности, внимания.
4. «Сходство». Испытуемому необходимо выполнить 16 заданий на нахождение сходства понятий, что требует умения логически обрабатывать понятия и проводить операцию обобщения.
5. «Словарный» субтест требует от испытуемого определить 40 понятий как конкретных, так и абстрактных. Для выполнения заданий необходим большой словарный запас, эрудированность, определенная культура мышления.
6. «Повторение цифр». Этот субтест диагностирует особенности внимания и оперативной памяти, в нем требуется повторить за экспериментатором ряд цифр, который может включать от трех до девяти знаков.
7. «Недостающие детали». Испытуемому предъявляются 20 картинок с изображениями предметов, у которых отсутствуют какие-то детали, их и необходимо назвать. Здесь особенно важны внимание, перцептивные способности.
8. «Последовательные картинки». Испытуемому предъявляются 11 сюжетных картинок, которые следует положить в таком порядке, чтобы получился рассказ с последовательными событиями. Необходимо логическое мышление, понимание сюжета, умения организовать его в единое целое.
9. «Кубики Косса». Испытуемому предлагается из кубиков с разно окрашенными гранями сложить модель по образцу, изображенному на карточке. Диагностируются аналитико-синтетические способности испытуемого, пространственные способности.
10. «Складывание фигур». Необходимо из разрезанных частей сложить завершенные фигуры (лошадь, машина и др.). Нужно уметь работать по эталону, соотносить части и целое.
11. «Кодирование». Даны цифры от 1 до 9, каждой из которых соответствует какой-то знак, требуется, глядя на образец, проставить соответствующие значки предлагаемым рядом цифр. Анализируется внимание, его концентрация, распределение, переключение.
12. «Лабиринты». Требуется найти выход из изображенных на листе бумаги лабиринтов. Диагностируется умение решать перцептивные задачи, произвольность, устойчивость внимания.
Тест прошел все необходимые проверки. Получены высокие показатели его надежности и валидности.
Векслером была создана также шкала для дошкольников и младших школьников (для возраста от 4 до 6,5 лет). Эта шкала была опубликована в 1967 году. Она состоит из 11 субтестов.
Стандартный IQ, вычисляемый по тесту, имеет среднее 100 и квадратическое (стандартное) отклонение 15.
Итак, в настоящее время имеются три формы шкал Векслера, предназначенные для разных возрастов. Предполагается, что тест может быть использован для диагностики готовности к школе и оценки причин неуспеваемости. В нашей стране тест Векслера был адаптирован А. Ю. Панасюком (1973) и позднее опубликован в обновленной редакции в Санкт-Петербурге (Ю. И. Филимоненко, В. И. Тимофеев, 1992).
Одним из самых существенных недостатков теста Векслера является неотчетливость его содержательного наполнения (что характерно для многих зарубежных методов), поэтому по результатам тестирования трудно строить коррекционно-развивающую работу с детьми.
Еще одним очень популярным тестом умственного развития, который пригоден для младших школьников, является тест Дж. Равена, или «Прогрессивные матрицы Равена».
Это невербальный тест, разработанный Л. Пенроузом и Д.ж. Равеном в 1936 году в черно-белом варианте и в 1949 году в цветном. Черно-белый вариант теста предназначен для обследования детей, начиная с 8 лет и взрослых до 65 лет. Тест состоит из 60 матриц или композиций с пропущенным элементом. Испытуемый выбирает недостающий элемент среди 6—8 предложенных. Задания сгруппированы в пять серий (А, В, С, Д, Е), каждая из которых включает 12 однотипных матриц, расположенных в порядке возрастающей трудности. Тест не ограничен во времени и может проводиться как индивидуально, так и в группе. При выполнении теста испытуемый должен проанализировать структуру образца, понять характер связей между элементами и выбрать отсутствующую часть путем сравнения с предлагаемыми на выбор ответами. Для успешного выполнения заданий от обследуемого требуется умение концентрировать внимание, умение мысленно оперировать образами в пространстве, хорошо развитая перцепция, логическое мышление (своеобразная «визуальная логика»).
Более простой вариант «Цветные матрицы Равена» включает серии заданий (А, Ав, В). Он предназначен для обследования детей от 5 до 11 лет, для лиц старше 65 лет, для лиц с языковыми затруднениями, для различных, групп пациентов, имеющих нарушения в интеллектуальной сфере. Помимо обычной бланковой формы тест существует в виде так называемых «вкладышей», когда испытуемый может пользоваться вырезанными карточками с вариантами ответов, вкладывая выбранную часть в качестве недостающей детали (чаще всего это используется для дошкольников).
Результаты тестирования с помощью теста Равена высоко коррелируют с результатами по тестам Векслера и Стэнфорд—Бине, высока его надежность. Предусмотрен перевод показателей в стандартные с вычислением IQ.
Для диагностики умственного развития учащихся 3—6-х классов разработан Групповой интеллектуальный тест (ГИТ) словацким психологом Дж. Вандой. Тест переведен и адаптирован для выборки российских школьников в ЛПИ (М. К. Акимова, Е. М. Борисова и др., 1993).
ГИТ, как и другие тесты интеллекта, выявляет, насколько испытуемый к моменту обследования овладел предлагаемыми ему в заданиях словами и терминами, а также умениями выполнять с ними некоторые логические действия — все это характеризует уровень умственного развития испытуемого, существенный для успешного прохождения школьного курса.
ГИТ содержит 7 субтестов: исполнение инструкций, арифметические задачи, дополнение предложений, определение сходства и различия понятий, числовые ряды, аналогии, символы.
В первом субтесте от испытуемого требуется как можно быстрее и точнее выполнить ряд простых указаний (подчеркнуть самое большое из чисел, оценить число букв в трех словах и подчеркнуть то, которое является самым длинным, и т. д.). Для правильного выполнения всех заданий требуются элементарные знания в объеме третьего класса средней школы. Сложность состоит в том, чтобы быстро схватить смысл инструкции и как можно точнее ее выполнить.
Второй субтест (арифметические задачи) построен по принципу теста достижений. Он выявляет овладение конкретными учебными навыками в области математики.
Третий субтест содержит 20 заданий, представляющих собой предложения с пропущенными словами. Эти пропуски должен самостоятельно заполнить сам школьник. Успешность выполнения заданий зависит от умения улавливать смысл предложения, навыков его правильного построения и словарного запаса. Ошибки допускаются теми учащимися, которые еще недостаточно овладели умением строить сложные конструкции предложений с использованием слов, не несущих основную информативную нагрузку.
Выполнение следующего субтеста (определение сходства и различия понятий) показало, что он слабо дифференцирует испытуемых — почти все учащиеся успешно справились с входящими в него заданиями. Затруднения вызывают пары слов, значения которых малознакомы учащимся данного возраста («трудность-проблема», «мнение-взгляд» и др.). Сама логическая операция, задействованная в этом субтесте, вполне доступна школьникам, она отрабатывается в школе при необходимости нахождения синонимов и антонимов.
Субтест «аналогии» включает 40 заданий. Овладение этой операцией необходимо и на этапе усвоения ребенком знаний и на этапе их применения. Включенные в субтест слова должны быть хорошо известны учащимся данного возраста. Задания субтеста включали логические отношения «вид — род», «часть — целое», «противоположность», «порядок следования» и др.
Наиболее доступными для учащихся оказались задания, содержащие логические отношения: «вид — род», «противоположность», «часть — целое», «математические отношения». Вероятно, именно эти логико-функциональные связи в наибольшей степени отрабатываются в процессе обучения, что позволяет детям достаточно легко их актуализировать (то есть вспомнить и применить) в ситуации тестирования (Е. М. Борисова, Г. П. Логинова, 1995).
В пятом субтесте требовалось закончить числовые ряды, поняв закономерность их построения. В ГИТ ряды образуются: 1) путем увеличения или уменьшения каждого последующего члена ряда за счет приближения к предыдущему или вычитания из него определенного целого числа — 14 заданий; 2) путем умножения (или деления) каждого последующего числа на целое число — 2 задания; 3) путем чередования действий сложения и вычитания — 3 задания; 4) путем чередования действий умножения и сложения — 1 задание.
Оценивая успешность выполнения пятого субтеста в целом, следует отметить, что он оказался малодоступным для учащихся, входивших в обследованную выборку. Большой процент ошибок начинается уже с четвертого задания и значительно возрастает с одиннадцатого, где вводится более сложный алгоритм построения ряда.
Таким образом, ошибочные решения возникают из-за недостаточно развитого умения анализировать условия. Сложившийся стереотип отыскивания правил построения ряда направляет мысль ученика на то, что правило должно остаться неизменным. Недостаточная гибкость мышления, неумение быстро найти новый способ действия приводят к ошибкам. В учебной деятельности школьники этого возраста редко сталкиваются с необходимостью резкой смены алгоритмов решения задач. Чаще алгоритмы решения задаются учителем, и от детей требуется только их освоение и закрепление путем решения школьных однотипных заданий.
КАЧЕСТВЕННЫЙ АНАЛИЗ теста показал основные причины затруднений, которые могут испытывать учащиеся при его выполнении. Среди них: а) отсутствие конкретных знаний в определенной области (незнание понятий, сложных синтаксических структур и др.); б) недостаточное владение некоторыми логико-функциональными отношениями между словами; в) определенная ригидность, стереотипность подходов к решению некоторых заданий; г) некоторые особенности мышления младших подростков (ассоциативность, недостаточно глубокий анализ понятий и др.). Необходимо учитывать, что все эти затруднения связаны с особенностями психического развития и жизненного опыта детей этого возраста (Е. М. Борисова, Г. П. Логинова; 1995).
Для диагностики умственного развития учащихся 7—9-х классов коллективом К. М. Гуревича разработан Школьный Тест Умственного Развития (ШТУР).
В задания ШТУР были включены понятия, подлежащие обязательному усвоению, 8 учебных предметах трех циклов: математического, гуманитарного и естественно-научного. Помимо этого, определялась осведомленность в некоторых понятиях общественно-политического и научно-культурного содержания.
Тест состоит из 6 субтестов: 1 и 2 — на общую осведомленность, 3 — на установление аналогий, 4 — на классификацию, 5 — на обобщение и 6 — на установление закономерностей в числовых рядах (М. Е. Акимова, Е. М. Борисова и др., 1987).
В этом параграфе мы остановимся лишь на нескольких принципиальных особенностях, отличающих ШТУР от традиционных тестов. Первое отличие — особое содержание, которое представлено в заданиях (не житейские, а школьные понятия, обязательные для усвоения). Второе отличие — иные способы репрезентации и обработки диагностических результатов (отказ от статистической нормы и использование в качестве критерия оценки индивидуальных результатов степени приближения к социально-психологическому нормативу). Третье отличие — коррекционная направленность методики, то есть возможность предусматривать на ее основе специальные способы исправления замеченных дефектов развития.
ШТУР соответствует высоким статистическим критериям, которым должен соответствовать любой диагностический тест. Он апробирован на больших выборках и доказал свою эффективность при решении задач определения умственного развития учащихся подросткового возраста.
Для диагностики умственного развития старшеклассников (8—10-е классы) может быть использован Тест структуры интеллекта Р. Амтхауэра. Он создан в 1953 г. (последняя редакция осуществлена в 1973 г.). Тест предназначен для измерения уровня интеллектуального развития лиц в возрасте от 13 до 61 года.
Тест разрабатывался в первую очередь как тест диагностирования уровня общих способностей в связи с проблемами профессиональной психодиагностики. При создании теста Р. Амтхауэр исходил из концепции, согласно которой интеллект является специализированной подструктурой в целостной структуре личности и тесно связан с другими компонентами личности, такими, как волевая и эмоциональная сферы, интересы и потребности.
Интеллект понимается Амтхауэром как единство некоторых психических способностей, проявляющихся в различных формах деятельности. В тест им были включены задания на диагностику следующих компонентов интеллекта: вербального, счетно-математического, пространственного, мнемического.
Тест состоит из девяти субтестов, каждый из которых направлен на измерение различных функций интеллекта. Шесть субтестов диагностируют вербальную сферу, два — пространственное воображение, один — память. Тест переведен к адаптирован на российской выборке школьников в ЛПИ. Тест содержит 9 субтестов: осведомленность, классификации, аналогии, обобщения, арифметические задачи, числовые ряды, пространственные представления (2 субтеста), запоминание вербального материала.
Р. Амтхауэр при интерпретации результатов теста предполагал, что с его помощью можно судить о структуре интеллекта испытуемых (по успешности выполнения каждого субтеста). Для грубого анализа «умственного профиля» он предлагал подсчитать отдельно результаты по первым четырем и по следующим пяти субтестам. Если суммарная оценка первых четырех субтестов превышает суммарную оценку следующих пяти субтестов, значит, у испытуемого больше развиты теоретические способности. Если наоборот, то практические способности.
Кроме того, по результатам тестирования можно выделить приоритетное развитие гуманитарных (по результатам выполнения первых четырех субтестов), математических (5-й и 6-й субтесты) или технических (7-й и 8-й субтесты) способностей, что может быть использовано в проведении профориентационной работы.
Для диагностики умственного развития выпускников средней школы и абитуриентов в ЛПИ был разработан специальный тест умственного развития — АСТУР (для Абитуриентов и Старшеклассников Тест Умственного Развития). Тест создан на тех же теоретических принципах нормативной диагностики, что и ШТУР (авторский коллектив: М. К. Акимова, Е. М. Борисова, К. М. Гуревич, В. Г. Зархин, В. Т. Козлова, Г. П. Логинова, А. М. Раевский, Н. А. Ференс).
Тест включает 8 субтестов: 1. Осведомленность. 2. Двойные аналогии. 3. Лабильность. 4. Классификации. 5. Обобщение. 6. Логические схемы. 7. Числовые ряды. 8. Геометрические фигуры.
Все задания теста составлены на материале школьных программ и учебников и предназначены для изучения уровня умственного развития выпускников средней школы. При обработке результатов тестирования можно получить не только общий балл, но и индивидуальный тестовый профиль испытуемого, свидетельствующий о приоритетном овладении понятиями и логическими операциями на материале основных циклов учебных дисциплин (общественно-гуманитарного, физико-математического, естественно-научного) и преобладании вербального или образного мышления. Таким образом, на основе тестирования можно прогнозировать успешность последующего обучения выпускников в учебных заведениях разного профиля. Наряду с особенностями умственного развития тест позволяет получить характеристику скорости протекания мыслительного процесса (субтест «лабильность»), что является свидетельством наличия у испытуемого определенной выраженности свойств нервной системы («лабильности — инертности»). Ниже приводятся примеры субтестов, входящих в тест АСТУР.
1. Осведомленность. От испытуемого требуется правильно дополнить предложение из пяти приведенных слов, например,
«Противоположным к слову «отрицательный» будет слово...
а) неудачный, б) спорный, в) важный, г) случайный, д) положительный.»
2. Двойные аналогии. Испытуемому необходимо определить логические отношения, существующие между двумя понятиями, при условии, что в обеих парах по одному понятию пропущено. Необходимо подобрать пропущенные понятия таким образом, чтобы между первым словом задания и первым словом одной из данных на выбор пар было такое же соотношение, как между вторым словом задания и вторым словом этой же пары. Например:
«Стол: х = чашка: у
а) мебель — кофейник
б) обеденный — посуда
в) мебель — посуда
г) круглый — ложка
д) стул — пить»
Правильным ответом будет «мебель — посуда».
3. «Лабильность». В субтесте требуется в очень короткий период времени быстро и без ошибок выполнить ряд простых указаний, например, таких: «Напишите первую букву своего имени и последнюю букву названия текущего месяца».
4. Классификации. Даются шесть слов. Среди них нужно найти два, только два, которые можно объединить по какому-то общему признаку. Например: «а) кошка, б) попугай, в) дог, г) жук, д) спаниель, е) ящерица». Искомые слова будут «дог» и «спаниель», поскольку их можно объединить по общему признаку: и то, и другое слово обозначает породу собак.
5. Обобщение. Испытуемому предлагаются два слова. Нужно определить, что между ними общего (найти наиболее существенные признаки для обоих слов), и записать это понятие в бланк для ответов. Например, «дождь — град». Правильным ответом будет слово «осадки».
6. Логические схемы. Испытуемому предлагается расположить в логическую схему от общего к частному несколько понятий. То есть требуется построить «дерево» логических отношений, обозначив место каждого понятия соответствующей буквой, а отношения между ними — стрелкой. Например: «а) такса, б) животное, в) карликовый пудель, г) собака, д) жесткошерстная такса, е) пудель.»
Схема такова:



7. Числовые ряды. Предлагаются числовые ряды, расположенные по определенному правилу. Необходимо определить два числа, которые были бы продолжением соответствующего ряда.
Например: «2 4 6 8 10 12 ? ?»
В этом ряду каждое последующее число на 2 больше предыдущего. Поэтому следующие числа будут 14 и 16.
8. Геометрические фигуры. Этот субтест диагностирует особенности пространственного мышления испытуемых и включает разнообразные задания на понимание чертежей, определение геометрических фигур по разверткам и др.
Проведение теста занимает около полутора часов. Тест проверен на надежность и валидность.
Апробация теста на выборках абитуриентов трех высших учебных заведений подтвердила его пригодность для отбора студентов на разные факультеты. Тестирование было проведено с абитуриентами физико-математического факультета педагогического института, лечебного факультета Медицинского института и гуманитарного колледжа. Оказалось, что первые лучше всего выполняли задания физико-математического цикла теста, вторые — задания естественно-научного цикла и последние — задания общественно-гуманитарного цикла. При этом коэффициент корреляции, отражающий степень связи между результатами тестирования по тесту в целом и величинами проходных баллов, был равен 0,70 при уровне значимости 0,01. Все это подтверждает правомерность использования АСТУР для отбора студентов на разные факультеты высших учебных заведений.
Таким образом, на сегодня психодиагностика располагает методическим инструментарием, позволяющим обследовать учащихся всех возрастов на предмет установления уровня умственного развития. Описанные выше методики дают возможность осуществлять лонгитюдные исследования, которые способствуют контролю за умственным развитием каждого ученика на всех образовательно-возрастных этапах. Это, в свою очередь, создает возможности для оказания при необходимости своевременной психологической помощи по коррекции и развитию интеллектуальных способностей детей разного возраста в период школьного обучения.
Задача центров практической психологии образования состоит в том, чтобы помочь научным коллективам быстро обновлять морально стареющий инструментарий на основе постоянной информационной обратной связи от практиков о том, как работает тест в целом и его отдельные задания.

Диагностика учебных достижений

Для диагностики успешности обучения в школе разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов либо малоформализованные диагностические средства, которые может использовать учитель, такие как наблюдение, беседа и др.). Как отмечает американский психолог А. Анастази, по численности этот тип тестов занимает первое место.
Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин и являются более объективным показателем обученности школьника, чем отметка. Последняя зачастую становится не только оценкой знаний учащегося, но и инструментом воздействия на него, может выражать отношение учителя к степени его дисциплинированности, организованности, особенностям поведения и т. д. Тесты достижений лишены этих недостатков, разумеется при условии грамотного их составлении и применения.
Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками учебным материалом, например, разделом математики «стереометрия» или курсом английского языка. На формирование способностей (например, пространственных) влияние обучения также будет сказываться, но оно не является единственным фактором, определяющим уровень их развития. Поэтому при диагностике способностей трудно найти однозначное объяснение высокой или низкой степени их развитости у школьника. Во-вторых, различие между тестами определяется целями их применения. Тесты способностей направлены главным образом на выявление предпосылок к тем или иным видам деятельности и претендуют на прогнозирование выбора для индивида наиболее подходящей профессии или профиля обучения. Тесты же достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т. д., то есть диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов. Хотя нельзя отрицать того факта, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной учебной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения. Указывая на разницу в обсуждаемых типах тестов, А. Анастази отмечает, что она наиболее выпукло выступает при оценке их валидности: «Лучший способ оценить тесты способностей — это осуществить прогностическую критериально-ориентированную валидизацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию» (А. Анастази, 1982, т.2, с. 37).
Тесты достижений отличаются также и от тестов интеллекта. Последние направлены не на диагностику конкретных знаний или фактов, а требуют от учащегося умения совершать с понятиями (пусть даже и учебными) определенные умственные действия, такие как аналогии, классификации, обобщение и др. Это отражено и в формулировании конкретных заданий тестов того и другого типа. Например, тест достижений на материале истории определенного периода может содержать такие вопросы:

«Заполни пропуски в предложениях:
Вторая мировая война началась в ........ году.
а) 1945
б) 1941
в) 1939
г) 1935

22 июня 1941 года фашисты напали на .......
а) Польшу
б) Советский Союз
в) Францию
г) Венгрию».

В тесте же умственного развития вопросы с использованием понятий из истории будут иметь следующий вид:

«Вам даны пять слов. Четыре из них объединены общим признаком, пятое слово к ним не подходит. Его надо найти и подчеркнуть.
а) товар б) город в) ярмарка г) натуральное хозяйство д) деньги
а) рабовладелец б) раб в) крестьянин г) рабочий д) ремесленник».

Для того, чтобы правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный ученик, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях большинства тестов достижений. Однако, если у него плохо сформированы умения работать с понятиями, анализировать их, находить существенные признаки и т. д., то задания теста интеллекта могут вызвать значительные затруднения (поскольку для их выполнения одной хорошей памяти недостаточно). Необходимо владение целым рядом мыслительных операций, знание тех понятий, на материале которых составлены задания теста.
[Примечание редактора. В разделе 3.7 даются примеры того, как избежать буквальной зависимости успешности в тестах достижений от уровня развития «механической» памяти и основанного на ней поверхностно-ассоциативного мышления, как разрабатывать задания, требующие обнаружить понимание внутрипредметной логики, т. е. концептуальное освоение материала.]
Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, в психологии разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков, требующихся школьнику на разных этапах обучения, таких как некоторые общие принципы решения математических задач, анализа литературных текстов и др. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например, навыки работы с учебником, математическими таблицами, географическими картами, энциклопедиями и словарями. И, наконец, существуют тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т. д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать учитель. Психолог же обязан обеспечить соблюдение всех формальных процедур, требуемых для создания надежного и валидного инструмента, с помощью которого можно было бы осуществлять диагностику и проводить сопоставления по исследуемым качествам отдельных учащихся или их групп (классов, школ, регионов и т. д.). То есть психолог должен выполнить роль методиста-тестолога.
Отдельные тесты достижений можно объединять в батареи, что позволяет получать профили показателей успешности обучения по разным школьным предметам. Как правило, тестовые батареи предназначены для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от класса к классу. Наряду с ними созданы батареи, которые позволяют получать такие данные. Это, например, тесты основных навыков (штата Айова) и успехов в обучении, тесты достижений и тесты учебных навыков Стэнфордского университета и др.
Рассмотрим в качестве примера Стэнфордский тест достижений (SAT), краткое описание которого приведено в книге А. Анастази (А. Анастази, 1982 г., т.2, с.42—43). Разработанный в 1923 г., он неоднократно перерабатывался, и последний вариант появился в 1973 г. Проведение всей батареи занимает 4—5 часов и осуществляется в несколько приемов. Некоторые блоки батареи могут использоваться самостоятельно, для оценки эффективности обучения по отдельным дисциплинам. Вот, например, какие субтесты входят в батарею SAT, предназначенную для детей 5 и 6-х классов (с середины 5-го до окончания 6-го):
1. Словарь: изучает словарный запас с помощью устного предъявления незавершенных предложений с просьбой к ребенку выбрать наиболее подходящее слово. Например, «Человек, который большую часть времени находится в плохом настроении, называется: а) отшельник б) актер в) брюзга д) учащийся».
2. Понимание прочитанного: ребенка просят прочитать отрывок прозы или стихотворения и к каждому задают серию вопросов. Для того, чтобы дать правильные ответы, учащийся должен уметь выделить главную мысль отрывка, ключевые моменты текста, понимать его скрытый смысл, уметь делать выводы из прочитанного.
3. Навыки анализа слов: ученик должен произнести зрительно предъявляемые ему отдельные буквы и их сочетания, составить слова из слогов.
4. Математические понятия: изучает понимание математических терминов и систем обозначений и действий, например, дробей, множеств, процентов и т. д.
5. Математические вычисления: включает оценку умений действовать с числами (буквенные обозначения не используются).
6. Применение математики: содержит типичные арифметические задачи, задания на измерения и составление графиков и др.
7. Грамотность: нахождение неправильно написанных слов.
8. Язык: требуется правильно использовать прописные буквы, формы глаголов и местоимений, верно строить предложения, соблюдать правила пунктуации и т. д.
9. Социальные науки: требуется выполнение заданий на основе знаний из области истории, экономики, политики, социологии и др.
10. Естественные науки: задания выявляют знания некоторых методов и терминов из области физики и биологии.
11. Понимание прослушанного: требуется прослушать текст и ответить на ряд вопросов.

В 1973 году SAT был стандартизован на национальной выборке школьников с 1-го по 9-й классы.
Следует отметить, что в США тесты достижений получили очень широкое распространение и используются не только в школе, но и в дошкольных учреждениях и для выборок взрослых людей (например, для определения уровня грамотности тех или иных слоев населения).
Что касается дошкольников, то наиболее актуальной задачей является определение готовности ребенка к обучению в школе. Здесь также широко могут использоваться тесты достижений (о других тестах, используемых в диагностике готовности к школе, см. 3.2). Широкую известность в США приобрела батарея, которая называется национальным тестом готовности (MRT). С его помощью диагностируется уровень овладения некоторыми важными для дальнейшего обучения понятиями (языковыми и количественными), такими как умение выделять разные звуки, находить последовательность событий (в картинках). В других тестах диагностируется уровень осведомленности ребенка, в окружающем мире, овладение языком и основами математических понятий, понимание на слух.
При составлении заданий теста достижений следует соблюдать ряд правил, которые позволяют создать надежный, сбалансированный инструмент оценки успешности овладения определенными учебными дисциплинами или их разделами (см. 3.7).

Ключевые термины: умственное развитие, тесты интеллекта, тесты достижений, социально-психологический норматив, качественный анализ, компьютерные тесты, осведомленность, аналогии, обобщение, классификация, числовые ряды.


3.6. ТЕСТ ОБЩЕОБРАЗОВАТЕЛЬНЫХ ЗНАНИЙ:
КОМПЬЮТЕРНОЕ АДАПТИВНОЕ ТЕСТИРОВАНИЕ

В отличие от предметно ориентированных тестов умственного развития (ТУР), описанных УВ предыдущей главе, в настоящей главе излагаются принципы создания Теста Общеобразовательных Знаний (ТОЗ). Если в различных вариантах ТУРа шкалы отражают прежде всего уровень сформированности определенных логических операций мышления, реализованных на материале понятий из школьных учебников (аналогии, обобщение и т. п.), то любые версии ТОЗ отражают в показателях по субшкалам достижения ученика по самим предметам школьной программы (математика, физика и т. п.). Если ТУР — междисциплинарный психолого-педагогический инструмент, то ТОЗ — чисто педагогический инструмент, то есть педагогический тест достижений. Примеры-образцы отдельных заданий ТОЗ даются в параграфе 3.7.
Разработка ТОЗ для российской школы означает создание российского аналога SAT (Стэнфордский тест достижений или, как позднее его стали называть, — Школьный тест достижений), который, как известно, является в США определенным стандартом федерального масштаба. Только наличие общефедерального стандарта позволит обеспечить в России реальную эквивалентность аттестатов зрелости, выяснить, в частности, объективную цену невиданному количеству «медалистов», которые вдруг начинают появляться в какой-нибудь рядовой и мало чем знаменитой школе где-нибудь в городе N-ске.
Программа создания и распространения российского ТОЗ должна, безусловно, учитывать как мировой опыт, так и специфику современной ситуации в России. Критики справедливо возражают: организационные решения, что стандартны для Запада в России могут не сработать из-за невиданного уровня «групповой сплоченности» (а попросту коррупции), имеющей место во всех слоях общества, в том числе среди чиновников и учителей, занятых в системе образования.
Но и технологические возможности разработчиков тестовых методик не стоят на месте. Новые возможности, и прежде всего в плане обеспечения информационной безопасности, дает компьютеризация.
Опишем здесь опыт решения проблемы создания ТОЗ, который накоплен в центре компьютерной психодиагностики «Гуманитарные технологии» при факультете психологии МГУ (руководитель центра — А. Г. Шмелев). Данный материал поможет читателям не только сориентироваться в самой проблеме создания ТОЗ, но и получить опыт знакомства с кратким и типичным научным отчетом о проведении экспериментальной апробации некоторого теста в процессе его разработки, а также с перспективами использования компьютеров в процессе тестирования.
В отличие от Стэнфордского теста ТОЗ в своих субшкалах буквально повторяет названия учебных предметов и в этом смысле является формализованным компьютеризированным аналогом школьных выпускных и вузовских вступительных экзаменов.
С самого начала ТОЗ разрабатывается как принципиально компьютерный тест. Важнейшие его особенности таковы: наличие очень широкого компьютерного БАНКА ЗАДАНИЙ (длинного перечня) по каждому предмету и наличие особой программы ТЕСТОВОГО ДИАЛОГА, которая позволяет предъявлять каждому испытуемому по сути дела уникальную выборку заданий (вариант) из этого банка заданий. Даже сами авторы ТОЗ не знают, какие именно задания предъявит компьютер данному конкретному испытуемому. Если же кто-то получит доступ к тексту заданий ТОЗ, и расшифрует их кодировку, то для того, чтобы «обмануть» ТОЗ необходимо выучить не только правильные ответы к сотням заданий, но и научиться их отличать от ложных формулировок. Легче выучить стройно и логично написанный учебник, чем заниматься этой работой.
В первую версию ТОЗ, прошедшую апробацию на абитуриентах МГУ в 1995 году, вошло 360 заданий — по 45 заданий на каждый из 8 основных предметов школьной программы. Это математика, русский и литература, физика, химия, биология, история, география и иностранный язык (английский). В каждом задании испытуемому предлагалось 4 варианта ответов, из которых 1 — правильный. В разработке заданий приняли участие независимые (не знавшие друг друга) учителя-предметники из московских школ и преподаватели МГУ, много лет участвовавшие в составлении и проверке заданий на вступительных экзаменах. Задания проходили анонимную перекрестную предварительную экспертизу, и затем лучшие из заданий были разбиты на однородные блоки по тематике и уровню сложности. По содержанию задания охватывают всю программу среднего образования и ориентированы на выпускников школ, абитуриентов вузов.
Испытуемый выполняет ТОЗ непосредственно за компьютером. Программа тестирования (ТЕСТАН-2, «Гуманитарные технологии», 1995) последовательно предъявляет вначале 15 заданий по математике, затем 15 — по русскому и литературе и т. д. — всего 120 заданий за 80 минут. Компьютер автоматически контролирует расход времени на каждый предмет и при исчерпании лимита времени по одному предмету программа начинает предъявлять задания по следующему предмету, засчитывая «пропуск» испытуемому по всем заданиям, на которые он не успел ответить (из предусмотренных 15).
По каждому предмету 15 заданий представляют пять тематических блоков и 3 уровня, сложности. Применяется алгоритм БЛОЧНОЙ РАНДОМИЗАЦИИ, т. е. частично случайного выбора заданий, ограниченного рамками блоков — определенных подмножеств заданий, среди которых каждый раз производится случайный выбор. Вначале предъявляются 5 самых легких заданий, затем 5 заданий среднего уровня трудности, затем — 5 самых трудных заданий. В результате даже плохо подготовленные и испытывающие волнение испытуемые получают возможность с самого начала «зацепиться», справиться по крайней мере с первыми простыми заданиями. Сильные испытуемые получают серьезное испытание на последней пятерке заданий. Здесь-то и проявляется различие между настоящими отличниками и «хорошистами». Самые слабые, как правило, просто не успевают приступить к пятерке самых трудных заданий, так как им не хватает времени.
Реальная трудность задания проверялась в пилотажном эксперименте и после этого корректировалась. В число легких попадали задания, с которыми справлялись более 70 процентов испытуемых, в числе трудных — с которыми справлялись менее 30 процентов испытуемых, остальные причислялись к средним по уровню трудности.
Схема начисления очков в ТОЗ-1 при расчете суммарного балла такова:
за правильный ответ — 4 очка,
за пропуск задания — 1 очко,
за ошибочный ответ — 0 очков.
Такая схема вносит необходимую поправку на вероятность случайных правильных ответов, которые по теории вероятности возможны с вероятностью 0,25.
После завершения такого нелегкого испытания испытуемые могли вспомнить только 10, максимум 25 процентов из предъявленных им заданий, но, конечно, не могли пересказать своим друзьям точные формулировки фальш-альтернатив (ложных ответов, или так называемых «дистракторов»). И если теоретическая вероятность повторения одного и того же задания у двух испытуемых равнялась 0,33·15 ˜ 5 заданиям, то практически крайне редко два испытуемых могли вспомнить больше одного одинакового задания. Даже после интенсивного обсуждения впечатлений от теста между собой у испытуемых оставалось полное впечатление, что тест включает сотни заданий по одному предмету. Естественно, что при дальнейшем наращивании банка заданий в ТОЗ-2 такое впечатление будет еще более усиливаться.
ТОЗ-1 имеет ряд модификаций для специальных групп абитуриентов. Например, версия ТОЗ-ПСИ (для абитуриентов психологического факультета) включала по 90 заданий всего по 3 предметам, входящим в состав вступительных экзаменов на факультет психологии МГУ: математика, русский и литература, биология. Каждый абитуриент отвечал за 50 минут на 90 заданий (по 30 на каждый предмет).
На этих абитуриентах факультета психологии проверялась, в частности, прогностическая валидность ТОЗ в отношении успешности сдачи вступительных экзаменов. Общая корреляция суммарного балла ТОЗ с суммарным баллом по вступительным экзаменам оказалась равной 0,61. При этом почти такое же значение достигла эта корреляция для субтеста «математика» (0,57). А вот с оценкой по сочинению балл по субтесту «словесность» коррелировал просто плохо. Сказалось, видимо, два обстоятельства: слабые представления абитуриентов о том, что такое «раскрыть тему», и высокая степень лотерейности в вариантах формулировок этих тем (вполне грамотным и в целом начитанным абитуриентам приходилось писать сочинения по авторам и произведениям, которых они либо никогда не читали, либо забывали и не успели повторить). Таким образом, невысокую суммарную корреляцию можно интерпретировать, в частности, как следствие низкой надежности не столько ТОЗ, сколько самого критерия — ведь элемент случайности на вступительных экзаменах выражен даже сильнее, чем в ТОЗ. За это говорит и факт резкого возрастания корреляции с результатами экзаменов для крайних групп по ТОЗ (самых успешных и самых неуспешных). Так, например, НИ ОДИН испытуемый с баллом ниже 50 процентов правильных ответов по ТОЗ не смог пройти на факультет психологии МГУ по конкурсу (конкурс был, как всегда, высоким — выше 7 человек на место). А самые лучшие абитуриенты по ТОЗ практически все успешно прошли конкурс.
Таким образом, на шкале ТОЗ можно найти граничные точки для «высшей» и «низшей» группы, позволяющие прогнозировать успешность при сдаче экзаменов с высокой степенью надежности — близкой к 0,95. Можно сказать, что для заведомо сильных и заведомо слабых учащихся будущие экзамены не оказываются «лотереей»: одни надежно их сдают, другие — надежно «проваливают». «Лотереей» с элементом везения-невезения экзамен становится для «середнячков», которые освоили учебную программу выборочно, частично.
Вопрос о «конкурентной валидности» ТОЗ по сравнению с вступительными экзаменами (т. е. позволяет ли ТОЗ лучше или хуже прогнозировать успешность обучения в вузе) может быть разрешен только после многолетнего, так называемого «лонгитюдного» наблюдения за тем, как будут учиться в вузе студенты, прошедшие ТОЗ в 1995 году.
Конечно, версия ТОЗ-1 есть только первый шаг к созданию эталонной методики такого типа. Она нуждается в существенной модернизации, масштабной апробации и накоплению репрезентативных норм, чтобы занять место федерального стандарта в данной области.

Адаптивное тестирование

Планируемая версия ТОЗ-2 должна включать уже не менее 200—300 заданий по каждому предмету, а также опираться на более совершенный программный алгоритм, использующий принципы так называемого АДАПТИВНОГО ТЕСТИРОВАНИЯ.
Адаптивным тестированием называется такая диалоговая тестовая программа, которая изменяет порядок предъявления тестовых заданий в зависимости от результатов выполнения испытуемым уже предъявленных заданий. Когда опытный экзаменатор проводит устный экзамен, он фактически всегда применяет некий упрощенный интуитивный вариант адаптивного тестирования. После первых удачных ответов экзаменующегося экзаменатор старается задать вопрос посложнее, и если учащийся справляется и с этим сложным вопросом, то экзаменатор, вполне справедливо экономя свое собственное время, ставит учащемуся оценку «5». После первых же ошибочных ответов экзаменатор, наоборот, «снижает планку» — задает самый простой вопрос, и если учащийся не справляется и с этим простейшим вопросом, то экзаменатор ставит учащемуся оценку «2». Таким образом, для выявления крайних случаев требуется гораздо меньше тестовых заданий при обеспечении практически того же уровня надежности. Дольше времени надо потратить и большее количество вопросов задать в случае «середнячков», которые с одними заданиями справляются, а с другими нет, так как освоили учебную программу не полностью. Смысл адаптивности в алгоритме тестирования в том, что тест адаптируется, настраивается на доступный испытуемому уровень сложности и тем самым быстрее локализует его истинный тестовый балл на шкале измеряемого свойства.
Конечно, 15 заданий по одному предмету — это мало, эта выборка заданий не обеспечивает полноценный охват всей учебной программы. Но если эти задания различаются по сложности хотя бы на 3 уровня, то возникает возможность для применения следующего упрощенного (и потому понятного начинающим) адаптивного алгоритма. После первой пятерки самых простых заданий программа сразу же подсчитывает процент правильных ответов. Если решены все 5 заданий, то программа сразу переводит испытуемого на самый высокий уровень трудности. Если решены от 2 до 4 заданий, то программа переводит испытуемого на средний уровень трудности. В противном случае испытуемый остается на первом уровне трудности. На втором этапе программа применяет аналогичную логику. С теми, кто справился с 4—5 заданиями высшего уровня трудности, тестирование можно прекращать и ставить балл, учитывающий общий процент решенных задач с учетом их цены (более трудные имеют, конечно, более высокую цену). Если же на высшем уровне трудности испытуемый допустил более одной ошибки, то тестирование продолжается уже на среднем уровне трудности. Те испытуемые, которые долго остаются на среднем уровне, выполняют тест значительно дольше — пока колебания их текущего балла (процента правильных ответов) не стабилизируются в рамках пренебрежимо малого интервала, равного ошибке измерения.
«ТРЕХУРОВНЕВЫЙ АЛГОРИТМ», подобный описанному выше, позволяет при предъявлении в среднем 15 заданий добиваться такой же точности-надежности, как и тест со сплошным предъявлением 45 заданий, не учитывающий уровень трудности заданий. То есть, огрубление говоря, введение трех уровней трудности и оптимального алгоритма перехода с уровня на уровень позволяет втрое сократить расходы на. продолжительность тестирования.
Впрочем, выигрыш от адаптивности состоит не только в экономии времени, но и в информационной безопасности. Чем меньше заданий предъявляется одному испытуемому из банка заданий, тем менее становится «прозрачным», обозримым для испытуемых весь банк заданий.
Постепенное расширение банка заданий и создание специализированных версий ТОЗ для более младших классов будет создавать у детей привычку к выполнению таких процедур контроля знаний. Применение тематической блочной структуры в рамках одного предмета, наряду с адаптивными алгоритмами тестирования, не только сэкономит дорогое компьютерное время в компьютерных классах, но и позволит быстро и надежно локализовать «проблемные» зоны — провалы в усвоении материала у данного конкретного ученика.
Если тестовые задания не классифицированы по уровню сложности, то при применении компьютеров возможность для использования адаптивного тестирования в принципе сохраняется. В частности, может быть использован простейший АЛГОРИТМ «СХОДЯЩИХСЯ ПОРОГОВ». После предъявления какого-то начального набора заданий (минимально тематически представительного для данной учебной дисциплины) компьютерная программа начинает постоянно сравнивать (после каждого нового задания) текущий процент правильных ответов, показанный испытуемым, с двумя порогами — высоким порогом «зачета» и низким порога «незачета». Те испытуемые, которые хорошо овладели учебным материалом и достигли за минимальное число тестовых заданий верхнего порога (например, в 90 процентах правильных ответов), быстро получают «зачет» и освобождаются от дальнейшего тестирования. Так же быстро «освобождаются» те испытуемые, которые заведомо на выучили материал, и их ответы мало чем отличаются от случайного гадания (поначалу порог незачета может быть низким — в 40—50 процентов). Остальные испытуемые, попавшие в область неопределенности между двумя порогами, продолжают выполнение теста. С каждым новым заданиям два порога сближаются. Так что при исчерпании всех заданий, предназначенных для одного испытуемого (это не менее 40 за сеанс), каждый испытуемый либо попадает в группу успешных, либо в группы неуспешных (к последней относятся также те, кто не уложился с выполнением теста в отведенный временной лимит). Такая простейшая схема адаптивного тестирования обеспечивает серьезную экономию времени при проведении простейшей недифференцированной оценки уровня знаний («зачет / незачет»). Она может быть полезной и экономичной, например, в ситуации квалификационного отбора (селекции) кандидатов в группы, с которыми в дальнейшем производится более тонкая диагностика или специализированное дорогостоящее и индивидуализированное обучение.
В заключение подчеркнем, что адаптивное тестирование — такой подход к компьютерному тестированию, который фактически позволяет привнести в стандартные групповые тесты элементы индивидуализации, учета индивидуальных особенностей данного испытуемого в процессе тестирования. Границы применения адаптивного тестирования не замыкаются на проверке знаний или способностей. В принципе, подобный подход с определенными модификациями вполне применим и для тестирования сферы интересов, установок и черт личности.
Ключевые термины: тест общеобразовательных знаний (ТОЗ), банк заданий, тестовый диалог, дистрактор, блочная рандомизация, конкурентная валидность, лонгитюдное исследование, адаптивное тестирование, трехуровневый алгоритм, алгоритм сходящихся порогов.


3.7. ОПЕРАТИВНОЕ ТЕСТИРОВАНИЕ ЗНАНИЙ

Практичность и высокая стандартизация — эти свойства тестов привлекают все больше специалистов-педагогов, желающих применить этот метод для оперативного контроля уровня знаний учащихся в классе. Возможности оперативного создания таких «подручных» тестов особенно возрастают с распространением вычислительной техники и появлением в школах компьютерных классов, в которых можно быстро и эффективно провести групповое тестирование уровня знаний учащихся средних и старших классов.
Но за внешней простотой подобных тестов скрываются определенные технологические особенности, которые должен знать каждый учитель-предметник. Прежде всего качество этих тестов зависит от качества отдельных тестовых заданий. Таким образом, разработка тестовых заданий требует не только глубоких знаний предмета, не только дидактического опыта, но и специальных знаний и навыков в области теории и практики составления самих тестовых заданий. Эти знания позволяют сделать задания достаточно разнообразными по своим структурным и логическим свойствам. Эти знания и умения позволяют тестировать не столько «ДЕКЛАРАТИВНЫЙ» уровень поверхностных знаний, основанный лишь на ассоциативных связях «ключевых» слов, но и более глубокий уровень реально ценных «ОПЕРАЦИОНАЛЬНЫХ» знаний, позволяющий реально использовать полученные знания на практике.
Итак, неквалифицированные тестовые задания апеллируют, как правило, к АССОЦИАТИВНОМУ МЫШЛЕНИЮ, которое удовлетворяется поверхностным заучиванием (зазубриванием) связей между определенными ключевыми словами. Они не достигают уровня собственно КОНЦЕПТУАЛЬНОГО, или операционального мышления, которое оперирует глубокими логическими связями между понятиями и правилами их применения к анализу реальных объектов, фактов и событий. Профессионально составленные тестовые задания также содержат поверхностные ассоциативные связи, но... в качестве провокационных мнимых правильных ОТВЕТОВ-ДИСТРАКТОРОВ (ключевые слова упоминаются в фальш-альтернативах даже более активно, чем в истинных ответах, но в бессмысленных сочетаниях). Ниже для иллюстрации приводятся два примера тестовых заданий — неудачный (а) и удачный (б). Использовались примеры реальных заданий из книги «Тесты. История России» (М.: Школа-пресс, 1993).
А. Какая формула была провозглашена теорией официальной народности в России в XIX веке?
[1] «православие — самодержавие — народность»
[2] «Москва — третий Рим»
[3] «Россия для русских».
Здесь в правильном ответе [1] буквально повторяется то же самое слово «народность», которое упоминается и в условии к тесту. Любой учащийся без специальных знаний, но с элементарным здравым смыслом безошибочно определит правильный ответ.
Б. Что явилось для Англии предлогом ухудшения отношений с Россией в конце 1840-х гг.?
[1] отказ России от выполнения своих обязательств как члена Священного союза;
[2] повышение российским правительством таможенных пошлин на английские товары;
[3] подавление русскими войсками венгерской революции.
Здесь правильный ответ [3] трудно определить из «общих соображений здравого смысла» (хотя к нему и может подвести точный учет смысла слова «предлог» в условии). С точки зрения логики буквального ассоциативного мышления более непосредственной причиной недовольства англичан может казаться та фальш-альтернатива [2], в которой прямо и открыто обозначены интересы Англии или более косвенно [1] (впрочем, последнее верно только для тех учащихся, которые знают о том, что такое Священный союз).

ПСИХОЛОГИКА ИСПЫТУЕМОГО

Наличие набора возможных ответов провоцирует у испытуемых, совершенно не знакомых с предметом, стремление «угадать» правильный ответ на основе интуиции.
Умелые разработчики тестов знают типовую «ПСИХОЛОГИКУ» поведения испытуемых, выполняющих тесты, и «ловят» невеж, провоцируя выбор ложного ответа, обладающего внешней правдоподобностью. Психологику можно описать как совокупность рациональных и иррациональных (основанных на приметах) стратегий поведения. К числу типичных мнимо разумных стратегий поиска правильного ответа следует отнести (кроме указанной выше стратегии ассоциативного правдоподобия):

1) «Выбирай «золотую середину». Например, если даны три числа, то испытуемый ожидает, что автор задания дает ему возможность сделать два типа ошибок «недооценка» и «переоценка», и с меньшей вероятностью испытуемый полагает, что правильный ответ может быть крайним. В этом смысле про датировку Куликовской битвы более удачным следует считать такой перечень вариантов: 1380, 1390, 1480.

2) «Выбирай более развернутый и аргументированный ответ, учитывающий частные случаи». Для того чтобы запутать такого испытуемого, следует маскировать правильный ответ под более внешне простую формулировку, а ложный ответ — под более развернутую. Пример:


Что такое автократия?
— самодержавие,
— рабовладельческая республика, в которой президент избирался из числа видных рабовладельцев-аристократов.

3) «Выбирай более наукообразный ответ из иностранных и малопонятных слов». Пример преодоления:

Как называется деталь самолета, с помощью которой обеспечивается подъемная сила?
— крыло,
— фюзеляж.

4) «Выбирай ответ, который напоминает что-то знакомое». Невежи думают, что учителя хотя бы раз упоминали и пытались вдолбить им в головы то, что звучит в формуле возможного правильного ответа, Пример преодоления:

Как А. С. Пушкин охарактеризовал восстание Е. Пугачева?
— «дубина народной войны»,
— «бунт, бессмысленный и беспощадный».

5) «Выбирай ответ, который соответствует общим ожиданиям». Конечно, понятие «ожидания» не является строгим. И в частных случаях ожидания срабатывают по-разному. Но в целом, руководствуясь твердым знанием о стереотипных ожиданиях учащихся, можно составить вопрос. Например, эффект предыдущего вопроса основывается на том, что учащиеся ожидают от Пушкина положительного отношения как к фигуре Пугачева, так и к делу его жизни — восстанию. Многие ожидания строятся на базе стремления к преодолению когнитивного диссонанса. Например, трудно предположить, что еще за несколько дней до начала самой кровопролитной войны Сталин поддерживал с Гитлером отношения стратегического партнерства. Пример вопроса:

В какую страну экспортировал Советский Союз стратегическое сырье для сталелитейной промышленности (никель, молибден) накануне вторжения гитлеровской Германии в 1941 году?
— в Великобританию?
— в США?
— в Германию?


ЛОГИКО-СЕМАНТИЧЕСКАЯ
КЛАССИФИКАЦИЯ ЗАДАНИЙ

Ниже приведем перечень типов тестовых заданий по логической структуре.
1. Фактологический вопрос по модели «Что-кто-где-когда?»

В какой стране царь Петр Великий учился корабельному делу:
— в Голландии;
— в Англии;
— в Германии.

2. Функциональный (целевой и причинный) вопрос по модели «Для чего-зачем-почему?»:

Для чего Петр поехал в Голландию?
— жениться,
— отдохнуть,
— учиться корабельному делу.

Данный пример указывает на ретроспективно-историческую «целевую причинность» и в этом смысле может считаться таким же фактологическим, как и предыдущий вопрос. Заданный в актуальном плане такой, вопрос позволяет раскрыть понимание более глубоких функциональных связей вещей, чем простой фактологический вопрос, апеллирующий к обыкновенной памяти. Пример:

Чему служит карбюратор в автомобиле?
— охлаждению двигателя,
— приготовлению горючей смеси,
— распределению зажигания.

3. Структурный вопрос по модели «Из чего?» (или из каких частей состоит?).

Базовый комплект персонального компьютера состоит из:
— процессор, оперативная память, дисковод, монитор, клавиатура;
— процессор, оперативная память, дисковод, монитор, клавиатура, принтер;
— процессор, оперативная память, дисковод, монитор, клавиатура, модем.

4. Концептуальный вопрос по модели «Определи понятие». Пример:

Прямоугольник — это:
— четырехугольник, у которого противоположные стороны параллельны;
— многоугольник, у которого все углы прямые;
— четырехугольник, у которого все углы прямые.

5. Концептуально-ассоциативный вопрос по модели «Заполни пропуск». Пример:

Щелочь при соединении с ... дает соль.
— с щелочью,
— с солью,
— с кислотой.

6. Концептуально-аналитический вопрос по модели «Проведи аналогию». Пример:

Человек так относится к классу млекопитающих, как крокодил относится к классу...
— земноводных,
— пресмыкающихся,
— динозавров.

С помощью аналогии производится транспозиция не только родо-видовых отношений, но вообще любого типа отношений. Например, это может быть отношение родства:

Шурин так относится к свояченице, как деверь относится к ...
— золовке,
— невестке,
— свекрови.

7. Задание по типу «Продолжи ряд». Пример:

<< Пред. стр.

страница 5
(всего 11)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign