Рефераты. Аналіз можливостей тестового контролю у вищій школ

p align="left">Варіативність змісту. Зміст тесту не може залишатися незмінним і незалежної від розвитку науки, науково-технічного прогресу, від нового змісту навчальної дисципліни і від нових підручників. В міру зміни змісту навчальної дисципліни повинний варіюватися і зміст тесту. При цьому приймається в увагу контингент, який проходить тестування. Зміст тесту для слабких студентів помітно відрізняється від змісту тесту для сильних студентів.

Системність змісту. Це означає підбор такого змісту тестових завдань, що відповідав би вимогам системності знань. Крім підбору завдань із системним змістом важливо мати завдання, зв'язані між собою загальною структурою знань. Це можливо лише в тих випадках, коли завдання тесту зв'язані із загальною факторною структурою знань. Такий зв'язок визначається методами факторного аналізу.

Комплексність і збалансованість змісту тесту. Тест, розроблений для підсумкового контролю знань, не може складатися з матеріалів тільки однієї теми, навіть якщо ця тема є самою ключовою у навчальній дисципліні. Необхідно шукати завдання, що комплексно відображають основні, якщо не всій теми навчального курсу.

У той же час існує прагнення збалансовано відобразити в тесті основний теоретичний матеріал-поняття, закони і закономірності, гіпотези, факти, структурні компоненти теорії разом з методами наукової і практичної діяльності, з уміннями ефективно вирішувати типові професійні завдання.

Такі завдання порівняно легко можуть трансформуватися у форму тестових завдань на встановлення відповідності чи правильної послідовності, перетворюючись, таким чином, у дидактичну модель, що використовується однаково вдало і для контролю, і для навчання.

Взаємозв'язок змісту і форми. При розгляді цього загального діалектичного принципу стосовно до тестів мимоволі виникає асоціація з мистецтвом. Дійсно мистецтво являє собою, за словами Гегеля, закінчене усередині себе з'єднання змісту з цілком відповідної йому формою.

Точно так само і дійсний тест можна охарактеризувати як результат взаємовпливу змісту завдань з найбільш придатною формою. При цьому на відміну від широко розповсюдженого філософського тлумачення активності змісту і пасивності форми тестову форму треба розглядати разом зі змістом як активну сторону їхньої взаємодії.

Уже на стадії задуму зміст завдання починає знаходити свою форму. Невідповідність завдання однієї з чотирьох форм допускає можливість тільки двох правильних суджень: чи це не тестове завдання, чи використовується якась нова недосліджена форма за умови, що група відомих форм визначена.

Не всякий зміст піддається представленню у формі тестового завдання. Докази, великі обчислення, багатослівні описи важко виражаються, а те і зовсім не виражаються в тестовій формі.

На відміну від філософської традиції розгляду форми через призму змісту, у теорії тестів справа обстоїть, можна сказати, навпаки: зміст контролю по кожній навчальній дисципліні розглядається крізь призму придатної форми. При цьому зміст тесту треба відносити до теорії тієї чи іншої навчальної дисципліни, у той час як пошук найкращої форми для вираження змісту є предметом теорії тестів.

І, нарешті, при правильному доборі контрольного матеріалу зміст тесту може бути використано не тільки для контролю, але і для навчання. Використання тестових завдань в автоматизованих контрольно-навчальних програмах дозволяє студенту самостійно виявляти пробіли в структурі своїх знань і вживати заходів для їхньої ліквідації. У таких випадках можна говорити про значний навчальний потенціал тестових завдань, використання якого стане одним з ефективних напрямків практичної реалізації принципу єдності і взаємозв'язки навчання і контролю.

Відповідність меті. Зміст тесту залежить від мети перевірки.
Якщо потрібно відібрати невелике число найбільш підготовлених студентів, скажемо, на олімпіаду, то ясно, що завдання повинні бути важкі, тому що лише за допомогою таких завдань можна відібрати кращих. Якщо ж, навпаки, потрібно відсіяти самих слабких, то зробити це краще за допомогою порівняно легких завдань; ті, хто не виконають ці завдання, і є самі слабкі. При необхідності оцінити студентів у всьому діапазоні знань - від нижчого до вищого, у тест доведеться включати завдання легкі, середні і важкі.

Якщо, нарешті, знадобиться оцінити відповідність знань випускників всіх освітніх заснувань вимогам мінімуму змісту навчальних дисциплін, зафіксованого в державних освітніх стандартах, то в засоби оцінки доведеться включати тільки легкі завдання, посильні більшості. Ні про якого тестя, у класичному розумінні цього поняття, у такому випадку говорити не приходиться.

При цьому виникає ряд таких досить спірних питань, як визначення мінімальне "прохідного" відсотка правильного виконання числа завдань, визначення оцінки в залежності від відсотка правильних відповідей.

4. Поняття складності тесту і його вплив на оцінку знань

Якщо педагогічний тест визначити коротко як систему завдань зростаючої складності, то стане зрозуміло, що складність завдань є найважливішим тестоутворюючим показником.

Придумати тест не так вже й просто. Можна придумати скількох завгодно завдань у тестовій формі (а це ще не тести). Їх не можна включати в дійсний тест доти, поки не стане відомої міра складності.

З цієї вимоги стає зрозумілої обов'язковість попередньої емпіричної перевірки кожного завдання, до початку тестування. У процесі перевірки багато завдань не витримують пропонованих до них вимог і тому не включаються в тест.

Перша вимога до тестових завдань: у тесті завдання повинні розрізнятися за рівнем складності, що випливає з даного раніше визначення тесту і розглянутого принципу.

З міркування над можна зробити два висновки.

Перший - що в тесті немає місця завданням з невідомою мірою складності.

І другій - що не всі пропоновані завдання в тестовій формі можуть стать тестовими завданнями.

Завдання в тестовій формі і тестове завдання - це різні поняття. У першому понятті до самим істотним відносяться вимоги форми і змісту. До тестових же завдань у першу чергу ставиться вимога відомих складності, те, що явно не потрібно в завдань у тестовій формі.

Завдання мають шанс стать тестовими лише після емпіричної перевірки міри їх складності.

Показник складності тесту і тестових завдань є змістовним і формальної одночасно.

Змістовним показником, тому що в гарному тесті складність може залежати лише від змісту і від рівня підготовленості самих випробуваних, у той час як у поганому тесті на результати починають помітно впливати форма завдань (особливо якщо вона не адекватна змісту), погана організація тестування.

Формальна складова сторона показника складності виникають при розгляді тестування як процесу протистояння пропонованими завданням. Одержуваний при цьому результат корисно розглядати як результат такої боротьби.

При спрощеному тлумаченні кожного випадку протистояння з черговим завданням звичайно розглядаються тільки два результати: перемога при правильному рішенні завдання, де отримується один бал, чи поразка, за що дається нуль балів.

Оцінка результату такої боротьби залежить від співвідношення рівня знання до рівня складності завдання, від обраної одиниці виміру знань і від заздалегідь прийнятого правила - що вважати "перемогою", а що ні.

У класичній теорії тестів багато років розглядалися тільки емпіричні показники складності. У нових варіантах психологічних і педагогічних теорій тестів більше увага стала приділятися характеру розумової діяльності учнів у процесі виконання тестових завдань різних форм.

Зміст тесту не може бути тільки легким, середнім чи важким. Тут повною мірою виявляється відома думка про залежність результатів застосовуваного методу. Легкі завдання тесту створюють тільки видимість наявності знань в учнів, тому що ними перевіряються мінімальні знання.

Спотворює результати тестування і підбор свідомо важких завдань, у результаті чого в більшості школярів виявляються занижені бали. Орієнтація на важкі завдання нерідко розглядається як засіб посилення мотивації до навчання. Однак цей засіб діє неоднозначно.

Одних важкі завдання можуть підштовхнути до навчання, інших - відіпхнути від її. Подібна орієнтація спотворює результати й у підсумку, знижує якість педагогічного виміру. Якщо тест побудований строго з завдань зростаючою складністю, то цим відкривається шлях до створення однієї із самих цікавих шкал виміру - шкали Л. Гутмана.

Розповсюджена, донедавна, рекомендація включати в тест більше завдань середньої складності, виправдана з погляду визначення надійності виміру по формулах класичної теорії тестів. Існуючі в цій теорії методи оцінки надійності тесту дають зниження надійності при включенні в тест помітно легких і важких завдань.

У той же час захоплення завданнями однієї лише середньої складності приводить до серйозної деформації змісту тесту: останній утрачає здатність нормально відображати зміст досліджуваної дисципліни, у якій завжди є легкий і важкий матеріал. Таким чином, у погоні за теоретично високою надійністю губиться змістовна валідність тесту. Прагнення ж підняти валідність тесту нерідко супроводжується зниженням його надійності. У науковій літературі це називається парадоксом Ф. Лорда, що описали цей парадокс із погляду статистичної теорії тестів.

5. Оцінювання, оцінка і вимір знань

У закордонній педагогічній літературі використовується близьке до виміру поняття "evaluation", що можна перекласти як "оцінювання", маючи у на увазі не тільки кінцевий результат, але і процес формування оцінки. Відповідно виділяються два основних види оцінювання - формуюче і підсумкове.

Мета першого - робити, за допомогою оцінювання, вплив на поточний процес навчання за рахунок встановлення зворотного зв'язку від студента до викладача.

Мета другого - одержати підсумкові результати навчання.

Оцінка, як поняття, має два основних значення - як судження про цінність (чи значимості) і як приблизна характеристика деякої величини.

Оцінки поділяються на двох груп: абсолютні і відносні. У формулюванні відносних оцінок використовуються терміни "добре", "погано" і т.п. Оцінки викладачів вузів ближче до абсолютних оцінок, розділеним на чотири рівні (градації)- відмінно, добре, задовільно і незадовільно.

6. Вимір знань і його об'єктивність

Вимір являє собою процедуру кількісного зіставлення досліджуваної властивості з деяким еталоном, прийнятим за одиницю виміру.

У відмінність, наприклад, від поняття "довжина столу" поняття "знання" не відноситься до безпосередньо вимірюваного феномена і тому знання приходиться вимірювати опосередковано, через емпірично фіксовані прояви того, що фахівці назвали би ознаками (індикаторами) знання. Тому кожне завдання тесту бажано розглядати як індикатор, що виявляє якийсь один фрагмент знання в тих випробуваних, у яких знання є.

Здоровий глузд підказує, що судити про знання всього матеріалу, що перевіряється по відповіді на одне лише завдання помилково, хоча в кожній навчальній дисципліні є питання, правильні відповіді на який говорять багато про що. Тим не менше, надійні висновки можна робити тільки за результатами застосування достатнього числа завдань.

Визначення статистичних характеристик є головним (після експертної перевірки змісту) засобом діагностики якості тесту по будь-якій навчальній дисципліні.

Рівень підготовленості випробуваних виявляється при аналізі їхніх відповідей на завдання тесту. Чим більше правильних відповідей, тим вище індивідуальний тестовий бал. Звичайно цей тестовий бал асоціюється з поняттям "рівень знань" і проходить процедуру уточнення на основі тієї чи іншої моделі виміру знань.

Насправді вірніше говорити про підготовленість, що включає в себе володіння необхідними знаннями, уміннями, навичками і представленнями. Отримана сума балів нерідко приймається за істинний рівень знань, хоча кожний визнає, що власне знання і бали, отримані по показниках знань - різні явища. Адже можна придумати тисячі різних показників і усі вони будуть з різною кількістю балів показувати на рівень знань. Виникає природне запитання - а які з показників правильно вказують на наявність знань, а які помилково?

Для виміру знань вимагаються емпіричні показники. У якості таких виступають зараз будь-які методи контролю знань, хоча інтуїтивно зрозуміло, що вони неоднаково представляють знання. Тому встає питання: "які методи показують краще?"

Апріорі можна затверджувати, що тест це робить краще через більшу його обґрунтованість. В основу обґрунтування якості тесту, крім згаданої вище інтерпретації одержуваних результатів, покладені концепція і модель виміру, а також дані статистичної обробки й інтерпретації результатів перевірки знань.

На рівні повсякденної свідомості будь-яка інтерпретація результатів тестування не представляється важкою справою. Отримана сума балів приймається за щирий рівень знань, хоча кожний визнає, що знання і бали, отримані по показниках знань - різні явища. Адже можна придумати тисячі різних показників і усі вони будуть з різною кількістю балів показувати на рівень знань.

Головна теза інтерпретації - не хто що знає, а хто по даному наборі завдань виявився вище чи нижче. Хоча при такій інтерпретації завжди залишається місце для критики тесту з позиції неповноти його змісту, у практиці цей підхід завжди виявлявся вирішальним через можливість скоротити число завдань і приймати рішення на основі тесту з меншим числом завдань. Власне кажучи, це форма редукції, успіх якої залежить від якості розробки тесту, і від обґрунтування валідності скороченого тесту з нормативно орієнтованою інтерпретацією.

7. Поняття ефективності тесту

Ефективним можна назвати тест, що краще, ніж інші тести, вимірює рівень знань, з меншим числом завдань, якісніше, швидше, дешевше, і все це - по можливості, у комплексі.

З поняттям "ефективність" близьке до нього по змісту поняття "оптимальність". Останнє трактується як найкраще з можливих варіантів, з погляду задоволення декільком критеріям, узятим по черзі чи разом.

Ефективний тест не може складатися з неефективних завдань. У такому випадку природно порушити питання про ознаки, що відрізняють ефективне завдання від неефективного. З погляду змісту, ефективне завдання перевіряє важливий елемент змісту навчальної дисципліни, що нерідко називають ключовим для необхідної структури знань випробуваних. У тест відповідно включаються тільки такі завдання, що експерти визнають як ключові елементи досліджуваної навчальної дисципліни.

У визначенні ефективності тесту звертається увага на два ключових елементи - це число завдань тесту і рівень підготовленості тих, хто проходить цей тест.

Якщо з якого-небудь тесту з великим числом завдань зробити оптимальний вибір меншого числа, то може утворитися система, що не уступає помітно по своїх властивостях тесту з порівняно великим числом завдань. Тест із меншим числом завдань у такому випадку можна називати порівняно більш ефективним.

Ефективність тестів може залежати і від форми. Порушення тестової форми завжди приводить до гіршого вираження змісту і до гіршого розуміння змісту завдання випробуваними.

Ефективність тесту залежить також і від принципу підбора завдань. Якщо підбирати завдання для виміру на всьому діапазоні зміни складності, то знижується точність виміру на окремій ділянці. І навпаки, якщо прагне точно вимірити знання випробуваних, наприклад, середнього рівня підготовленості, то це зажадає мати більше завдань саме даного рівня труднощі.

Тому тест не може бути ефективним узагалі, на всьому діапазоні підготовленості випробуваних. Він може бути більш ефективний на одному рівні знань і менш - на іншому. Саме цей зміст вкладається в поняття диференційної ефективності тесту.

Використана література

1. Дидактика сучасної школи: Навч. посібник для вчителів Б.С. Кобзар, Г.Ф. Кумаріна, Ю.А. Кусий та ін. Під ред. В.А. Онищука. К: Рад. шк., 1987. - 351 с.

2. Челишкова М.Б. Теорія і практика конструювання педагогічних тестів. - М.: Дослідницький центр проблем якості підготовки спеціалістів, 2001

Страницы: 1, 2, 3, 4



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.