Чому потрібне шкалювання?

Після проходження тестування учасник отримує свої результати у тестових балах. Припустимо, Данило отримав 26 балів. Чи є цей результат високим? Ніхто на це запитання не може дати відповідь, оскільки невідомо, яким був максимально можливий результат за цей тест. А якщо максимальний бал і буде відомий, скажімо, 50, це ще не означатиме, що результат Данила буде низьким, якщо не будуть відомі результати інших учасників тестування.

Коли середнє значення результатів дорівнюватиме 16, то результат Данила буде досить високим, а якщо їхнє середнє значення буде дорівнювати 40, то, безумовно, достатньо низьким. Це означає, що одна й та ж кількість балів (у нашому випадку – 26) може трактуватися у різний спосіб, залежно від характеристик тесту й успішності проходження тесту іншими учасниками тестування.

Спеціалісти з тестування підкреслюють, що результат тестування в тестових балах є результатом у контексті конкретного тесту: ця оцінка є виправданою, якщо мають справу лише з одним тестом і порівнюють результати учасників тестування тільки з одного тесту. У цьому випадку кожному зрозуміло – учасник, який набрав більшу кількість тестових балів має найкращі знання з предмета.

Проблеми виникають тоді, коли потрібно порівнювати результати учасників із кількох тестів і використовувати для цього додавання тестових балів з різних тестів. Навіть коли, наприклад, не брати до уваги зміст додавання результатів із кількох тестів, а спробувати проаналізувати технічні аспекти додавання тестових балів із різних предметів, проблеми залишаються.

Якщо результат кожного тесту буде виражений у своїй власній шкалі, то що означатимуть 26 балів із математики, 56 балів з української мови і 78 балів з історії? Результат із математики є найменшим, проте максимальний бал дорівнює 50 проти максимального балу 120 з історії України…

Можливо, тест з української мови був складним, а результат 56 балів був одним із найкращих? Не можна додавати результати, що виражені в різних шкалах без додаткового переведення їх до єдиної спільної шкали (перешкалювання).

Наведемо приклад із реального життя


Порівняння даних за різними шкалами постійно виконуються банками. Вони ніколи не стануть додавати 100 гривень і 200 рублів, не конвертувавши спочатку ці суми в якусь єдину валюту, яка буде виконувати функцію спільної шкали. Ця шкала може бути гривневою або рублевою, проте може бути й іншою, «універсальною», приміром, шкалою Євро… Тільки після такого перешкалювання ми можемо порівнювати два внески: 30 гривень і 60 рублів проти 60 гривнень і 30 рублів. Проте обидва ці внески не дорівнюють 90!

Результати ЗНО будуть використовуватися при вступі до різних уні-верситетів, а визначення шансів для вступу будуть ґрунтуватися на комбінації (на певній сумі) результатів тестування з різних предметів.

Зважаючи на те, наскільки важливим є визначення результатів ЗНО, Український центр оцінювання якості освіти повинен видавати результати екзаменів за шкалою, яка в подальшому дозволятиме виконувати з цими результатами певні операції, що повинні мати під собою реальний смисл, адже потрібно порівнювати результати різних студентів, причому це порівняння буде справедливим.

Шкалювання результатів оцінювання не є чимось новим для учнів і абітурієнтів. Подібну процедуру виконує кожний учитель одразу ж після виконання учнями контрольної роботи. У класний журнал він виставляє не кількість правильно виконаних вправ, а оцінки: 2–3–…–11–12.

Інші частини цієї статті:

Джерело Testportal.com.ua