بنية الاختبارات الجامعية: في إطار عام لتحسين جودة القياس التربوي؟
أ. د. عادل الهاشم
20-04-2026 11:36 AM
التحدي الحقيقي في الاختبارات الجامعية لا يكمن في توزيع الحروف، بل في جودة الأسئلة وتنوعها وقدرتها على استثارة التفكير والتحليل والتقويم. فالعدالة في التقويم لا تتحقق من خلال توازن شكلي للإجابات، بل من خلال تصميم أدوات قادرة على عكس الفهم الحقيقي وتمييز مستويات الأداء بدقة.
وتشير التوجهات الحديثة في القياس والتقويم التربوي (NCME, 2026؛ Kane, 2013) إلى تحوّل واضح في كيفية الحكم على جودة الاختبارات؛ إذ لم يعد التركيز منصبًّا على المظاهر الشكلية للأداة، بقدر ما أصبح موجّهًا نحو قوة التفسير الذي يمكن استخلاصه من نتائجها، ومدى ارتباط هذه النتائج بالبناء المعرفي الحقيقي للمتعلم. ويتسق هذا التوجه مع المعايير الدولية التي تؤكد أن صدق القياس يرتبط بتفسير النتائج وليس بشكل الأداة (AERA, APA, & NCME, 2014).
في هذا الإطار، يبرز جدل قديم متجدد يتمثل في التركيز على “شكل” الاختبار، مثل توزيع بدائل الإجابة في أسئلة الاختيار من متعدد، مقابل “جوهره” المرتبط بقدرته على قياس الفهم العميق. فبعض التصورات التقليدية لا تزال ترى في توازن توزيع الإجابات مؤشرًا على جودة الاختبار، بينما تؤكد الأدبيات الحديثة أن هذا الجانب، وإن كان مستحبًا من الناحية الفنية، لا يُعد معيارًا حاسمًا في الحكم على صدق القياس (Haladyna et al., 2002)
كما أن تنوع أنماط الأسئلة داخل الاختبار الواحد يعزز من قوته التفسيرية؛ فالجمع بين أسئلة الاختيار من متعدد، والصح والخطأ، والأسئلة المقالية، يوفّر أكثر من زاوية لقياس تعلم الطالب، ويمنح صورة أكثر شمولًا عن أدائه،هذا التنوع يعكس ما يُعرف بتعدد مصادر الأدلة، وهو عنصر أساسي في دعم صدق القياس (Messick, 1989).
إن جوهر الاختبار الجيد لا يكمن في عدد مرات تكرار الخيار (أ) أو (ب)، بل في مدى جودة الفقرة نفسها: هل تقيس فهمًا حقيقيًا؟ هل تميز بين الطالب الذي يحفظ والطالب الذي يحلل؟ وهل تستند إلى مشتتات منطقية تُجبر الطالب على التفكير بدل التخمين؟ هذه الأسئلة هي التي تحدد القيمة العلمية للاختبار، لا نمط توزيع الحروف.
وتدعم الأدبيات الحديثة هذا الطرح من خلال التأكيد على أن جودة الفقرة الاختبارية تُقاس بقدرتها على التمييز بين مستويات الطلبة، وهو ما يُعرف بمعامل التمييز، إضافة إلى مستوى صعوبتها، وليس من خلال نمط توزيع الإجابات. فالسؤال الجيد هو الذي يكشف الفروق الحقيقية في الفهم، لا الذي يُراعي توازنًا شكليًا في البدائل.
وتزداد أهمية هذا الطرح في مرحلة الدراسات العليا، حيث يُفترض أن تنتقل عملية التقويم من قياس التذكر إلى قياس التحليل والنقد وإصدار الأحكام، بما يتسق مع المستويات العليا في تصنيف بلوم وتطويراته (Bloom, 1956؛ Anderson & Krathwohl, 2001). وفي مثل هذه البيئات، يصبح من غير المنطقي اختزال جودة الاختبار في اعتبارات شكلية، بينما يُفترض أن تكون الفقرات نفسها مبنية على مواقف تتطلب استدلالًا وفهمًا عميقًا.
ومن منظور فلسفي للتعلم، يرى ديوي أن التعلم الحقيقي يقوم على التفكير التأملي (Dewey, 1933)، بينما يؤكد (بياجيه ) أن المعرفة تُبنى من خلال نشاط ذهني فعّال (Piaget, 1972)، ويشير برونر إلى أن الفهم يتجلى في إدراك البنية العميقة للمعرفة (Bruner, 1960). وعليه، فإن الطالب الذي يواجه أسئلة تحليلية ذات مشتتات منطقية لا ينشغل بتتبع نمط الإجابات، بل ينخرط في معالجة معرفية تقوده إلى الإجابة الصحيحة بناءً على الفهم.
وفي ضوء نظرية الصدق الحديثة، لا يُنظر إلى الصدق بوصفه خاصية ثابتة في الاختبار، بل كحجة تفسيرية مدعومة بالأدلة (Kane, 2013). وهذا ما تعززه التوجهات المعاصرة التي تدعو إلى ربط نتائج الاختبار بالبناء المعرفي المستهدف بدل التركيز على الجوانب الشكلية. وعليه، فإن الانشغال بتوازن توزيع الإجابات قد يُرضي الشكل، لكنه لا يضمن عدالة القياس؛ فجوهر الاختبار العادل يكمن في قدرته على استثارة التفكير، لا في ترتيب خيارته(NCME, 2025؛ NCME, 2026).