فهرست:
فهرست مطالب
فصل اول : کلیات تحقیق
مقدمه. 1
بیان مسئله. 2
اهداف تحقیق.. 3
هدف کلی.. 4
اهداف جزیی.. 4
سوالات تحقیق.. 4
اهمیت و ضرورت تحقیق.. 5
تعاریف واژه ها و اصطلاحات... 6
فصل دوم : ادبیات تحقیق
مقدمه. 9
فرآیند ارزشیابی پیشرفت تحصیلی.. 10
انواع سوال. 11
انواع امتحانات قابل اجرا در سطح وزارت آموزش و پرورش... 15
شیوه طراحی سوالات امتحانات نهایی.. 16
چگونگی تصحیح امتحانات نهایی.. 16
مبانی نظری.. 18
نظریه کلاسیک آزمون (CTT) 19
مفروضات نظریه کلاسیک آزمون. 19
محدودیت های نظریه کلاسیک آزمون. 20
نظریه تعمیم پذیری(GT) 22
مفاهیم و اصطلاحات در GT. 24
انواع مطالعات... 27
ملاحظات مطالعات G و D.. 27
جهان مشاهدات قابل قبول و مطالعات G.. 28
جهان تعمیم و مطالعات D.. 29
مدل های تصادفی و ترکیبی با جهان های تعمیم نامحدود و محدود. 30
طرح های تعمیم پذیری.. 31
انواع تصمیم و واریانس های خطا 35
انواع ضرایب... 37
نظریه پرسش – پاسخ(IRT) 37
مفروضات نظریه پرسش – پاسخ.. 38
تک بعدی بودن. 38
استقلال موضعی.. 38
معرفی مفاهیم اساسی در نظریه پرسش – پاسخ.. 39
خم ویژه سوال (ICC) 39
پارامتر دشواری سوال. 39
پارامتر تشخیص سوال. 40
پارامتر حدس سوال. 40
پارامتر آزمودنی.. 40
ویژگی نامتغیر بودن پارامترها 41
مدل ها در نظریه پرسش- پاسخ.. 41
مدل های پرسش – پاسخ لوجیستیک برای داده های دو ارزشی.. 42
مدل یک پارامتری.. 42
مدل دو پارامتری.. 42
مدل سه پارامتری.. 43
نظریه تعمیم پذیری در مقابل نظریه کلاسیک آزمون. 43
نظریه کلاسیک آزمون و نظریه تعمیم پذیری در مقابل نظریه پرسش پاسخ.. 45
مفهوم اعتبار. 47
تعاریف آماری اعتبار. 47
روش های برآورد اعتبار. 48
روش های برآورد اعتبار آزمون های هنجار مرجع. 50
عوامل مؤثر بر اعتبار آزمون. 56
خطای معیار اندازهگیری.. 57
مفهوم اعتبار در IRT. 59
تعریف و مفهوم روایی.. 59
تاریخچه روایی.. 60
انواع روایی.. 60
ارتباط روایی و اعتبار. 65
محتوا 65
تحلیل محتوا 66
تحقیقات انجام شده در داخل و خارج از ایران. 66
فصل سوم : روش تحقیق
مقدمه. 78
روش تحقیق.. 78
جامعه آماری.. 79
گروه نمونه و شیوه گزینش آن. 80
روش گردآوری اطلاعات... 81
روش اجرای تحقیق.. 83
روش تجزیه تحلیل اطلاعات... 84
فصل چهارم : تجزیه و تحلیل داده ها
تجزیه تحلیل آماری.. 92
فصل پنجم : بحث و نتیجه گیری
مقدمه. 151
بحث و نتیجه گیری.. 152
یافته های جانبی تحقیق در ارتباط با تصحیح اوراق امتحانات نهایی.. 163
محدودیت های تحقیق.. 166
پیشنهادهایی برای تحقیق های آینده 166
منابع
پیوست ها
منابع
آتشک، محمد.(1391). ارزشیابی عدالت جنسیتی در نظام آموزشی ایران. زن در توسعه و سیاست، 10 (4): 127-151.
آلن، مری جی؛ ین، وندی ام.(1387). مقدمه ای بر نظریه های اندازه گیری( روانسنجی) (ترجمه ی علی
دلاور)، چاپ سوم، تهران: سمت.
امبرتسون، سوزانای؛ رایس، استیون پی.(1388). نظریههای جدید روانسنجی برای روان شناسان
(ترجمهی حسن پاشا شریفی، ولی ا.. فرزاد، مجتبی حبیبی عسگرآباد و بلال ایزانلو)، چاپ اول،
تهران: رشد.
بازرگان، عباس.(1391). مقدمهای بر روشهای تحقیق کیفی و آمیخته (رویکردهای متداول در علوم
رفتاری). چاپ سوم، تهران: دیدار.
بوالحسنی، ماریا.(1390). بررسی اعتبار بخشی عملی آزمون کنکور کارشناسی ارشد سال 1389 رشته
معماری با استفاده از مولفه های واریانس( نظریه ی تعمیم پذیری). پایان نامه کارشناسی ارشد،
دانشگاه علامه طباطبایی.
بیکر، فرانک بی.(1381). پایه های اساسی تئوری سوال- پاسخ : نظریه جدید روانسنجی (ترجمه ی حیدر
علی هومن و علی عسگری). تهران: پارسا.(تاریخ انتشار به زبان اصلی 2001).
جزایری، حسین.(1384). بررسی اعتبار نمره گذاری معلمان در امتحانات تشریحی هماهنگ و نهایی دوره
آموزش عمومی استان لرستان در سال تحصیلی 83-1384. گزارش طرح پژوهشی مصوب سازمان
آموزش و پرورش استان لرستان.
حسنی، محمد؛ سامری، مریم؛ عباس زاده، میرمحمد؛ موسوی، میرنجف.(1392). بررسی نابرابری در
آموزش و پرورش دانش آموزان دختر و پسر مقطع متوسطه ی استان آذربایجان غربی. نشریه زن در
توسعه و سیاست، 11 (3): 332-315.
حشمتی، عبدالرضا، رافع، ابوالقاسم و جمشید نژاد، مهرداد.( 1383). تجزیه و تحلیل نتایج امتحانات نهایی
سال سوم متوسطه خرداد 81 در سراسر کشور. گزارش طرح پژوهشی مصوب معاونت آموزش و
پرورش نظری و مهارتی.
رحیمی، محمود.(1387). ارزیابی و تحلیل سطوح حیطه شناختی و شاخص های روان سنجی سوالهای
امتحانات نهایی پایه سوم راهنمایی استان خوزستان در خرداد ماه 1386 . گزارش طرح پژوهشی
مصوب سازمان آموزش و پرورش استان خوزستان.
رستگار، طاهره.(1388). ارزشیابی در خدمت آموزش: رویکردهای نو در سنجش و ارزشیابی با تاکید بر
سنجش مستمر و پویا و بازخورد موثر به دانش آموزان در فرایند آموزش. تهران: انتشارات موسسه
فرهنگی منادی تربیت.
رستگاری مقدم، خدایار. (1378). تحلیل نتایج امتحان کنکور کارشناسی ارشد رشته های معارف اسلامی،
فلسفه و نمایش نامه نویسی شرکت کنندگان سال 1377 با استفاده از نظریه تعمیم پذیری. پایان نامه
کارشناسی ارشد، دانشگاه علامه طباطبایی.
سادئی، علی. (1376). مقایسه تحلیلی امتحانات هماهنگ و داخلی دوره ی متوسطه و انطباق آن با
ملاکهای علمی طراحی سوال و آزمون سازی. گزارش طرح پژوهشی مصوب شورای تحقیقات
سازمان آموزش و پرورش استان خراسان .
ستاری، بهزاد.(1382). روانسنجی پیشرفته کاربردی. مشهد: به نشر.
سرمد، زهره؛ بازرگان، عباس؛ حجازی، الهه.(1391). روش های تحقیق در علوم رفتاری. تهران: آگه.
سلیمانی، علی.(1384). بررسی و تحلیل سوالات امتحانی دروس ریاضی مقطع متوسطه نظری مراکز
آموزشی استان کرمانشاه در امتحانات پایانی خرداد ماه 83 . گزارش طرح پژوهشی مصوب سازمان
آموزش و پرورش استان کرمانشاه.
سیف، علی اکبر.(1391). اندازه گیری ،سنجش، و ارزشیابی آموزشی. تهران : دوران.
شاطریان، محمد. (1384). بررسی میزان روایی، پایایی و شاخص های دشواری و تمیز سوالات
آزمونهای معلم ساخته دروس ریاضی، فیزیک، شیمی و عربی سال اول دوره متوسطه شهرستان قم
در سال تحصیلی 84-1383. گزارش طرح پژوهشی مصوب شورای تحقیقات سازمان آموزش و پرورش
استان قم .
فلسفی نژاد، محمد رضا.(1391). جزوه کلاس نظریه سوال پاسخ ( irt) . دانشکده روانشناسی و علوم تربیتی
دانشگاه علامه طباطبایی.
کاپلان، روبرت ام؛ ساکوزو، دنیس پ. (1388). روان آزمایی (ترجمه ی علی دلاور، فریبرز درتاج و
نور علی فرخی). تهران: ارسباران. ( تاریخ انتشار به زبان اصلی 2004).
کرسول، جان دبلیو.(1391). طرح تحقیق در علوم انسانی و اجتماعی (ترجمهی اسماعیل سعدی پور). تهران: دوران. ( تاریخ انتشار به زبان اصلی 2009).
کرلینجر، فرد آن.(1388). مبانی پژوهش در علوم رفتاری (ترجمه ی حسن پاشا شریفی و جعفر نجفی
زند). تهران: آوای نور.( تاریخ انتشار به زبان اصلی 1986).
کروکر، لیندا؛ آلجینا، جیمز.(1388). مباحث نو در روانسنجی (ترجمه ی ولی الله فرزاد و حسین زارع).
تهران: آییژ. (تاریخ انتشار به زبان اصلی 2008).
کیامنش، علیرضا؛ حسنی، محمد.(1388). نقد و بررسی نظام ارزشیابی تحصیلی ایران از منظر ارزشیابی
نظام آموزشی. فصلنامه نوآوری های آموزشی، 30، 101 – 75.
مگنوسون، دیوید.(1351). مبانی نظری آزمون های روانی ( ترجمه ی محمد نقی براهنی). تهران: انتشارات
دانشگاه تهران. (تاریخ انتشار به زبان اصلی 1967).
واحدی، شهرام ؛ فزون مهر، نادر. (1384). بررسی میزان انطباق سوالات امتحانات نهایی و داخلی سال
سوم راهنمایی بر اساس شاخص های روانسنجی در استان آذربایجان غربی. گزارش طرح پژوهشی
مصوب سازمان آموزش و پرورش استان آذربایجان غربی .
همبلتون، رونالد ک؛ سوامیناتان، اچ ؛ جین راجرز، اچ. ( 1389). مبانی نظریه پرسش- پاسخ (ترجمه ی
محمد رضا فلسفی نژاد). تهران: انتشارات دانشگاه علامه طباطبایی.
هومن، حیدر علی. ( 1384). اندازه گیری های روانی و تربیتی ( فن تهیه تست و پرسشنامه). تهران: پیک
فرهنگ.
یونسکو.(1384). پرونده ای باز در مورد آموزش و پرورش فراگیر (ترجمه ی ابوالفضل سعیدی). تهران:
پژوهشکده ی کودکان استثنایی.
Alzu'bi, M. A. (2014). The Extend of Adaptation Bloom's Taxonomy of Cognitive Domain In English Questions Included in General Secondary Exams. Advances in Language and Literary Studies, 5(2): 67-72.
Azar, A. (2005). Analysis of turkish high-school physics-examination questions and university entarence exams questions according to Bloom’s taxonomy. Türk Fen Eğitimi Dergisi, 2(2): 144-150.
Baltes, P. B., Smelser , N.J. (2001). International encyclopedia of the social & behavioral sciences. Vol 11, Amsterdam/New York, NY: Elsevier.
Brennan, R. L. (2010a). Generalizability Theory. New York: Springer-Verlag.
Brennan, R. L. (2010b). Generalizability theory and classical test theory. Applied Measurement in Education, 24(1): 1-21.
Brennan, R. L.(2003). Coefficients and Indices in Generalizability Theory. Center for Advanced Studies in Measurement and Assessment CASMA Research Report, 1, Avalable at: http://www.uiowa.edu/~casma/ASA.casma.rpt.pdf
Briggs, D. C., & Wilson, M. (2007). Generalizability in item response modeling.Journal of Educational Measurement, 44(2), 131-155.
Brown, J. D. (2005). Statistics corner, questions and answers about language testing statistics: Generalizability and decision studies. Shiken: JALT Testing & Evaluation SIG Newsletter, 9(1): 12-16
Cardinet,J., Johnson,S.,Pini,G.(2010).Applying generalizability theory using EduG. Published by Routledge.
Cardinet,J., Tourneur, Y., & Allal,L.(1976). The symmetry of generalizability theory: Applications to educational measurement. Journal of Educational Measurement,13,
119-135.
Fan, X., Sun, S. (2013). Generalizability theory as a unifying framework of measurement reliability in adolescent research. The Journal of Early Adolescence, 34 (1): 38-65.
Guler, G., Özdemir, E., & Dikici, R. (2012). A Comparative Analysis of Elementary Mathematics Teachers’ Examination Questions And SBS Mathematics Questions According To Bloom’s Taxonomy. Journal of Education Faculty, 14(1): 41-60.
Guler, N., Gelbal, S. (2010). Studying Reliability of Open Ended Mathematics Items
According to the Classical Test Theory and Generalizability Theory. Educational
Sciences: Theory & Practice, 10 (2): 1011-1019.
Karamustafaoglu, S., Sevim, S., Karamustafaoglu, O., Cepni, S. (2003). Analysis of Turkish High- School Chemistry – Examination Questions According to Blooms Taxonomy, Chemistry Education Research and Practice, 4 (1): 25-30.
Kumazawa,T.(2009). Revision of a Criterion-Referenced Vocabulary Test Using Generalizability Theory. JALT Journal,31(1): 81-100
Mehri, M. (2013). Students’ Learning Achievement in Publicand Private Schoolsin Kabul, Afghanistan: A comparison of grade 9 students in biology subjectMarina Mehri Faculty: Art. thesis of Master of Education and Didactics, Karlstad University.
Miller, M. D. (2010). Classical Test Theory Reliability. International Encyclopaedia of Education (Third Edition),P 27 – 30.
Scholtes, V. A., Terwee, C. B., & Poolman, R. W. (2011). What makes a measurement instrument valid and reliable?. Injury, 42(3): 236-240.
Sudweeks, R. R., Reeve, S., Bradshaw, W. S. (2005). A comparison of generalizability theory
and many-facet Rasch measurement in an analysis of college sophomore writing.
Assessing Writing, 9 : 239–261.
Suen, H. K., Lei, P. W.(2007).Classical versus Generalizability theory of measurement. Educational measurement, 4: 1-13.
Wakeman, S. (2013). Using the Access Test as a Predictive Measure of English Learner Success on the Biology End-of-course-test in Georgia . dissertation for the degree of Doctor of Education, The University of Alabama Tuscaloosa.
Webb, N. M., & Shavelson, R. J. (2005). Generalizability theory: Overview. Encyclopedia of statistics in behavioral science, 2: 717-719.
Webb, N. M., Shavelson, R. J., & Haertel, E. H. (2007). Reliability coefficients and generalizability theory. Handbook of statistics, 26: 81-124.
Webb, N. M., & Shavelson, R. J. (1991). Generalizability theory: A primer. Newbury Park,CA: Sage.
Webb, N. M., & Shavelson, R. J. (1981). Generalizability theory: 1973 – 1980. British Journal
of Mathematical and Statistical Psychology, 34, 133- 166
Wilson, F. R., Pan, W., Schumsky, D. A. (2012). Recalculation of the critical values for Lawshe’s content validity ratio. Measurement and Evaluation in Counseling and Development, 45(3): 197-210.
Yang, Y., & Green, S. B. (2011). Coefficient alpha: A reliability coefficient for the 21st century?. Journal of Psychoeducational Assessment, 29(4): 377-392.
منبع:
ندارد.