در قسمت زیر، به نظریه پرسش – پاسخ(IRT)، به همراه مفروضات، مفاهیم اساسی و مدلهای آن اشاره می شود. مطالب آن از منابع جزوه کلاسی فلسفی نژاد (۱۳۹۱)؛ همبلتون و همکاران (ترجمهی فلسفینژاد، ۱۳۸۹)؛ امبرتسون و رایس (ترجمهی شریفی و همکاران، ۱۳۸۸)؛ ستاری (۱۳۸۲) و بیکر (ترجمهی هومن و عسگری، ۱۳۸۱) گرفته شده است.
نظریه پرسش – پاسخ(IRT)
نارساییهای نظریه کلاسیک موجب شد از سال ۱۹۸۰ به بعد به طور چشمگیری از نظریه پرسش – پاسخ (IRT) استفاده شود. بهطوریکه این نظریه به سرعت به صورت خطوط فکری پایه های نظری اندازه گیری درآمده است. نظریه پرسش – پاسخ چارچوب مفیدی را برای حل مسائل متنوع و گسترده اندازه گیری فراهم می آورد. نظریه پرسش – پاسخ که به عنوان نظریه صفت مکنون نیز معروف است، اندازه گیری مبتنی بر مدل است که بر اساس آن سطح توانایی آزمودنی از روی پاسخهای او به سوالات آزمون برآورد می شود. این نظریه مجموعه ای از مدلهای ریاضی و آماری است که برای تبیین رابطه تابعی میان صفت زیربنایی مورد سنجش که غالباً توانایی[۸۶] است و احتمال پاسخ صحیح به سوال به کار می رود. این نظریه توانسته است برای طراحی و تحلیل آزمونهای روانی و تربیتی مفید واقع شود و مواردی از قبیل سنجش انطباقی[۸۷]، کنش افتراقی سوال[۸۸]، همترازسازی[۸۹] نمرات آزمونها و ایجاد بانک سوال از کاربردهای با ارزش این نظریه محسوب میشوند.
( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
مفروضات نظریه پرسش – پاسخ
از آنجا که نظریه پرسش – پاسخ مبتنی بر مدل است، بنابراین پیش فرضهای مدل باید برقرار باشد تا بتوان از آن استفاده کرد. اگر پیشفرضها برقرار نباشند،CTT بهتر از IRT است اما در صورت برقراری مفروضات، IRT ابزار قدرتمندی است که به نتایج معتبر و دقیقتری منجر می شود که از نظریه کلاسیک با مفروضات ضعیف بر نمیآید. در اینجا به دو مفروضه زیربنایی این نظریه اشاره می شود.
تک بعدی بودن[۹۰]
تک بعدی بودن یک آزمون اشاره دارد به اینکه سوالات آزمون فقط یک توانایی را اندازه بگیرد. هر چند این مفروضه نمیتواند به طور کامل رعایت شود و آزمونی ساخته شود که صد در صد خالص باشد و فقط یک ویژگی را بسنجد، زیرا عواملی همچون؛ دانش فهم سوال، پیدا کردن سرنخ ها، انگیزش، اضطراب و خستگی آزمودنی عملکرد آزمودنی را متأثر میسازد. با این وصف آنچه در این میان اهمیت دارد، این است که هر آزمون یک توانایی غالب را بسنجد. برای آزمودن تک بعدی بودن یک آزمون از تحلیل عاملی استفاده می شود.
استقلال موضعی[۹۱]
معنی استقلال موضعی آن است که با ثابت نگه داشتن تواناییهایی که عملکرد در آزمون را تحتتاثیر
قرار می دهند، پاسخهای آزمودنیها به هر زوجی از سوالات به لحاظ آماری ناهمبستهاند. به طور ساده این بدان معنی است که تواناییهای مشخص شده در مدل، تنها عواملی هستند که عملکرد آزمودنی در تست را تحتتأثیر قرار میدهد. این مجموعه تواناییها، فضای مکنون کامل[۹۲] را معرفی می کنند. وقتی مفروضه تک بعدی بودن برقرار است فضای مکنون کامل، تنها عبارت از یک توانایی است. طبق این مفروضه، عملکرد فرد در یک سوال نباید تحتتأثیر عملکرد فرد در سوالات دیگر باشد. هر تک بعدی بودن، بیانگر استقلال موضعی است ولی عکس آن صادق نیست. با این وصف، استقلال موضعی می تواند در مورد داده های چند بعدی نیز به کار رود. در شرایطی که فضای مکنون کامل (تک بعدی یا چند بعدی) معین باشد، استقلال موضعی می تواند برقرار باشد.
معرفی مفاهیم اساسی در نظریه پرسش – پاسخ
خم ویژه سوال[۹۳] (ICC)
برای هر سطح از توانایی، با بهره گرفتن از معادلات ریاضی می توان احتمال پاسخ صحیح به سوال (احتمال موفقیت) را محاسبه کرد که آن را با نماد نشان می دهند. خم ویژه سوال که مبنای زیربنایی نظریه پرسش – پاسخ است، منحنی Sشکلی است که در یک پیوستار عمودی و افقی، رابطه تابعی احتمال موفقیت در سوال () و تواناییرا به تصویر میکشد. هر یک از سوالات آزمون، دارای یک خم ویژه سوال است. ناگفته نماند که هر آزمون نیز دارای یک خم ویژه آزمون[۹۴] است که به آن (TCC) گفته می شود. بنا به مدل بکار رفته، خم ویژه سوال دارای ویژگیهایی است که برای توصیف آن به کار میرود. این ویژگیها در قالب پارامترهای سوال و پارامترآزمودنی شرح داده می شود.
پارامترهای سوال
پارامتر دشواری سوال: این پارامتر جایگاه سوال را در مقیاس توانایی مشخص می کند. به آن پارامتر مکانی هم گفته می شود و آن را با نماد نشان می دهند. ، نقطهای بر روی پیوستار توانایی است که در آن احتمال پاسخ صحیح به سوال برابر با ۵/۰ باشد (در مدلهای یک و دو پارامتری). دامنه نظری این پارامتر بین است، اما در عمل آن را در محدوده ۲- تا ۲+ در نظر می گیرند. هر چه مقدار
بزرگتر باشد، سوال سخت تر است. سوالات سخت، در قسمت منتهی الیه راست مقیاس توانایی قرار
میگیرد و سوالات آسان در منتهی الیه چپ مقیاس توانایی واقع می شود.
پارامتر تشخیص[۹۵] سوال
پارامتر تشخیص سوال به قدرت سوال در تشخیص و تفکیک افراد با سطح توانایی بالا و با سطح توانایی پایین اشاره دارد. این پارامتر را که با نماد نشان می دهند، متناسب با شیب خم ویژه سوال در نقطه بر روی مقیاس توانایی است. و بیانگر این نکته است که با تغییر سطح توانایی، احتمال موفقیت در سوال با چه سرعتی تغییر می کند. زمانی به بیشینه مقدار خود میرسد که سطح توانایی برابر با دشواری سوال باشد. هر چه شیب خم زیادتر باشد، سوال از قدرت تشخیص بالاتری برخوردار است. دامنه نظری این پارامتر می تواند بین ∞- تا ∞+ باشد ولی در عمل معمولاً از ۰ تا ۲ تغییر می کند.
پارامتر حدس[۹۶] سوال
در برخی آزمونها بویژه آزمونهای عینی، آزمودنی بدون اطلاع از دانش مورد سنجش و از طریق حدس، اقدام به پاسخگویی صحیح سوال می کند. در چنین شرایطی گفته می شود پارامتر حدس در پاسخگویی فرد دخیل است. این پارامتر را که با نماد نشان می دهند، به آن مجانب پایین نیز گفته می شود. به این مطلب اشاره دارد که آزمودنیهای با سطح توانایی پایین توانسته اند به سوالات نسبتاً دشوار، پاسخ صحیح بدهند. به بیان دیگر این پارامتر برای تبیین عملکرد آزمودنیهای با سطح توانایی پایین به کار میرود. قابل ذکر است که میزان این پارامتر، به عنوان تابعی از سطح توانایی تغییر نمیکند. از این رو، احتمال موفقیت در سوال برای آزمودنیهای با توانایی بالا و توانایی پایین، یکسان میباشد. در آزمونهای تشریحی که پاسخ سوال توسط آزمودنی تهیه می شود، میزان پارامتر تقریباً برابر میباشد. در مقابل در آزمونهای چندگزینهای، مقدار بزرگتر از است. در آزمونهای اخیر به دلیل حرفهای شدن طراحان سوال، میزان از مقدار پاسخ تصادفی و حدسی آزمودنیها (،تعداد گزینه ها) کوچکتر است. دامنه نظری این پارامتر بین تا است، اما در عمل معمولاً در محدوده ۰ تا ۳/۰ قرار میگیرد.
پارامتر آزمودنی
پارامتر آزمودنی بیانگر مقدار خصیصه مکنون در فرد یا جایگاه وی در مقیاس توانایی است که عملکرد آزمودنی را در پاسخگویی به سوالات آزمون متأثر میسازد. هدف اصلی بیشتر اندازه گیریهای روانی و تربیتی پاسخگویی به این سوال است که یک فرد معین تا چه حد دارای این صفت مکنون است. پارامتر آزمودنی را بیشتر در قالب اصطلاح کلی توانایی به کار میبرند. پارامتر توانایی را با نماد () نمایش می دهند. این پارامتر بر روی یک مقیاس پیوسته قرار میگیرد که دامنه نظری آن بین ∞- تا ∞+ میباشد و در عمل دامنه ۳- تا ۳+ را برای آن در نظر میگیرند.
ویژگی نامتغیر بودن[۹۷] پارامترها
ویژگی نامتغیر بودن تنها در صورت برازش کامل مدل با داده ها برقرار است و هرگز نمیتواند به معنای دقیق مشاهده شود، بنابراین، میتوان “درجه” نامتغیرپذیری موجود را سنجید. ویژگی نامتغیر بودن پارامترهای سوال حاوی این مطلب است که پارامترهای سوال وابسته به سطح توانایی آزمودنیها نیست و در گروه های نمونه با سطوح مختلف توانایی، مقادیر آن یکسان است. همچنین، ویژگی نامتغیر بودن پارامترهای آزمودنی به این نکته اشاره دارد که پارامترهای آزمودنی( پارامترهای توانایی) از سوالات آزمون مستقل هستند.
مدل ها در نظریه پرسش – پاسخ
برای بررسی داده های دو ارزشی، مدلهای متعددی در IRT وجود دارد اما انتخاب یک مدل بر پایه ملاحظات نظری و تجربی توسط کاربر صورت میگیرد. مدل های IRT را میتوان بر حسب اینکه یک تتا همراه با ویژگیهای سوال برای تبیین فضای مکنون متغیر مورد بررسی کافی باشد یا نه، به مدل های تک بعدی و چند بعدی تقسیم نمود. همچنین مدلهای IRT را میتوان برحسب تعداد پارامترهای سوال، طبقه بندی کرد که در این صورت مدلهای یک پارامتری، دو پارامتری، سه پارامتری و چهار پارامتری را در بر میگیرد. علاوه بر این، مدلها را بر اساس شکل داده های پاسخ به مدلهای دوارزشی و چند ارزشی تقسیم بندی می کنند. در مدلهای دو ارزشی، پاسخ سوال به دو صورت صحیح یا غلط (۱ و۰) میباشد و در مدل-های چند ارزشی، هر پاسخ مقدار نمرهی متفاوتی دارد. یکی دیگر از ملاکهای طبقه بندی مدلها در IRT، نوع مدل ریاضی بکار رفته است که این حالت، مدلهای اجایو نرمال و مدلهای لوجیستیک[۹۸] (مدلهای منطقی) را شامل می شود. هر چند در آغاز پیدایش IRT از منحنی اجایو نرمال بسیار استفاده میشد منتهی به دلیل پیچیدگی این مدل که مستلزم انتگرالگیری است، امروزه از مدلهای اجایو لوجیستیک (منطقی) به سبب سهولت محاسبه، بیشتر استفاده می شود. با وارد کردن عامل مقیاس (D) در مدلهای اجایو لوجیستیک، احتمالهای به دست آمده از این مدل بسیار نزدیک و مشابه احتمالهای به دست آمده از مدلهای اجایو نرمال است؛ بهطوریکه اختلاف آنها به کمتر از ۰۱/۰ می رسد. در قسمت زیر، به معرفی و تشریح مدلهای معروف لوجیستیک برای داده های دو ارزشی (مدلهای تک بعدی) پرداخته می شود.
مدلهای پرسش – پاسخ لوجیستیک برای داده های دو ارزشی
مدل یک پارامتری[۹۹]
سادهترین مدل IRT است که البته با بیشترین گستردگی بکار گرفته شده است. این مدل را با نماد (۱PL)
نمایش می دهند و به افتخار ایجاد کننده آن، به آن مدل راش نیز میگویند. مدل اولیه راش و مدل یک پارامتری، هر دو دارای ویژگیهای مشابهی هستند و از نظر ریاضی نیز یکسانند. با این وجود تفاوتهایی نیز دارند. خم ویژه سوال در این مدل از طریق معادله زیر محاسبه می شود:
= ()
() : احتمال پاسخ صحیح آزمودنی با توانایی () که به طور تصادفی انتخاب شده است به سوال i
b : پارامتر دشواری
() : پارامتر توانایی
e: مبنای لگاریتم طبیعی که مقدار آن برابر ۷۱۸/۲ است
D : عامل مقیاس است. برای نزدیک کردن تابع لوجیستیک به تابع اجایو نرمال در نظر گرفته می شود که مقدار آن برابر ۷/۱ است.
در این مدل، ICC ها موازی هستند و فقط از نظر مکانی با هم متفاوت هستند. به بیانی دیگر در این مدل فرض می شود که تنها توانایی آزمودنیها و دشواری سوال، عملکردشان را متأثر میسازد. همچنین، فرض می شود تمام سوالات پارامتر تشخیص یکسانی دارند. و نیز مجانب پایینی ICC، یعنی © برابر با ۰ است.
مدل دو پارامتری[۱۰۰]
این مدل را با نماد (۲PL) نشان می دهند. تنها تفاوتی که مدل دو پارامتری با مدل یک پارامتری دارد، وجود پارامتر تشخیص در این مدل است. در مدل دو پارامتری چون سوالات دارای قدرت تشخیص متفاوتی هستند، بنابراین پاسخ دادن به هر سوال اهمیت متفاوتی در توانایی و نمره کل فرد دارد. احتمال پاسخ صحیح به سوال در این مدل از طریق معادله زیر برآورد می شود:
= ()
در این مدل بیانگر پارامتر تشخیص است. سایر نمادهای به کار رفته در این مدل همان نمادهای مدل یک پارامتری است. ICC ها در این مدل هم از نظر جایگاهشان در مقیاس توانایی و هم از نظر شیب با هم تفاوت دارند. ICC ها ممکن است همدیگر را قطع کنند که این پیامد داشتن شیبهای متفاوت است. به این علت که در مدلهای یک پارامتری و دو پارامتری، عامل حدس وجود ندارد، این مدلها برای سوالات تشریحی یا باز پاسخ مناسب هستند.
مدل سه پارامتری[۱۰۱]
با تغییری که توسط برن بام[۱۰۲] ( ۱۹۶۸) در مدل منطقی دو پارامتری ایجاد شد، پارامتر حدس نیز به دیگر
پارامترها افزوده گردید. معادله ریاضی این مدل (۳PL) به این صورت است:
c + = ()
C در این مدل بیانگر پارامتر حدس (مجانب پایین) است. در مدل سه پارامتری، همه پارامترهای سوال دخالت دارند و ICC ها در این مدل نه تنها از نظر مکان و شیب، بلکه از نظر مجانب پایین © نیز با هم تفاوت دارند. به دلیل وجود پارامتر حدس، انتهای پایین خم ویژه سوال در این مدل صفر نیست بلکه برابر با مقدار c است. از این رو در این مدل پارامتر دشواری سوال، نقطه ای در مقیاس توانایی است که احتمال پاسخ صحیح در آن برابر میانگین (c و۱) باشد. این مدل برای سوالات بسته پاسخ که آزمودنیها با بهره گرفتن از عامل حدس میتوانند به جواب برسند، بسیار مناسب است.
نظریه تعمیمپذیری در مقابل نظریه کلاسیک آزمون
برنان (b2010) از شباهتهای دو نظریه تعمیمپذیری و کلاسیک آزمون به موارد زیر اشاره می کند؛ هر دو نظریه نمره واقعی (یا جهان) را به عنوان یک ارزش مورد انتظار از نمرات مشاهده شده تعریف می کنند. هر دو نظریه به وضوح خطاهای اندازه گیری تصادفی را شامل میشوند و مفاهیم اعتبار( یا تعمیمپذیری) در هر دو نظریه به خوبی تعریف شده است.
این دو نظریه به رغم شباهتهایی که دارند، تفاوتهای بسیار مهمی نیز دارند که در زیر به شرح مواردی از آن پرداخته می شود.
چارچوب مفهومی : GT نسبت به CTT چارچوب مفهومی قدرتمندتری دارد که منجر به برطرف کردن
تعدادی از تناقضات آشکار در چند بحث CTT از اعتبار شده است. دو ویژگی مهم GT که به حل تناقضات