आइटम प्रतिक्रिया सिद्धांत

साइकोमेट्रिक्स में, आइटम रिस्पांस थ्योरी (आईआरटी) (इसे अव्यक्त गुण सिद्धांत, स्ट्रांग ट्रू स्कोर सिद्धांत अथवा आधुनिक मानसिक परीक्षण सिद्धांत के रूप में भी जाना जाता है) क्षमताओं, दृष्टिकोण अथवा अन्य चर को मापने वाले परीक्षणों, प्रश्नावली और समान उपकरणों के डिजाइन, विश्लेषण और स्कोरिंग के लिए प्रतिमान है। यह परीक्षण आइटम पर व्यक्तियों के प्रदर्शन और उस आइटम को मापने के लिए डिज़ाइन की गई क्षमता के समग्र माप पर परीक्षणकर्ताओं के प्रदर्शन के स्तर के मध्य संबंधों पर आधारित परीक्षण का सिद्धांत है। आइटम और परीक्षार्थी दोनों की विशेषताओं का प्रतिनिधित्व करने के लिए कई भिन्न-भिन्न सांख्यिकीय मॉडल का उपयोग किया जाता है। स्केल बनाने और प्रश्नावली प्रतिक्रियाओं का मूल्यांकन करने के लिए सरल विकल्पों के विपरीत, यह नहीं माना जाता है कि प्रत्येक आइटम समान रूप से समष्टि है। उदाहरण के लिए, यह आईआरटी को लिकर्ट स्केलिंग से पृथक करता है, जिसमें सभी वस्तुओं को एक-दूसरे की प्रतिकृति माना जाता है अथवा अन्य शब्दों में वस्तुओं को समानांतर उपकरण माना जाता है। इसके विपरीत, आइटम रिस्पांस थ्योरी प्रत्येक आइटम (आइटम विशेषता वक्र, अथवा आईसीसी) की कठिनाई को स्केलिंग आइटम में सम्मिलित की जाने वाली सूचना के रूप में मानता है।

यह डेटा के परीक्षण के लिए संबंधित गणितीय मॉडल के अनुप्रयोग पर आधारित है। क्योंकि इसे अधिकांशतः क्लासिकल टेस्ट सिद्धांत से श्रेष्ठ माना जाता है, संयुक्त राज्य अमेरिका में स्केल विकसित करने के लिए यह रुचिकर विधि है, विशेष रूप से जब तथाकथित हाई-स्टेक परीक्षणों में इष्टतम निर्णयों का आग्रह किया जाता है, जिसमें ग्रेजुएट रिकॉर्ड परीक्षा (जीआरई) और ग्रेजुएट प्रबंधन प्रवेश परीक्षा (जीमैट) सम्मिलित हैं।

क्लासिकल टेस्ट सिद्धांत के परीक्षण-स्तरीय फोकस के विपरीत, आइटम रिस्पांस थ्योरी का नाम आइटम पर सिद्धांत के फोकस के कारण है। इस प्रकार आईआरटी परीक्षण में प्रत्येक आइटम के लिए दी गई क्षमता के प्रत्येक परीक्षार्थी की प्रतिक्रिया को मॉडल करता है। आइटम शब्द सामान्य है, जिसमें सभी प्रकार की सूचनात्मक वस्तुएं सम्मिलित हैं। वे बहुविकल्पीय प्रश्न हो सकते हैं जिनमें उचित एवं अनुचित उत्तर होते हैं, किन्तु सामान्यतः प्रश्नावली पर कथन भी होते हैं जो उत्तरदाताओं को सहमति के स्तर (रेटिंग अथवा लाइकेर्ट स्केल), या रोगी के लक्षणों को उपस्थित/अनुपस्थित, या समष्टि प्रणालियों में नैदानिक ​​​​सूचना के रूप में दर्शाने की अनुमति प्रदान करते हैं।

आईआरटी इस विचार पर आधारित है कि किसी आइटम के लिए उचित/कुंजीबद्ध प्रतिक्रिया की प्रायिकता व्यक्ति और आइटम पैरामीटर्स का गणितीय फलन होता है। (व्यक्ति और वस्तु पैरामीटर्स के गणितीय फलन की अभिव्यक्ति लेविन के समीकरण, B = f(P, E) के अनुरूप है, जिसका आशय है कि व्यवहार उनके वातावरण में व्यक्ति का कार्य है।) व्यक्ति पैरामीटर को (सामान्यतः) अव्यक्त गुण या आयाम के रूप में माना जाता है। उदाहरणों में सामान्य बुद्धि या दृष्टिकोण का सामर्थ्य सम्मिलित है। जिन पैरामीटर्स पर वस्तुओं की विशेषता होती है उनमें उनकी कठिनाई सम्मिलित होती है (कठिनाई सीमा पर उनके स्थान के रूप जिसे में जाना जाता है); विभेदन (स्लोप या सहसंबंध) यह दर्शाता है कि व्यक्तियों की सफलता की दर उनकी क्षमता के साथ कितनी तीव्रता से भिन्न होती है; और सूडोगेस्सिंग पैरामीटर, (निचले) स्पर्शोन्मुख को चिह्नित करता है जिस पर अनुमान लगाने के कारण सबसे कम सक्षम व्यक्ति भी स्कोर कर सकते हैं (उदाहरण के लिए, चार संभावित प्रतिक्रियाओं के साथ बहुविकल्पीय आइटम पर शुद्ध विकल्प के लिए 25% होता है)।

उसी प्रकार, आईआरटी का उपयोग ऑनलाइन सोशल नेटवर्क में मानव व्यवहार का परिमाण प्राप्त करने के लिए किया जा सकता है। विभिन्न व्यक्तियों द्वारा व्यक्त किए गए विचारों को एकत्रित करके आईआरटी का उपयोग करके इसका अध्ययन किया जा सकता है। सूचना को अनुचित सूचना अथवा सत्य सूचना के रूप में वर्गीकृत करने में इसके उपयोग का भी मूल्यांकन किया गया है।

अवलोकन
आइटम प्रतिक्रिया फ़ंक्शन की अवधारणा 1950 से पूर्व की थी। सिद्धांत के रूप में आईआरटी का अग्रणी कार्य 1950 और 1960 के दशक के समय हुआ था। तीन अन्वेषकों में शैक्षिक परीक्षण सेवा के मनोचिकित्सक फ्रेडरिक एम. लॉर्ड, डेनिश गणितज्ञ जॉर्ज रश और ऑस्ट्रियाई समाजशास्त्री पॉल लाज़र्सफ़ेल्ड थे, जिन्होंने स्वतंत्र रूप से समानांतर अनुसंधान किया था। आईआरटी की प्रगति को अग्र विस्तारित करने वाले प्रमुख व्यक्तियों में बेंजामिन ड्रेक राइट और डेविड एंड्रीच सम्मिलित हैं। 1970 और 1980 के दशक के अंत तक आईआरटी का व्यापक रूप से उपयोग नहीं किया गया था, इस प्रकार चिकित्सकों को आईआरटी की उपयोगिता और लाभ बताए गए थे, और दूसरी ओर व्यक्तिगत कंप्यूटर ने कई शोधकर्ताओं को आईआरटी के लिए आवश्यक कंप्यूटिंग पावर का एक्सेस प्रदान किया था।

अन्य तथ्यों के अतिरिक्त, आईआरटी का उद्देश्य यह मूल्यांकन करने के लिए रूपरेखा प्रदान करना है कि मूल्यांकन कितना उचित रूप से कार्य करता है, और मूल्यांकन पर व्यक्तिगत आइटम उचित रूप से कार्य करते हैं। आईआरटी का सबसे सामान्य अनुप्रयोग शिक्षा में है, जहां मनोचिकित्सक इसका उपयोग परीक्षाओं (छात्र मूल्यांकन) को विकसित करने और डिजाइन करने, परीक्षाओं के लिए वस्तुओं के बैंक बनाए रखने और परीक्षाओं के क्रमिक संस्करणों (उदाहरण के लिए, समय के साथ परिणामों के मध्य उपमा की अनुमति देने के लिए) के लिए वस्तुओं की कठिनाइयों को समान करने के लिए करते हैं।

आईआरटी मॉडल को अधिकांशतः अव्यक्त विशेषता मॉडल के रूप में जाना जाता है। अव्यक्त शब्द का उपयोग इस तथ्य के लिए किया जाता है कि भिन्न-भिन्न आइटम प्रतिक्रियाओं को परिकल्पित लक्षणों, निर्माणों या विशेषताओं की अवलोकन योग्य अभिव्यक्तियों के रूप में लिया जाता है, जिन्हें प्रत्यक्ष रूप से देखा नहीं जाता है, किन्तु जिनका अनुमान प्रकट प्रतिक्रियाओं से लगाया जाता है। अव्यक्त विशेषता मॉडल समाजशास्त्र के क्षेत्र में विकसित किए गए थे, किन्तु वे वस्तुतः आईआरटी मॉडल के समान हैं।

आईआरटी का आशय सामान्यतः क्लासिकल टेस्ट सिद्धांत (सीटीटी) पर संशोधन के रूप में किया जाता है। उन कार्यों के लिए जिन्हें सीटीटी का उपयोग करके पूर्ण किया जा सकता है, आईआरटी सामान्यतः अधिक नम्यता लाता है और अधिक परिष्कृत सूचना प्रदान करता है। कम्प्यूटरीकृत-अनुकूली परीक्षण जैसे कुछ अनुप्रयोग, आईआरटी द्वारा सक्षम हैं और केवल क्लासिकल टेस्ट सिद्धांत का उपयोग करके उचित रूप से निष्पादित नहीं किए जा सकते हैं। सीटीटी के सादृश्य में आईआरटी का अन्य लाभ यह है कि आईआरटी द्वारा प्रदान की जाने वाली अधिक परिष्कृत सूचना शोधकर्ता को शैक्षिक मूल्यांकन की विश्वसनीयता (साइकोमेट्रिक) में संशोधन करने की अनुमति प्रदान करती है।

आईआरटी में तीन धारणाएँ सम्मिलित हैं:


 * 1) एकआयामी लक्षण जिसे $${\theta}$$ द्वारा दर्शाया जाता है;
 * 2) वस्तुओं की स्थानीय स्वतंत्रता;
 * 3) किसी आइटम पर किसी व्यक्ति की प्रतिक्रिया को गणितीय आइटम प्रतिक्रिया फ़ंक्शन (आईआरएफ) द्वारा मॉडल किया जा सकता है।

विशेषता को स्केल पर मापने योग्य माना जाता है (परीक्षण का अस्तित्व ही इसे मानता है), सामान्यतः इसे 0.0 के माध्य और 1.0 के मानक विचलन के साथ मानक स्केल पर सेट किया जाता है। एकआयामीता की व्याख्या एकरूपता के रूप में की जानी चाहिए, ऐसा गुण जिसे किसी दिए गए उद्देश्य या उपयोग के संबंध में परिभाषित या अनुभवजन्य रूप से प्रदर्शित किया जाना चाहिए, किन्तु ऐसी मात्रा नहीं होनी चाहिए जिसे मापा जा सके। 'स्थानीय स्वतंत्रता' का अर्थ है (ए) आइटम के उपयोग की संभावना किसी अन्य आइटम का उपयोग करने से संबंधित नहीं है और (बी) किसी आइटम पर प्रतिक्रिया प्रत्येक परीक्षार्थी का स्वतंत्र निर्णय है, अर्थात, इसमें कोई छल अथवा समूह कार्य नहीं है। आयामीता के विषय का परीक्षण अधिकांशतः कारक विश्लेषण के साथ किया जाता है, यद्यपि आईआरएफ आईआरटी का मूल निर्माण खंड है और अधिकांश अनुसंधान और साहित्य का केंद्र है।

आइटम प्रतिक्रिया फ़ंक्शन
आईआरएफ संभावना देता है कि किसी दिए गए योग्यता स्तर वाला व्यक्ति उचित उत्तर देगा। कम क्षमता वाले व्यक्तियों के निकट कम अवसर होते हैं, यद्यपि उच्च क्षमता वाले व्यक्तियों के उचित उत्तर देने की संभावना अत्यधिक होती है; उदाहरण के लिए, उच्च गणित क्षमता वाले छात्रों को गणित का कोई आइटम उचित प्राप्त होने की अधिक संभावना होती है। प्रायिकता का त्रुटिहीन मान, क्षमता के अतिरिक्त, आईआरएफ के लिए आइटम पैरामीटर्स के सेट पर निर्भर करता है।

तीन पैरामीटर लॉजिस्टिक मॉडल


उदाहरण के लिए, तीन पैरामीटर लॉजिस्टिक मॉडल (3PL) में, बहुविकल्पीय प्रश्न वाले द्विभाजित आइटम i के लिए उचित प्रतिक्रिया की संभावना है:



p_i({\theta})=c_i + \frac{1-c_i}{1+e^{-a_i({\theta}-b_i)}} $$ जहाँ $${\theta}$$ यह दर्शाता है कि आइटम पैरामीटर का अनुमान लगाने के उद्देश्य से व्यक्ति की क्षमताओं को सामान्य वितरण से प्रतिरूप के रूप में प्रस्तुत किया गया है। आइटम पैरामीटर का अनुमान लगाए जाने के पश्चात, रिपोर्टिंग उद्देश्यों के लिए व्यक्तिगत व्यक्तियों की क्षमताओं का अनुमान लगाया जाता है। $$a_i$$, $$b_i$$, और $$c_i$$ आइटम पैरामीटर हैं। आइटम पैरामीटर आईआरएफ का आकार निर्धारित करते हैं। चित्र 1 आदर्श 3PL आईसीसी को दर्शाता है।

आइटम पैरामीटर की व्याख्या मानक लॉजिस्टिक फलन के आकार को परिवर्तित करने के रूप में की जा सकती है:
 * $$P(t)=\frac{1}{1+e^{-t}}.$$

संक्षेप में, पैरामीटरों की व्याख्या इस प्रकार की जाती है (स्पष्टता के लिए सबस्क्रिप्ट को त्याग देना); b सबसे मूल है, इसलिए प्रथम सूचीबद्ध किया गया है: यदि $$c = 0,$$ तो ये $$p(b) = 1/2$$ और $$p'(b) = a/4,$$ तक सरल हो जाते हैं, जिसका अर्थ है कि b 50% सफलता स्तर (कठिनाई) के समान है, और a (चार से विभाजित) अधिकतम स्लोप (विभेदन) है, जो 50% सफलता स्तर पर होता है। इसके अतिरिक्त, उचित प्रतिक्रिया का लॉगिट (लॉग ऑड्स) $$a(\theta-b)$$ है, ($$c=0$$ मानते हुए): विशेष रूप से यदि क्षमता θ कठिनाई b के समान है, तो उचित उत्तर के लिए सम संभावनाएं (1:1, इसलिए लॉगिट 0) हैं, जितनी अधिक क्षमता कठिनाई से ऊपर (या नीचे) होगी, उचित प्रतिक्रिया की संभावना उतनी ही अधिक (या कम) होगी, विभेदन के साथ यह निर्धारित होता है कि क्षमता के साथ संभावनाओं में कितनी तीव्रता से वृद्धि अथवा कमी होती हैं।
 * b - कठिनाई, आइटम स्थान: $$p(b) = (1+c)/2,$$ $$c_i$$ (न्यूनतम) और 1 (अधिकतम) के मध्य का अर्ध बिंदु भी जहां स्लोप अधिकतम है।
 * a - विभेदन, स्केल, स्लोप: अधिकतम स्लोप $$p'(b) = a \cdot (1-c)/4.$$
 * c - सूडो-गेस्सिंग, अवसर, स्पर्शोन्मुख न्यूनतम $$p(-\infty) = c.$$

अन्य शब्दों में, मानक लॉजिस्टिक फलन में एसिम्प्टोटिक न्यूनतम 0 ($$c=0$$) होता है, यह 0 ($$b = 0$$, $$P(0) = 1/2$$) के निकट केंद्रित होता है, और अधिकतम स्लोप $$P'(0)=1/4.$$ होता है। $$a$$ पैरामीटर क्षैतिज स्तर को विस्तारित करता है, $$b$$ पैरामीटर क्षैतिज स्तर को स्थानांतरित करता है, और $$c$$ ऊर्ध्वाधर स्तर को $$[0,1]$$ से $$[c,1].$$ तक संपीड़ित करता है। इसका विवरण नीचे दिया गया है।

पैरामीटर $$b_i$$ आइटम स्थान का प्रतिनिधित्व करता है, जिसे प्राप्ति परीक्षण कि स्थिति में, आइटम कठिनाई के रूप में जाना जाता है। यह $${\theta}$$ पर वह बिंदु है, जहां आईआरएफ का अधिकतम स्लोप है, और जहां मान $$c_i$$ के न्यूनतम मान और 1 के अधिकतम मान के मध्य अर्ध है। उदाहरण आइटम मध्यम कठिनाई का है क्योंकि $$b_i$$=0.0 है, जो वितरण के केंद्र के निकट है। ध्यान दें कि यह मॉडल आइटम की कठिनाई और व्यक्ति की विशेषता को ही सातत्य पर मापता है। इस प्रकार, किसी वस्तु के संबंध में यह तथ्य वैध है कि वह व्यक्ति A के गुण स्तर के समान कठिन है या किसी व्यक्ति के गुण स्तर के संबंध में वस्तु Y की कठिनाई के समान है, इस अर्थ में कि किसी वस्तु से संयोजित कार्य का सफल प्रदर्शन विशिष्ट क्षमता के स्तर को दर्शाता है।

आइटम पैरामीटर $$a_i$$ वस्तु के विभेदन का प्रतिनिधित्व करता है: अर्थात्, वह डिग्री जिस तक वस्तु अव्यक्त सातत्य पर विभिन्न क्षेत्रों में व्यक्तियों के मध्य विभेदन करती है। यह पैरामीटर आईआरएफ के स्लोप को दर्शाता है जहां स्लोप अपने अधिकतम पर होता है। उदाहरण आइटम $$a_i$$=1.0 है, जो उचित प्रकार से विभेदन करता है; कम क्षमता वाले व्यक्तियों के निकट वास्तव में उच्च क्षमता वाले व्यक्तियों के सादृश्य में उचित उत्तर देने की संभावना कम होती है। यह विभेदन पैरामीटर मानक भारित रैखिक (साधारण न्यूनतम वर्ग, सामान्य न्यूनतम वर्ग) प्रतिगमन में संबंधित आइटम या संकेतक के भार गुणांक से युग्मित होता है और इसलिए अंतर्निहित अव्यक्त अवधारणा के अप्रशिक्षित माप के लिए संकेतकों का भारित सूचकांक बनाने के लिए इसका उपयोग किया जा सकता है।

बहुविकल्पीय आइटम जैसी वस्तुओं के लिए, उचित प्रतिक्रिया की संभावना पर अनुमान लगाने के प्रभावों को ध्यान में रखने के प्रयास में पैरामीटर $$c_i$$ का उपयोग किया जाता है। यह इस संभावना को दर्शाता है कि कम क्षमता वाले व्यक्तियों को यह आइटम संयोग से उचित मिल जाएगा, जिसे गणितीय रूप से निम्न अनंतस्पर्शी के रूप में दर्शाया गया है। चार-विकल्प वाले बहुविकल्पी आइटम में उदाहरण आइटम की भाँति आईआरएफ हो सकता है; अत्यंत कम क्षमता वाले प्रत्याशी द्वारा उचित उत्तर का अनुमान लगाने की 1/4 संभावना होती है, इसलिए $$c_i$$ लगभग 0.25 होगा। यह दृष्टिकोण मानता है कि सभी विकल्प समान रूप से प्रशंसनीय हैं, क्योंकि यदि विकल्प का कोई अर्थ नहीं है, तो सबसे कम क्षमता वाला व्यक्ति भी इसे त्यागने में सक्षम होगा, इसलिए आईआरटी पैरामीटर अनुमान विधियां इसे ध्यान में रखती हैं और देखे गए डेटा के आधार पर $$c_i$$ का अनुमान लगाती हैं।

आईआरटी मॉडल
सामान्यतः, आईआरटी मॉडल को दो सदस्यों एकआयामी और बहुआयामी में विभाजित किया जा सकता है। एकआयामी मॉडल के लिए एकल गुण (क्षमता) आयाम $${\theta}$$ की आवश्यकता होती है। बहुआयामी आईआरटी मॉडल प्रतिक्रिया डेटा के कई लक्षणों से उत्पन्न होने की परिकल्पना की गई है। यद्यपि, समष्टिता में अत्यधिक वृद्धि के कारण, अधिकांश आईआरटी अनुसंधान और अनुप्रयोग आयामी मॉडल का उपयोग करते हैं।

आईआरटी मॉडल को प्राप्त प्रतिक्रियाओं की संख्या के आधार पर भी वर्गीकृत किया जा सकता है। विशिष्ट बहुविकल्पी वस्तु द्विभाजित होती है; चार या पांच विकल्प होने पर भी, इसे उचित/अनुचित (उचित/अनुचित) के रूप में ही स्कोर किया जाता है। मॉडलों का अन्य वर्ग बहुपद परिणामों पर प्रयुक्त होता है, जहां प्रत्येक प्रतिक्रिया का भिन्न स्कोर मान होता है। इसका सामान्य उदाहरण लिकर्ट स्केल-प्रकार की वस्तुएं हैं, उदाहरण के लिए, 1 से 5 के स्केल पर मूल्यांकन करें।

आईआरटी पैरामीटर्स की संख्या
द्विभाजित आईआरटी मॉडल का वर्णन उनके द्वारा उपयोग किए जाने वाले पैरामीटरों की संख्या के आधार पर किया जाता है। 3PL का नाम इसलिए रखा गया है क्योंकि यह तीन आइटम पैरामीटर्स को नियोजित करता है। दो-पैरामीटर मॉडल (2PL) मानता है कि डेटा का कोई अनुमान नहीं है, किन्तु आइटम स्थान ($$b_i$$) और विभेदन ($$a_i$$) के संदर्भ में भिन्न हो सकते हैं। पैरामीटर मॉडल (1PL) मानता है कि अनुमान लगाना क्षमता का भाग है और मॉडल में फिट होने वाली सभी वस्तुओं में समान विभेदन होते हैं, जिससे वस्तुओं को केवल पैरामीटर ($$b_i$$) द्वारा वर्णित किया जा सके। इसके परिणामस्वरूप 1-पैरामीटर मॉडल में विशिष्ट वस्तुनिष्ठता का गुण होता है, जिसका अर्थ है कि आइटम की कठिनाई की रैंक क्षमता से स्वतंत्र सभी उत्तरदाताओं के लिए समान होती है, और व्यक्ति की क्षमता की रैंक कठिनाई से स्वतंत्र रूप से आइटम के लिए समान होती है। इस प्रकार, 1-पैरामीटर मॉडल प्रारूप स्वतंत्र हैं, वह गुण जो दो-पैरामीटर और तीन-पैरामीटर मॉडल के लिए मान्य नहीं है। इसके अतिरिक्त, सैद्धांतिक रूप से चार-पैरामीटर मॉडल (4PL) होते है, जिसमें ऊपरी अनंतस्पर्शी है, जिसे $$d_i,$$ द्वारा दर्शाया गया है जहाँ 3PL में $$1-c_i$$ को $$d_i-c_i$$ द्वारा प्रतिस्थापित किया गया है। यद्यपि, इसका उपयोग कम किया जाता है। ध्यान दें कि आइटम पैरामीटर्स का वर्णमाला क्रम उनके व्यावहारिक या साइकोमेट्रिक महत्व से युग्मित नहीं होता है; स्थान/कठिनाई ($$b_i$$) पैरामीटर स्पष्ट रूप से सबसे महत्वपूर्ण है क्योंकि यह तीनों मॉडलों में सम्मिलित है। 1PL केवल $$b_i$$ का उपयोग करता है, 2PL $$b_i$$ और $$a_i$$ का उपयोग करता है, 3PL, $$c_i$$ जोड़ता है, और 4PL, $$d_i$$ जोड़ता है।

2PL, $$c_i = 0$$ के साथ 3PL मॉडल के समतुल्य है, और उन वस्तुओं के परीक्षण के लिए उपयुक्त है जहां उचित उत्तर का अनुमान लगाना पूणर्तः असंभव है, जैसे कि रिक्त आइटम को फिल करना (121 का वर्गमूल क्या है?), अथवा जहां अनुमान लगाने की अवधारणा प्रयुक्त नहीं होती है, जैसे व्यक्तित्व, दृष्टिकोण, अथवा रुचिकर आइटम (उदाहरण के लिए, मुझे ब्रॉडवे संगीत में रूचि है। सहमत/असहमत) आदि।

1PL न केवल यह मानता है कि अनुमान लगाना उपस्थित नहीं है (अथवा अप्रासंगिक), अपितु सभी आइटम सभी वस्तुओं के लिए समान लोडिंग के साथ सामान्य कारक विश्लेषण के अनुरूप विभेदन के संदर्भ में समान हैं। व्यक्तिगत वस्तुओं या व्यक्तियों में द्वितीयक कारक हो सकते हैं किन्तु इन्हें परस्पर स्वतंत्र और सामूहिक रूप से ऑर्थोगोनल माना जाता है।

लॉजिस्टिक और सामान्य आईआरटी मॉडल
वैकल्पिक सूत्रीकरण सामान्य संभाव्यता वितरण के आधार पर आईआरएफ का निर्माण करता है; इन्हें कभी-कभी सामान्य ऑगिव (सांख्यिकी) मॉडल कहा जाता है। उदाहरण के लिए, दो-पैरामीटर सामान्य-ओगिव आईआरएफ का सूत्र है:



p_i(\theta)= \Phi \left( \frac{\theta-b_i}{\sigma_i} \right) $$ जहां Φ मानक सामान्य वितरण का संचयी वितरण फलन (सीडीएफ) है।

सामान्य-ऑगिव मॉडल सामान्य रूप से वितरित माप त्रुटि की धारणा से प्राप्त होता है और उस आधार पर यह सैद्धांतिक रूप से आकर्षक है। यहाँ $$b_i$$ पुनः, कठिनाई पैरामीटर है। विभेदन पैरामीटर $${\sigma}_i$$ है, जो आइटम i के लिए माप त्रुटि का मानक विचलन है, और 1/$$a_i$$ के समतुल्य है।

वस्तुओं के मध्य टेट्राकोरिक सहसंबंधों के आव्यूह का कारक-विश्लेषण करके कोई सामान्य-ऑगिव अव्यक्त विशेषता मॉडल का अनुमान लगा सकता है। इसका तात्पर्य यह है कि सामान्य प्रयोजन सांख्यिकीय सॉफ्टवेयर का उपयोग करके सरल आईआरटी मॉडल का अनुमान लगाना तकनीकी रूप से संभव है।

क्षमता पैरामीटर के पुनर्स्केलिंग के साथ, 2PL लॉजिस्टिक मॉडल को संचयी सामान्य ऑगिव के निकट लाना संभव है। सामान्यतः, 2PL लॉजिस्टिक और सामान्य-ऑगिव आईआरएफ की संभावना फलन की सीमा में 0.01 से अधिक नहीं होती है। यद्यपि, अंतर वितरण टेल्स में सबसे बड़ा है, जिसका परिणामों पर अधिक प्रभाव होता है।

अव्यक्त विशेषता/आईआरटी मॉडल मूल रूप से सामान्य ऑगिव का उपयोग करके विकसित किया गया था, किन्तु उस समय (1960 के दशक) कंप्यूटरों के लिए इसे कम्प्यूटेशनल रूप से अधिक डिमांड वाला माना जाता था। लॉजिस्टिक मॉडल को सरल विकल्प के रूप में प्रस्तावित किया गया था, और तब से इसका व्यापक उपयोग हुआ है। यद्यपि, कुछ वर्ष पूर्व, यह प्रदर्शित किया गया कि, सामान्य सीडीएफ के लिए मानक बहुपद सन्निकटन का उपयोग करते हुए, सामान्य-ऑगिव मॉडल लॉजिस्टिक मॉडल के सादृश्य में कम्प्यूटेशनल रूप से अधिक डिमांड वाला नहीं है।

रैश मॉडल

रैश मॉडल को अधिकांशतः 1PL आईआरटी मॉडल माना जाता है। यद्यपि, रैश मॉडलिंग के समर्थक इसे डेटा और सिद्धांत के मध्य संबंधों की अवधारणा के लिए पूर्ण रूप से भिन्न दृष्टिकोण के रूप में देखना स्वीकार करते हैं। अन्य सांख्यिकीय मॉडलिंग दृष्टिकोणों की भाँति, आईआरटी प्रेक्षित डेटा के लिए मॉडल के फिट होने की प्रधानता पर ध्यान देता है, यद्यपि रैश मॉडल मूल माप के लिए आवश्यकताओं की प्रधानता पर ध्यान देता है, पर्याप्त डेटा-मॉडल फिट महत्वपूर्ण किन्तु माध्यमिक आवश्यकता है जिसे किसी परीक्षण या अनुसंधान उपकरण से पूर्व पूर्ण किया जाना चाहिए जिससे किसी विशेषता को मापने का आशय किया जा सके। ऑपरेशनल रूप से, इसका अर्थ यह है कि आईआरटी दृष्टिकोण में डेटा में देखे गए पैटर्न को प्रतिबिंबित करने के लिए अतिरिक्त मॉडल पैरामीटर सम्मिलित हैं (उदाहरण के लिए, वस्तुओं को अव्यक्त विशेषता के साथ उनके सहसंबंध में भिन्नता की अनुमति देना), यद्यपि रैश दृष्टिकोण में, अव्यक्त विशेषता की उपस्थिति के संबंध में आशय केवल तभी वैध माना जा सकता है जब दोनों (ए) डेटा रैश मॉडल में फिट होते हैं, और (बी) परीक्षण आइटम और परीक्षार्थी मॉडल के अनुरूप होते हैं। इसलिए, रैश मॉडल के अंतर्गत, मिसफिटिंग प्रतिक्रियाओं के लिए मिसफिट के कारण के निदान की आवश्यकता होती है, और यदि कोई पर्याप्त रूप से यह समझा सकता है कि वे अव्यक्त विशेषता को संबोधित क्यों नहीं करते हैं, तो उन्हें डेटा सेट से बाहर रखा जा सकता है। इस प्रकार, रैश दृष्टिकोण को पुष्टिकरण दृष्टिकोण के रूप में देखा जा सकता है, जो शोधपूर्ण दृष्टिकोण के विपरीत है जो देखे गए डेटा को मॉडल करने का प्रयास करता है।

अनुमान लगाने या छद्म-मौका पैरामीटर की उपस्थिति या अनुपस्थिति प्रमुख और कभी-कभी विवादास्पद अंतर है। आईआरटी दृष्टिकोण में बहुविकल्पीय परीक्षाओं में अनुमान लगाने के लिए बायाँ स्पर्शोन्मुख पैरामीटर सम्मिलित है, यद्यपि रैश मॉडल में ऐसा नहीं है क्योंकि यह माना जाता है कि अनुमान लगाने से डेटा में यादृच्छिक रूप से वितरित शोर जुड़ जाता है। यद्यपि शोर को बेतरतीब ढंग से वितरित किया जाता है, यह माना जाता है कि, बशर्ते पर्याप्त वस्तुओं का परीक्षण किया जाए, कच्चे स्कोर द्वारा अव्यक्त विशेषता के साथ व्यक्तियों का रैंक-क्रम नहीं बदलेगा, बल्कि बस रैखिक पुनर्मूल्यांकन से गुजरना होगा। इसके विपरीत, तीन-पैरामीटर आईआरटी डेटा को फिट करने वाले मॉडल का चयन करके डेटा-मॉडल फिट प्राप्त करता है, विशिष्ट वस्तुनिष्ठता का त्याग करने की कीमत पर।

व्यवहार में, आईआरटी दृष्टिकोण की तुलना में रैश मॉडल के कम से कम दो प्रमुख फायदे हैं। पहला लाभ रश की विशिष्ट आवश्यकताओं की प्रधानता है, जो (मिलने पर) मौलिक व्यक्ति-मुक्त माप प्रदान करता है (जहां व्यक्तियों और वस्तुओं को ही अपरिवर्तनीय पैमाने पर मैप किया जा सकता है)। रैश दृष्टिकोण का अन्य लाभ यह है कि पर्याप्त आँकड़ों की उपस्थिति के कारण रैश मॉडल में पैरामीटर्स का अनुमान अधिक सरल है, जिसका अर्थ इस एप्लिकेशन में रैश के लिए कच्चे नंबर-उचित स्कोर की -से- मैपिंग है। $${\theta}$$ अनुमान।

मॉडल फिट का विश्लेषण
गणितीय मॉडल के किसी भी उपयोग की तरह, मॉडल में डेटा के फिट होने का आकलन करना महत्वपूर्ण है। यदि किसी मॉडल के साथ आइटम मिसफिट का निदान खराब आइटम गुणवत्ता के कारण किया जाता है, उदाहरण के लिए बहुविकल्पीय परीक्षण में भ्रमित करने वाले ध्यान भटकाने वाले, तो आइटम को उस परीक्षण फॉर्म से हटा दिया जा सकता है और भविष्य के परीक्षण फॉर्म में फिर से लिखा या प्रतिस्थापित किया जा सकता है। यदि, हालांकि, मिसफिटिंग का कोई स्पष्ट कारण नहीं होने पर बड़ी संख्या में मिसफिटिंग आइटम होते हैं, तो परीक्षण की निर्माण वैधता पर पुनर्विचार करने की आवश्यकता होगी और परीक्षण विनिर्देशों को फिर से लिखने की आवश्यकता हो सकती है। इस प्रकार, मिसफ़िट परीक्षण डेवलपर्स के लिए अमूल्य नैदानिक ​​उपकरण प्रदान करता है, जिससे उन परिकल्पनाओं को डेटा के विरुद्ध अनुभवजन्य रूप से परीक्षण करने की अनुमति मिलती है जिन पर परीक्षण विनिर्देश आधारित होते हैं।

फिट का आकलन करने के लिए कई तरीके हैं, जैसे ची-स्क्वायर आँकड़ा, या इसका मानकीकृत संस्करण। दो और तीन-पैरामीटर आईआरटी मॉडल श्रेष्ठ डेटा-मॉडल फिट सुनिश्चित करते हुए आइटम विभेदन को समायोजित करते हैं, इसलिए फिट आँकड़ों में -पैरामीटर मॉडल में पाए जाने वाले पुष्टिकरण निदान मूल्य का अभाव होता है, जहां आदर्श मॉडल पहले से निर्दिष्ट होता है।

डेटा को मॉडल के अनुपयुक्त होने के आधार पर नहीं हटाया जाना चाहिए, बल्कि इसलिए कि अनुपयुक्त होने का ठोस प्रासंगिक कारण का निदान किया गया है, जैसे कि अंग्रेजी का गैर-देशी वक्ता अंग्रेजी में लिखित विज्ञान परीक्षा दे रहा है। इस तरह के उम्मीदवार के बारे में तर्क दिया जा सकता है कि वह परीक्षण की आयामता के आधार पर व्यक्तियों की समान आबादी से संबंधित नहीं है, और, हालांकि पैरामीटर आईआरटी उपायों को नमूना-स्वतंत्र होने का तर्क दिया जाता है, वे आबादी से स्वतंत्र नहीं हैं, इसलिए यह अनुपयुक्त है निर्माण प्रासंगिक है और परीक्षण या मॉडल को अमान्य नहीं करता है। उपकरण सत्यापन में ऐसा दृष्टिकोण आवश्यक उपकरण है। दो और तीन-पैरामीटर मॉडल में, जहां साइकोमेट्रिक मॉडल को डेटा को फिट करने के लिए समायोजित किया जाता है, परीक्षण के भविष्य के प्रशासन को प्रारंभिक सत्यापन में उपयोग किए गए उसी मॉडल के लिए फिट होने के लिए जांचना चाहिए ताकि प्रत्येक प्रशासन से स्कोर को सामान्य बनाने वाली परिकल्पना की पुष्टि की जा सके। अन्य प्रशासनों के लिए. यदि डेटा-मॉडल फिट प्राप्त करने के लिए प्रत्येक प्रशासन के लिए अलग मॉडल निर्दिष्ट किया गया है, तो अलग अव्यक्त विशेषता को मापा जा रहा है और परीक्षण स्कोर को प्रशासनों के मध्य तुलनीय होने का तर्क नहीं दिया जा सकता है।

जानकारी
आइटम रिस्पांस थ्योरी का प्रमुख योगदान विश्वसनीयता (सांख्यिकी) की अवधारणा का विस्तार है। परंपरागत रूप से, विश्वसनीयता माप की त्रुटिहीनता को संदर्भित करती है (यानी, वह डिग्री जिस तक माप त्रुटि मुक्त है)। परंपरागत रूप से, इसे विभिन्न तरीकों से परिभाषित ल सूचकांक का उपयोग करके मापा जाता है, जैसे कि उचित और देखे गए स्कोर भिन्नता का अनुपात। यह सूचकांक किसी परीक्षण की औसत विश्वसनीयता को दर्शाने में सहायक है, उदाहरण के लिए दो परीक्षणों की तुलना करने के लिए। किन्तु आईआरटी यह स्पष्ट करता है कि परीक्षण स्कोर की संपूर्ण श्रृंखला में त्रुटिहीनता समान नहीं है। उदाहरण के लिए, परीक्षण की सीमा के किनारों पर प्राप्त अंकों में सामान्यतः सीमा के मध्य के करीब के अंकों की तुलना में अधिक त्रुटियाँ जुड़ी होती हैं।

आइटम रिस्पांस थ्योरी विश्वसनीयता को बदलने के लिए आइटम और परीक्षण जानकारी की अवधारणा को आगे बढ़ाता है। सूचना भी मॉडल पैरामीटर्स का कार्य है। उदाहरण के लिए, फिशर सूचना सिद्धांत के अनुसार, द्विभाजित प्रतिक्रिया डेटा के लिए 1PL के मामले में प्रदान की गई आइटम जानकारी केवल उचित प्रतिक्रिया की संभावना को अनुचित प्रतिक्रिया की संभावना से गुणा करती है, या,



I(\theta)=p_i(\theta) q_i(\theta).\, $$ अनुमान की मानक त्रुटि (एसई) किसी दिए गए विशेषता स्तर पर परीक्षण जानकारी का पारस्परिक है, है



\text{SE}(\theta) = \frac{1}{\sqrt{I(\theta)}}. $$ इस प्रकार अधिक जानकारी से माप में कम त्रुटि का पता चलता है।

अन्य मॉडलों के लिए, जैसे कि दो और तीन पैरामीटर मॉडल, विभेदन पैरामीटर फ़ंक्शन में महत्वपूर्ण भूमिका निभाता है। दो पैरामीटर मॉडल के लिए आइटम सूचना फ़ंक्शन है



I(\theta)=a_i^2 p_i(\theta) q_i(\theta).\, $$ तीन पैरामीटर मॉडल के लिए आइटम सूचना फ़ंक्शन है



I(\theta)=a_i^2 \frac{(p_i(\theta) - c_i)^2}{(1 - c_i)^2} \frac{q_i(\theta)}{p_i(\theta)}. $$ सामान्य तौर पर, आइटम सूचना फ़ंक्शन घंटी के आकार के दिखते हैं। अत्यधिक विभेदकारी वस्तुओं में लंबे, संकीर्ण सूचना कार्य होते हैं; वे बहुत योगदान देते हैं किन्तु सीमित दायरे में। कम विभेदकारी आइटम कम जानकारी प्रदान करते हैं किन्तु व्यापक दायरे में।

आइटम जानकारी के प्लॉट का उपयोग यह देखने के लिए किया जा सकता है कि कोई आइटम कितनी जानकारी का योगदान देता है और स्केल स्कोर रेंज के किस हिस्से में योगदान देता है। स्थानीय स्वतंत्रता के कारण, आइटम सूचना फ़ंक्शन योगात्मक मानचित्र हैं। इस प्रकार, परीक्षण सूचना फ़ंक्शन केवल परीक्षा में आइटमों के सूचना कार्यों का योग है। बड़े आइटम बैंक के साथ इस संपत्ति का उपयोग करके, माप त्रुटि को बहुत त्रुटिहीन रूप से नियंत्रित करने के लिए परीक्षण सूचना कार्यों को आकार दिया जा सकता है।

परीक्षण स्कोर की त्रुटिहीनता की विशेषता शायद साइकोमेट्रिक सिद्धांत में केंद्रीय मुद्दा है और आईआरटी और सीटीटी के मध्य मुख्य अंतर है। आईआरटी के निष्कर्षों से पता चलता है कि विश्वसनीयता की सीटीटी अवधारणा सरलीकरण है। विश्वसनीयता के स्थान पर, आईआरटी परीक्षण सूचना फ़ंक्शन प्रदान करता है जो थीटा, θ के विभिन्न मूल्यों पर त्रुटिहीनता की डिग्री दिखाता है।

ये परिणाम मनोचिकित्सकों को (संभावित रूप से) सावधानीपूर्वक चुनी गई वस्तुओं को सम्मिलित करके क्षमता की विभिन्न श्रेणियों के लिए विश्वसनीयता के स्तर को सावधानीपूर्वक आकार देने की अनुमति देते हैं। उदाहरण के लिए, प्रमाणीकरण स्थिति में जहां परीक्षा केवल उत्तीर्ण या असफल हो सकती है, जहां केवल कटस्कोर होता है, और जहां वास्तविक उत्तीर्ण स्कोर महत्वहीन होता है, केवल उच्च जानकारी वाले आइटम का चयन करके बहुत ही कुशल परीक्षण विकसित किया जा सकता है कटस्कोर के पास. ये आइटम सामान्यतः उन आइटमों से मेल खाते हैं जिनकी कठिनाई कटस्कोर के समान ही होती है।

स्कोरिंग
व्यक्ति पैरामीटर $${\theta}$$ व्यक्ति के अव्यक्त गुण के परिमाण को दर्शाता है, जो परीक्षण द्वारा मापी गई मानवीय क्षमता या विशेषता है। यह संज्ञानात्मक क्षमता, शारीरिक क्षमता, कौशल, ज्ञान, दृष्टिकोण, व्यक्तित्व विशेषता आदि हो सकती है।

व्यक्ति पैरामीटर का अनुमान - आईआरटी के साथ परीक्षण पर स्कोर - संख्या या प्रतिशत उचित जैसे पारंपरिक स्कोर की तुलना में बहुत अलग तरीके से गणना और व्याख्या की जाती है। व्यक्ति का कुल संख्या-उचित स्कोर वास्तविक स्कोर नहीं है, बल्कि आईआरएफ पर आधारित है, जिससे मॉडल में आइटम विभेदन पैरामीटर सम्मिलित होने पर भारित स्कोर प्राप्त होता है। यह वास्तव में संभावना फ़ंक्शन प्राप्त करने के लिए प्रत्येक आइटम के लिए आइटम प्रतिक्रिया फ़ंक्शन को गुणा करके प्राप्त किया जाता है, जिसका उच्चतम बिंदु अधिकतम संभावना अनुमान है $${\theta}$$. इस उच्चतम बिंदु का अनुमान सामान्यतः न्यूटन-रैपसन पद्धति का उपयोग करके आईआरटी सॉफ्टवेयर से लगाया जाता है। यद्यपि आईआरटी के साथ स्कोरिंग बहुत अधिक परिष्कृत है, अधिकांश परीक्षणों के लिए, थीटा अनुमान और पारंपरिक स्कोर के मध्य संबंध बहुत अधिक है; अधिकांशतः यह 0.95 या इससे अधिक होता है। पारंपरिक स्कोर के मुकाबले आईआरटी स्कोर का ग्राफ ऑगिव आकार दिखाता है जिसका अर्थ है कि आईआरटी मध्य की तुलना में सीमा की सीमाओं पर भिन्न-भिन्न व्यक्तियों का अनुमान लगाता है।

सीटीटी और आईआरटी के मध्य महत्वपूर्ण अंतर माप त्रुटि का उपचार है, जिसे माप की मानक त्रुटि द्वारा अनुक्रमित किया जाता है। सभी परीक्षण, प्रश्नावली और सूचीएं त्रुटिहीन उपकरण नहीं हैं; हम कभी भी किसी व्यक्ति का वास्तविक स्कोर नहीं जान सकते, बल्कि केवल अनुमान रखते हैं, देखा गया स्कोर। कुछ मात्रा में यादृच्छिक त्रुटि है जो देखे गए स्कोर को वास्तविक स्कोर से अधिक या कम कर सकती है। सीटीटी मानता है कि प्रत्येक परीक्षार्थी के लिए त्रुटि की मात्रा समान है, किन्तु आईआरटी इसे भिन्न-भिन्न करने की अनुमति देता है। इसके अतिरिक्त, आईआरटी के बारे में कुछ भी मानव विकास या सुधार का खंडन नहीं करता है या यह मानता है कि गुण स्तर निश्चित है। व्यक्ति कौशल, ज्ञान या यहां तक ​​कि तथाकथित परीक्षण लेने के कौशल सीख सकता है जो उच्च वास्तविक-स्कोर में तब्दील हो सकता है। वास्तव में, आईआरटी अनुसंधान का हिस्सा विशेषता स्तर में परिवर्तन के मापन पर केंद्रित है।

शास्त्रीय और आइटम रिस्पांस थ्योरीों की तुलना
शास्त्रीय परीक्षण सिद्धांत (सीटीटी) और आईआरटी काफी हद तक समान समस्याओं से संबंधित हैं, किन्तु सिद्धांत के भिन्न-भिन्न निकाय हैं और भिन्न-भिन्न तरीकों की आवश्यकता है। यद्यपि दोनों प्रतिमान सामान्यतः सुसंगत और पूरक हैं, फिर भी कई बिंदुओं में अंतर है:


 * आईआरटी सीटीटी की तुलना में अधिक मजबूत धारणाएं बनाता है और कई मामलों में तदनुसार मजबूत निष्कर्ष प्रदान करता है; प्राथमिक रूप से, त्रुटि के लक्षण। बेशक, ये परिणाम तभी मान्य होते हैं जब आईआरटी मॉडल की धारणाएं वास्तव में पूरी होती हैं।
 * हालांकि सीटीटी परिणामों ने महत्वपूर्ण व्यावहारिक परिणामों की अनुमति दी है, आईआरटी की मॉडल-आधारित प्रकृति अनुरूप सीटीटी निष्कर्षों पर कई फायदे प्रदान करती है।
 * सीटीटी परीक्षण स्कोरिंग प्रक्रियाओं का लाभ यह है कि गणना करना (और समझाना) आसान है, यद्यपि आईआरटी स्कोरिंग के लिए सामान्यतः अपेक्षाकृत जटिल अनुमान प्रक्रियाओं की आवश्यकता होती है।
 * आईआरटी वस्तुओं और लोगों को स्केल करने में कई सुधार प्रदान करता है। विशिष्टताएं आईआरटी मॉडल पर निर्भर करती हैं, किन्तु अधिकांश मॉडल वस्तुओं की कठिनाई और लोगों की क्षमता को ही मीट्रिक पर मापते हैं। इस प्रकार किसी वस्तु की कठिनाई और व्यक्ति की क्षमता की सार्थक तुलना की जा सकती है।
 * आईआरटी द्वारा प्रदान किया गया और सुधार यह है कि आईआरटी मॉडल के पैरामीटर सामान्यतः नमूना- या परीक्षण-निर्भर नहीं होते हैं यद्यपि ट्रू-स्कोर को विशिष्ट परीक्षण के संदर्भ में सीटीटी में परिभाषित किया जाता है। इस प्रकार आईआरटी उन स्थितियों में काफी अधिक लचीलापन प्रदान करता है जहां विभिन्न नमूनों या परीक्षण रूपों का उपयोग किया जाता है। ये आईआरटी निष्कर्ष कम्प्यूटरीकृत अनुकूली परीक्षण के लिए मूलभूत हैं।

सीटीटी और आईआरटी के मध्य कुछ विशिष्ट समानताओं का उल्लेख करना भी उचित है जो अवधारणाओं के मध्य पत्राचार को समझने में मदद करते हैं। सबसे पहले, भगवान इस धारणा के तहत दिखाया गया है कि $$\theta$$ सामान्य रूप से वितरित किया जाता है, 2PL मॉडल में विभेदन लगभग बिंदु-द्विक्रमिक सहसंबंध गुणांक का मोनोटोनिक फ़ंक्शन है। विशेष रूप से:



a_i \cong \frac{\rho_{it}}{\sqrt{1-\rho_{it}^2}} $$ जहाँ $$\rho_{it}$$ आइटम i का बिंदु द्विक्रमिक सहसंबंध है। इस प्रकार, यदि धारणा उचित है, तो जहां अधिक विभेदन है वहां सामान्यतः उच्च बिंदु-द्विक्रमिक सहसंबंध होगा।

और समानता यह है कि यद्यपि आईआरटी प्रत्येक अनुमान और सूचना फ़ंक्शन की मानक त्रुटि प्रदान करता है, समग्र रूप से परीक्षण के लिए सूचकांक प्राप्त करना भी संभव है जो सीधे क्रोनबैक के अल्फा के अनुरूप है, जिसे पृथक्करण सूचकांक कहा जाता है। ऐसा करने के लिए, किसी आईआरटी अनुमान को उचित स्थान और त्रुटि में विघटित करना शुरू करना आवश्यक है, जो किसी देखे गए स्कोर के वास्तविक स्कोर और सीटीटी में त्रुटि के अपघटन के समान है। होने देना


 * $$\hat{\theta} = \theta + \epsilon$$

जहाँ $$\theta$$ उचित स्थान है, और $$\epsilon$$ अनुमान के साथ त्रुटि संबद्धता है। तब $$\mbox{SE}({\theta})$$ के मानक विचलन का अनुमान है $$\epsilon$$ किसी दिए गए भारित स्कोर वाले व्यक्ति के लिए और पृथक्करण सूचकांक निम्नानुसार प्राप्त किया जाता है



R_\theta = \frac{\text{var}[\theta]}{\text{var}[\hat{\theta}]} = \frac{\text{var} [\hat{\theta}] - \text{var}[\epsilon]}{\text{var}[\hat{\theta}]} $$ जहां व्यक्ति अनुमान की माध्य वर्ग मानक त्रुटि त्रुटियों के विचरण का अनुमान देती है, $$\epsilon_n$$, व्यक्तियों के पार। मानक त्रुटियाँ सामान्यतः अनुमान प्रक्रिया के उप-उत्पाद के रूप में उत्पन्न होती हैं। पृथक्करण सूचकांक सामान्यतः क्रोनबैक के अल्फा के मूल्य के बहुत करीब है। आईआरटी को कभी-कभी मजबूत सच्चा स्कोर सिद्धांत या आधुनिक मानसिक परीक्षण सिद्धांत कहा जाता है क्योंकि यह सिद्धांत का नवीनतम निकाय है और सीटीटी के भीतर निहित परिकल्पनाओं को और अधिक स्पष्ट करता है।

अग्रिम पठन
Many books have been written that address item response theory or contain IRT or IRT-like models. This is a partial list, focusing on texts that provide more depth.


 * Lord, F.M. (1980). Applications of item response theory to practical testing problems. Mahwah, NJ: Erlbaum.
 * This book summaries much of Lord's IRT work, including chapters on the relationship between IRT and classical methods, fundamentals of IRT, estimation, and several advanced topics. Its estimation chapter is now dated in that it primarily discusses joint maximum likelihood method rather than the marginal maximum likelihood method implemented by Darrell Bock and his colleagues.


 * This book is an accessible introduction to IRT, aimed, as the title says, at psychologists.
 * This book is an accessible introduction to IRT, aimed, as the title says, at psychologists.


 * Baker, Frank (2001). The Basics of Item Response Theory. ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD.
 * This introductory book is by one of the pioneers in the field, and is available online at


 * This book describes various item response theory models and furnishes detailed explanations of algorithms that can be used to estimate the item and ability parameters. Portions of the book are available online as limited preview at Google Books.
 * This book describes various item response theory models and furnishes detailed explanations of algorithms that can be used to estimate the item and ability parameters. Portions of the book are available online as limited preview at Google Books.


 * This book provides a comprehensive overview regarding various popular IRT models. It is well suited for persons who already have gained basic understanding of IRT.
 * This book provides a comprehensive overview regarding various popular IRT models. It is well suited for persons who already have gained basic understanding of IRT.


 * This volume shows an integrated introduction to item response models, mainly aimed at practitioners, researchers and graduate students.
 * This volume shows an integrated introduction to item response models, mainly aimed at practitioners, researchers and graduate students.


 * This book discusses the Bayesian approach towards item response modeling. The book will be useful for persons (who are familiar with IRT) with an interest in analyzing item response data from a Bayesian perspective.
 * This book discusses the Bayesian approach towards item response modeling. The book will be useful for persons (who are familiar with IRT) with an interest in analyzing item response data from a Bayesian perspective.

बाहरी संबंध

 * "HISTORY OF ITEM RESPONSE THEORY (up to 1982)", University of Illinois at Chicago
 * A Simple Guide to the Item Response Theory(PDF)
 * Psychometric Software Downloads
 * IRT Tutorial
 * IRT Tutorial FAQ
 * An introduction to IRT
 * The Standards for Educational and Psychological Testing
 * IRT Command Language (ICL) computer program
 * IRT Programs from SSI, Inc.
 * Latent Trait Analysis and IRT Models
 * Rasch analysis
 * Rasch Analysis Programs from Winsteps
 * Item Response Theory
 * Free IRT software
 * IRT Packages in R
 * IRT / EIRT support in Lertap 5
 * Visual IRT analysis and reporting with Xcalibre