मिश्रित मॉडल

एक मिश्रित मॉडल, मिश्रित-प्रभाव मॉडल या मिश्रित त्रुटि-घटक मॉडल एक सांख्यिकीय मॉडल है जिसमें निश्चित प्रभाव और यादृच्छिक प्रभाव दोनों होते हैं। ये मॉडल भौतिक, जैविक और सामाजिक विज्ञान के विविध विषयों में उपयोगी हैं। वे उन सेटिंग्स में विशेष रूप से उपयोगी होते हैं जहां बार-बार माप डिजाइन एक ही सांख्यिकीय इकाइयों (अनुदैर्ध्य अध्ययन) पर किए जाते हैं, या जहां माप संबंधित सांख्यिकीय इकाइयों के समूहों पर किए जाते हैं। लापता मूल्यों से निपटने में उनके लाभ के कारण, मिश्रित प्रभाव मॉडल को अक्सर अधिक पारंपरिक दृष्टिकोण जैसे कि विचरण के बार-बार माप विश्लेषण पर प्राथमिकता दी जाती है।

यह पृष्ठ सामान्यीकृत रैखिक मिश्रित मॉडल या गैर-रेखीय मिश्रित-प्रभाव मॉडल | गैर-रेखीय मिश्रित-प्रभाव मॉडल के बजाय मुख्य रूप से रैखिक मिश्रित-प्रभाव मॉडल (एलएमईएम) पर चर्चा करेगा।

इतिहास और वर्तमान स्थिति
रोनाल्ड फिशर ने रिश्तेदारों के बीच गुण मूल्यों के सहसंबंधों का अध्ययन करने के लिए यादृच्छिक प्रभाव मॉडल पेश किए। 1950 के दशक में, चार्ल्स रॉय हेंडरसन निश्चित प्रभाव अनुमानक का गॉस-मार्कोव प्रमेय और यादृच्छिक प्रभावों की सर्वोत्तम रैखिक निष्पक्ष भविष्यवाणियाँ प्रदान की गईं। इसके बाद, मिश्रित मॉडलिंग सांख्यिकीय अनुसंधान का एक प्रमुख क्षेत्र बन गया है, जिसमें अधिकतम संभावना अनुमान, गैर-रेखीय मिश्रित प्रभाव मॉडल, मिश्रित प्रभाव मॉडल में लापता डेटा और मिश्रित प्रभाव मॉडल के बायेसियन सांख्यिकी अनुमान की गणना पर काम शामिल है। मिश्रित मॉडल कई विषयों में लागू किए जाते हैं जहां रुचि की प्रत्येक इकाई पर कई सहसंबद्ध माप किए जाते हैं। आनुवंशिकी से लेकर विपणन तक के क्षेत्रों में मानव और पशु विषयों से जुड़े अनुसंधान में इनका प्रमुखता से उपयोग किया जाता है, और बेसबॉल में भी इसका उपयोग किया गया है और औद्योगिक आँकड़े।

परिभाषा
मैट्रिक्स नोटेशन#नोटेशन में एक रैखिक मिश्रित मॉडल को इस प्रकार दर्शाया जा सकता है


 * $$\boldsymbol{y} = X \boldsymbol{\beta} + Z \boldsymbol{u} + \boldsymbol{\epsilon}$$

कहाँ


 * $$\boldsymbol{y}$$ माध्य के साथ प्रेक्षणों का एक ज्ञात वेक्टर है $$E(\boldsymbol{y}) = X \boldsymbol{\beta}$$;
 * $$\boldsymbol{\beta}$$ निश्चित प्रभावों का एक अज्ञात वेक्टर है;
 * $$\boldsymbol{u}$$ माध्य के साथ यादृच्छिक प्रभावों का एक अज्ञात वेक्टर है $$E(\boldsymbol{u})=\boldsymbol{0}$$ और सहप्रसरण मैट्रिक्स|विचरण-सहप्रसरण मैट्रिक्स $$\operatorname{var}(\boldsymbol{u})=G$$;
 * $$\boldsymbol{\epsilon}$$ माध्य के साथ यादृच्छिक त्रुटियों का एक अज्ञात वेक्टर है $$E(\boldsymbol{\epsilon})=\boldsymbol{0}$$ और विचरण $$\operatorname{var}(\boldsymbol{\epsilon})=R$$;
 * $$X$$ और $$Z$$ अवलोकनों से संबंधित डिज़ाइन मैट्रिक्स ज्ञात हैं $$\boldsymbol{y}$$ को $$\boldsymbol{\beta}$$ और $$\boldsymbol{u}$$, क्रमश।

अनुमान
का संयुक्त घनत्व $$\boldsymbol{y}$$ और $$\boldsymbol{u}$$ इस प्रकार लिखा जा सकता है: $$f(\boldsymbol{y},\boldsymbol{u}) = f(\boldsymbol{y} | \boldsymbol{u}) \, f(\boldsymbol{u})$$. सामान्यता मानते हुए, $$\boldsymbol{u} \sim \mathcal{N}(\boldsymbol{0},G)$$, $$\boldsymbol{\epsilon} \sim \mathcal{N}(\boldsymbol{0},R)$$ और $$\mathrm{Cov}(\boldsymbol{u},\boldsymbol{\epsilon})=\boldsymbol{0}$$, और संयुक्त घनत्व को अधिकतम करना $$\boldsymbol{\beta}$$ और $$\boldsymbol{u}$$, रैखिक मिश्रित मॉडल के लिए हेंडरसन के मिश्रित मॉडल समीकरण (एमएमई) देता है:

\begin{pmatrix} X'R^{-1}X & X'R^{-1}Z \\ Z'R^{-1}X & Z'R^{-1}Z + G^{-1} \end{pmatrix} \begin{pmatrix} \hat{\boldsymbol{\beta}} \\ \hat{\boldsymbol{u}} \end{pmatrix} = \begin{pmatrix} X'R^{-1}\boldsymbol{y} \\ Z'R^{-1}\boldsymbol{y} \end{pmatrix} $$ एमएमई के समाधान, $$\textstyle\hat{\boldsymbol{\beta}}$$ और $$\textstyle\hat{\boldsymbol{u}}$$ के लिए सर्वोत्तम रैखिक निष्पक्ष अनुमान और भविष्यवक्ता हैं $$\boldsymbol{\beta}$$ और $$\boldsymbol{u}$$, क्रमश। यह गॉस-मार्कोव प्रमेय का परिणाम है जब परिणाम का सशर्त भिन्नता पहचान मैट्रिक्स के लिए स्केलेबल नहीं है। जब सशर्त विचरण ज्ञात होता है, तो व्युत्क्रम विचरण भारित न्यूनतम वर्ग अनुमान सबसे अच्छा रैखिक निष्पक्ष अनुमान होता है। हालाँकि, सशर्त भिन्नता शायद ही कभी ज्ञात होती है। इसलिए एमएमई को हल करते समय विचरण और भारित पैरामीटर अनुमानों का संयुक्त रूप से अनुमान लगाना वांछनीय है।

ऐसे मिश्रित मॉडलों को फिट करने के लिए उपयोग की जाने वाली एक विधि अपेक्षा-अधिकतमकरण एल्गोरिदम (ईएम) है जहां विचरण घटकों को संयुक्त संभावना में न देखे गए उपद्रव पैरामीटर के रूप में माना जाता है। वर्तमान में, यह विधि सांख्यिकीय सॉफ़्टवेयर जैसे कि पायथन (प्रोग्रामिंग भाषा) (राज्य मॉडल पैकेज) और एसएएस (सॉफ़्टवेयर) (प्रो मिश्रित) में लागू की गई है, और केवल आर (प्रोग्रामिंग भाषा) के एनएलएमई पैकेज एलएमई में प्रारंभिक चरण के रूप में लागू की गई है। जब त्रुटियों का वितरण सामान्य होता है तो मिश्रित मॉडल समीकरणों का समाधान अधिकतम संभावना अनुमान होता है। मिश्रित मॉडलों को फिट करने के लिए कई अन्य तरीके हैं, जिनमें शुरुआत में एमईएम का उपयोग करना और फिर न्यूटन-रेफसन (आर (प्रोग्रामिंग भाषा) पैकेज nlme द्वारा प्रयुक्त) शामिल है। के lme), केवल (निम्न-आयामी) विचरण-सहसंयोजक मापदंडों के आधार पर एक प्रोफाइल लॉग संभावना प्राप्त करने के लिए न्यूनतम वर्गों को दंडित किया गया $$\boldsymbol{u}$$, यानी, इसका मैट्रिक्स $$\boldsymbol{G}$$, और फिर उस कम उद्देश्य फ़ंक्शन के लिए आधुनिक प्रत्यक्ष अनुकूलन (आर (प्रोग्रामिंग भाषा) के एलएमई4 द्वारा प्रयुक्त) पैकेज lmer और जूलिया (प्रोग्रामिंग भाषा) पैकेज MixedModels.jl) और संभावना का प्रत्यक्ष अनुकूलन (उदाहरण के लिए R (प्रोग्रामिंग भाषा) के glmmTMB द्वारा उपयोग किया जाता है)। विशेष रूप से, जबकि हेंडरसन द्वारा प्रस्तावित विहित रूप सिद्धांत के लिए उपयोगी है, कई लोकप्रिय सॉफ़्टवेयर पैकेज विरल मैट्रिक्स विधियों (जैसे lme4 और MixedModels.jl) का लाभ उठाने के लिए संख्यात्मक गणना के लिए एक अलग फॉर्मूलेशन का उपयोग करते हैं।

यह भी देखें

 * अरेखीय मिश्रित-प्रभाव मॉडल
 * निश्चित प्रभाव मॉडल
 * सामान्यीकृत रैखिक मिश्रित मॉडल
 * रेखीय प्रतिगमन
 * विचरण का मिश्रित-डिज़ाइन विश्लेषण
 * बहुस्तरीय मॉडल
 * यादृच्छिक प्रभाव मॉडल
 * बार-बार उपाय डिजाइन
 * अनुभवजन्य बेयस विधि