मिश्रित मॉडल

मिश्रित नमूना या मिश्रित त्रुटि-घटक नमूना एक सांख्यिकीय नमूना होता है जिसमें निश्चित प्रभाव और यादृच्छिक प्रभाव दोनों होते है। यह नमूना भौतिक, जैविक और सामाजिक विज्ञान के विविध विषयों में उपयोगी होता है। वह उन सेटिंग्स में विशेष रूप से उपयोगी होते है जहां बार-बार माप डिजाइन एक ही सांख्यिकीय इकाइयों (अनुदैर्ध्य अध्ययन) पर किए जाते है, या जहां माप संबंधित सांख्यिकीय इकाइयों के समूहों पर किए जाते है। अनुपस्थित मूल्यों को मिश्रित प्रभाव नमूना अधिकांशतः अधिक पारंपरिक दृष्टिकोण विश्लेषण पर प्राथमिकता दी जाती है।

यह पृष्ठ सामान्यीकृत रैखिक मिश्रित नमूना या गैर-रेखीय मिश्रित-प्रभाव नमूना के अतिरिक्त मुख्य रूप से रैखिक मिश्रित-प्रभाव नमूना (एलएमईएम) पर तर्क करता है।

इतिहास और वर्तमान स्थिति
रोनाल्ड फिशर ने गुण मूल्यों के सहसंबंधों का अध्ययन करने के लिए यादृच्छिक प्रभाव नमूना प्रस्तुत किया था। 1950 के दशक में, चार्ल्स रॉय हेंडरसन निश्चित प्रभाव अनुमानक का गॉस-मार्कोव प्रमेय और यादृच्छिक प्रभावों की सर्वोत्तम रैखिक निष्पक्ष भविष्यवाणियाँ प्रदान की गईं थी। इसके बाद, मिश्रित नमूना सांख्यिकीय अनुसंधान का एक प्रमुख क्षेत्र बन गया था, जिसमें अधिकतम संभावना अनुमान, गैर-रेखीय मिश्रित प्रभाव नमूने के बायेसियन सांख्यिकी अनुमान की गणना करना सम्मलित होता है। मिश्रित नमूना कई विषयों में उपयुक्त किए जाते है जहां रुचि की प्रत्येक इकाई पर कई सहसंबद्ध माप किए जाते है। आनुवंशिकी से लेकर विपणन तक के क्षेत्रों में मानव और पशु विषयों से जुड़े अनुसंधान में इनका प्रमुखता से उपयोग किया जाता है।

परिभाषा
आव्यूह संकेतन में एक रैखिक मिश्रित नमूने को इस प्रकार दर्शाया जा सकता है


 * $$\boldsymbol{y} = X \boldsymbol{\beta} + Z \boldsymbol{u} + \boldsymbol{\epsilon}$$

जहाँ


 * $$\boldsymbol{y}$$ माध्य के साथ प्रेक्षणों का एक ज्ञात वेक्टर है $$E(\boldsymbol{y}) = X \boldsymbol{\beta}$$;
 * $$\boldsymbol{\beta}$$ निश्चित प्रभावों का एक अज्ञात वेक्टर है;
 * $$\boldsymbol{u}$$ माध्य के साथ यादृच्छिक प्रभावों का एक अज्ञात वेक्टर है $$E(\boldsymbol{u})=\boldsymbol{0}$$ और विचरण-सहप्रसरण आव्यूह है $$\operatorname{var}(\boldsymbol{u})=G$$;
 * $$\boldsymbol{\epsilon}$$ माध्य के साथ यादृच्छिक त्रुटियों का एक अज्ञात वेक्टर है $$E(\boldsymbol{\epsilon})=\boldsymbol{0}$$ और विचरण है $$\operatorname{var}(\boldsymbol{\epsilon})=R$$;
 * $$X$$ और $$Z$$ अवलोकनों से संबंधित डिज़ाइन आव्यूह $$\boldsymbol{y}$$ को $$\boldsymbol{\beta}$$ और $$\boldsymbol{u}$$, है।

अनुमान
संयुक्त घनत्व $$\boldsymbol{y}$$ और $$\boldsymbol{u}$$ इस प्रकार लिखा जा सकता है: $$f(\boldsymbol{y},\boldsymbol{u}) = f(\boldsymbol{y} | \boldsymbol{u}) \, f(\boldsymbol{u})$$. सामान्यता, $$\boldsymbol{u} \sim \mathcal{N}(\boldsymbol{0},G)$$, $$\boldsymbol{\epsilon} \sim \mathcal{N}(\boldsymbol{0},R)$$ और $$\mathrm{Cov}(\boldsymbol{u},\boldsymbol{\epsilon})=\boldsymbol{0}$$, और संयुक्त घनत्व को अधिकतम करते है $$\boldsymbol{\beta}$$ और $$\boldsymbol{u}$$, रैखिक मिश्रित नमूने के लिए हेंडरसन के मिश्रित नमूना समीकरण (एमएमई) से हमे प्राप्त होता है:

\begin{pmatrix} X'R^{-1}X & X'R^{-1}Z \\ Z'R^{-1}X & Z'R^{-1}Z + G^{-1} \end{pmatrix} \begin{pmatrix} \hat{\boldsymbol{\beta}} \\ \hat{\boldsymbol{u}} \end{pmatrix} = \begin{pmatrix} X'R^{-1}\boldsymbol{y} \\ Z'R^{-1}\boldsymbol{y} \end{pmatrix} $$ एमएमई के समाधान, $$\textstyle\hat{\boldsymbol{\beta}}$$ और $$\textstyle\hat{\boldsymbol{u}}$$ के लिए सर्वोत्तम रैखिक निष्पक्ष अनुमान और भविष्यवक्ता है $$\boldsymbol{\beta}$$ और $$\boldsymbol{u}$$,। यह गॉस-मार्कोव प्रमेय का परिणाम होता है जब परिणाम का सशर्त भिन्नता पहचान आव्यूह के लिए स्केलेबल नहीं होता है। जब सशर्त विचरण ज्ञात होता है, तो व्युत्क्रम विचरण भारित न्यूनतम वर्ग अनुमान सबसे अच्छा रैखिक निष्पक्ष अनुमान होता है। चूँकि, सशर्त भिन्नता संभवतः ही कभी ज्ञात होती है। इसलिए एमएमई को हल करते समय विचरण और भारित पैरामीटर अनुमानों का संयुक्त रूप से अनुमान लगाना वांछनीय होता है।

ऐसे मिश्रित नमूनों का उपयोग एक विधि अपेक्षा-अधिकतमकरण कलन विधि (ईएम) में किया जाता है जहां विचरण घटकों को उपद्रव पैरामीटर के रूप में माना जाता है। वर्तमान में, यह विधि सांख्यिकीय सॉफ्टवेयर जैसे कि पायथन (प्रोग्रामिंग भाषा) और एसएएस (सॉफ्टवेयर) (प्रो मिश्रित) में उपयुक्त की गई है, और केवल आर (प्रोग्रामिंग भाषा) के एनएलएमई पैकेज एलएमई में प्रारंभिक चरण के रूप में उपयुक्त की गई है। जब त्रुटियों का वितरण सामान्य होता है तो मिश्रित नमूना समीकरणों का समाधान अधिकतम अनुमानित होता है।

मिश्रित नमूनों को उपयुक्त करने के लिए कई अन्य विधियां होती है, जिनमें प्रारंभ में एमईएम का उपयोग करना और फिर न्यूटन-रेफसन (आर (प्रोग्रामिंग भाषा) पैकेज नाइम द्वारा प्रयुक्त) सम्मलित होते है। lme), केवल (निम्न-आयामी) विचरण-सहसंयोजक मापदंडों के आधार पर एक रूपरेखा लॉग संभावना प्राप्त करने के लिए न्यूनतम वर्गों को उपयुक्त किया जाता है $$\boldsymbol{u}$$, अर्थात, इसका आव्यूह है $$\boldsymbol{G}$$, और फिर उस कम उद्देश्य फ़ंक्शन के लिए आधुनिक प्रत्यक्ष अनुकूलन R (प्रोग्रामिंग भाषा) के LME4 द्वारा प्रयुक्त) पैकेज lmer और जूलिया (प्रोग्रामिंग भाषा) पैकेज मिश्रित नमूने) और संभावना का प्रत्यक्ष अनुकूलन (उदाहरण के लिए R (प्रोग्रामिंग भाषा) के glmmTMB द्वारा उपयोग किया जाता है। विशेष रूप से, हेंडरसन द्वारा प्रस्तावित विहित रूप सिद्धांत मिश्रित नमूनों के लिए उपयोगी होता है, कई लोकप्रिय सॉफ्टवेयर पैकेज विरल आव्यूह विधियों (जैसे lme4 और मिश्रित नमूना.jl) का लाभ उठाने के लिए संख्यात्मक गणना के लिए एक अलग सूत्रीकरण का उपयोग करते है।

यह भी देखें

 * अरेखीय मिश्रित-प्रभाव नमूना
 * निश्चित प्रभाव नमूना
 * सामान्यीकृत रैखिक मिश्रित नमूना
 * रेखीय प्रतिगमन
 * विचरण का मिश्रित-डिज़ाइन विश्लेषण
 * बहुस्तरीय नमूना
 * यादृच्छिक प्रभाव नमूना
 * बार-बार उपाय डिजाइन
 * अनुभवजन्य बेयस विधि