सामान्य रैखिक मॉडल

सामान्य रैखिक मॉडल या सामान्य बहुभिन्नरूपी प्रतिगमन मॉडल एक साथ कई एकाधिक रैखिक प्रतिगमन मॉडल लिखने का सघन (कॉम्पैक्ट) तरीका है। इस अर्थ में यह एक अलग सांख्यिकीय रैखिक मॉडल नहीं है। विभिन्न एकाधिक रैखिक प्रतिगमन मॉडल को सघन रूप से इस प्रकार लिखा जा सकता है
 * $$\mathbf{Y} = \mathbf{X}\mathbf{B} + \mathbf{U},$$

जहां Y बहुभिन्नरूपी मापों की श्रृंखला के साथ एक मैट्रिक्स (गणित) है (प्रत्येक कॉलम आश्रित चर में से एक पर माप का एक सेट है), एक्स स्वतंत्र चर पर टिप्पणियों का एक मैट्रिक्स है जो एक डिज़ाइन मैट्रिक्स हो सकता है (प्रत्येक कॉलम एक सेट है) स्वतंत्र चरों में से एक पर अवलोकनों का), बी एक मैट्रिक्स है जिसमें पैरामीटर होते हैं जिनका सामान्यतः अनुमान लगाया जाता है और यू एक मैट्रिक्स है जिसमें आंकड़ों (शोर) में त्रुटियां और अवशेष होते हैं। त्रुटियों को सामान्यतः मापों में असंबद्ध माना जाता है, और एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं। यदि त्रुटियाँ बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करती हैं, तो Y और U के बारे में धारणाओं को शिथिल करने के लिए सामान्यीकृत रैखिक मॉडल का उपयोग किया जा सकता है।

सामान्य रैखिक मॉडल में कई अलग-अलग सांख्यिकीय मॉडल सम्मिलित होते हैं: एनोवा, एएनसीओवीए, परिवर्तन, मनकोवा, साधारण रैखिक प्रतिगमन, टी-टेस्ट|टी-टेस्ट और एफ-टेस्ट|एफ-टेस्ट। सामान्य रैखिक मॉडल एक से अधिक आश्रित चर के मामले में एकाधिक रैखिक प्रतिगमन का सामान्यीकरण है। यदि Y, B, और U स्तंभ सदिश थे, तो उपरोक्त मैट्रिक्स समीकरण एकाधिक रैखिक प्रतिगमन का प्रतिनिधित्व करेगा।

सामान्य रैखिक मॉडल के साथ परिकल्पना परीक्षण दो तरीकों से किए जा सकते हैं: बहुभिन्नरूपी आँकड़े या कई स्वतंत्र अविभाज्य परीक्षण। बहुभिन्नरूपी परीक्षणों में Y के स्तंभों का एक साथ परीक्षण किया जाता है, जबकि एकविभिन्न परीक्षणों में Y के स्तंभों का स्वतंत्र रूप से परीक्षण किया जाता है, अर्थात, एक ही डिज़ाइन मैट्रिक्स के साथ कई अविभाज्य परीक्षणों के रूप में।

एकाधिक रैखिक प्रतिगमन की तुलना
एकाधिक रैखिक प्रतिगमन एक से अधिक स्वतंत्र चर के मामले में सरल रैखिक प्रतिगमन का एक सामान्यीकरण है, और सामान्य रैखिक मॉडल का एक विशेष मामला है, जो एक आश्रित चर तक सीमित है। एकाधिक रैखिक प्रतिगमन के लिए मूल मॉडल है


 * $$ Y_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \ldots + \beta_p X_{ip} + \epsilon_i$$ या अधिक सघन रूप से $$Y_i = \beta_0 + \sum \limits_{k=1}^{p} {\beta_k X_{ik}} + \epsilon_i$$

प्रत्येक अवलोकन के लिए i = 1, ..., n.

उपरोक्त सूत्र में हम एक आश्रित चर और p स्वतंत्र चर के n अवलोकनों पर विचार करते हैं। इस प्रकार, वाईi मैं हैवेंनिर्भर चर का अवलोकन, एक्सij क्या मैंवेंजे का अवलोकनवेंस्वतंत्र चर, जे = 1, 2, ..., पी। मान βj अनुमानित किए जाने वाले मापदंडों का प्रतिनिधित्व करें, और εi मैं हैवें स्वतंत्र समान रूप से वितरित सामान्य त्रुटि।

अधिक सामान्य बहुभिन्नरूपी रैखिक प्रतिगमन में, प्रत्येक m > 1 आश्रित चर के लिए उपरोक्त रूप का एक समीकरण होता है जो व्याख्यात्मक चर के समान सेट को साझा करता है और इसलिए एक दूसरे के साथ एक साथ अनुमान लगाया जाता है:


 * $$ Y_{ij} = \beta_{0j} + \beta_{1j} X_{i1} + \beta_{2j}X_{i2} + \ldots + \beta_{pj} X_{ip} + \epsilon_{ij}$$ या अधिक सघन रूप से $$Y_{ij} = \beta_{0j} + \sum \limits_{k=1}^{p} { \beta_{kj} X_{ik}} + \epsilon_{ij}$$

सभी अवलोकनों को i = 1, ..., n के रूप में अनुक्रमित किया गया है और सभी आश्रित चर को j = 1, ..., m के रूप में अनुक्रमित किया गया है।

ध्यान दें, चूंकि प्रत्येक आश्रित चर में फिट किए जाने वाले प्रतिगमन मापदंडों का अपना सेट होता है, इसलिए कम्प्यूटेशनल दृष्टिकोण से सामान्य बहुभिन्नरूपी प्रतिगमन समान व्याख्यात्मक चर का उपयोग करके मानक एकाधिक रैखिक प्रतिगमन का एक अनुक्रम है।

सामान्यीकृत रैखिक मॉडल की तुलना
सामान्य रैखिक मॉडल और सामान्यीकृत रैखिक मॉडल|सामान्यीकृत रैखिक मॉडल (जीएलएम) सांख्यिकी के दो सामान्य रूप से उपयोग किए जाने वाले परिवार हैं जो कुछ संख्या में निरंतर और/या श्रेणीबद्ध आश्रित और स्वतंत्र चर को एक आश्रित और स्वतंत्र चर से जोड़ते हैं।

दोनों दृष्टिकोणों के बीच मुख्य अंतर यह है कि सामान्य रैखिक मॉडल सख्ती से मानता है कि त्रुटियां और अवशेष सशर्त संभाव्यता वितरण सामान्य वितरण का पालन करेंगे, जबकि जीएलएम इस धारणा को ढीला कर देता है और अवशेषों के लिए घातीय परिवार से कई अन्य वितरण (गणित) की अनुमति देता है। ध्यान दें, सामान्य रैखिक मॉडल जीएलएम का एक विशेष मामला है जिसमें अवशेषों का वितरण सशर्त रूप से सामान्य वितरण का पालन करता है।

अवशेषों का वितरण काफी हद तक परिणाम चर के प्रकार और वितरण पर निर्भर करता है; विभिन्न प्रकार के परिणाम चर जीएलएम परिवार के भीतर मॉडलों की विविधता को जन्म देते हैं। जीएलएम परिवार में सामान्यतः इस्तेमाल किए जाने वाले मॉडल में संभार तन्त्र परावर्तन  सम्मिलित है द्विआधारी या द्विभाजित परिणामों के लिए, पॉइसन प्रतिगमन गणना परिणामों के लिए, और निरंतर, सामान्य रूप से वितरित परिणामों के लिए रैखिक प्रतिगमन। इसका मतलब यह है कि जीएलएम को सांख्यिकीय मॉडल के एक सामान्य परिवार के रूप में या विशिष्ट परिणाम प्रकारों के लिए विशिष्ट मॉडल के रूप में कहा जा सकता है।

अनुप्रयोग
सामान्य रैखिक मॉडल का एक अनुप्रयोग वैज्ञानिक प्रयोगों में कई ब्रेन स्कैन के विश्लेषण में दिखाई देता है जहां Y ब्रेन स्कैनर से आँकड़े सम्मिलित है, X में प्रयोगात्मक डिज़ाइन चर और कन्फाउन्ड सम्मिलित हैं। इसका परीक्षण सामान्यतः एकचर विधि से किया जाता है (सामान्यतः इस सेटिंग में इसे द्रव्यमान-एकचर कहा जाता है) और इसे प्राय: सांख्यिकीय पैरामीट्रिक मानचित्रण के रूप में जाना जाता है।

यह भी देखें
t- परीक्षण
 * बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन
 * एफ परीक्षण