सामान्य रैखिक मॉडल

सामान्य रैखिक मॉडल या सामान्य बहुभिन्नरूपी प्रतिगमन मॉडल एक साथ कई एकाधिक रैखिक प्रतिगमन मॉडल लिखने का सघन (कॉम्पैक्ट) तरीका है। इस अर्थ में यह एक अलग सांख्यिकीय रैखिक मॉडल नहीं है। विभिन्न एकाधिक रैखिक प्रतिगमन मॉडल को सघन रूप से इस प्रकार लिखा जा सकता है
 * $$\mathbf{Y} = \mathbf{X}\mathbf{B} + \mathbf{U},$$

जहां Y बहुभिन्नरूपी मापों की श्रृंखला के साथ एक आव्यूह (आव्यूह) (गणित) है (प्रत्येक कॉलम आश्रित चर में से एक पर माप का एक सेट है), X स्वतंत्र चर पर टिप्पणियों का आव्यूह है जो एक डिज़ाइन आव्यूह हो सकता है (प्रत्येक कॉलम एक सेट है) स्वतंत्र चरों में से एक पर अवलोकनों का), B एक आव्यूह है जिसमें पैरामीटर होते हैं जिनका सामान्यतः अनुमान लगाया जाता है और U एक आव्यूह है जिसमें आंकड़ों (रव) में त्रुटियां और अवशेष होते हैं। त्रुटियों को सामान्यतः मापों में असंबद्ध माना जाता है, और एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं। यदि त्रुटियाँ बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करती हैं, तो Y और U के बारे में धारणाओं को शिथिल करने के लिए सामान्यीकृत रैखिक मॉडल का उपयोग किया जा सकता है।

सामान्य रैखिक मॉडल में कई अलग-अलग सांख्यिकीय मॉडल: ANOVA, ANCOVA, MANOVA, MANCOVA, साधारण रैखिक प्रतिगमन, टी-टेस्ट और एफ-टेस्ट सम्मिलित होते हैं। सामान्य रैखिक मॉडल एक से अधिक आश्रित चर की स्थितियो में एकाधिक रैखिक प्रतिगमन का सामान्यीकरण है। यदि Y, B, और U स्तंभ सदिश थे, तो उपरोक्त आव्यूह समीकरण एकाधिक रैखिक प्रतिगमन का प्रतिनिधित्व करेगा।

सामान्य रैखिक मॉडल के साथ परिकल्पना परीक्षण दो तरीकों: बहुभिन्नरूपी आँकड़े या कई स्वतंत्र अविभाज्य परीक्षण से किए जा सकते हैं। बहुभिन्नरूपी परीक्षणों में Y के स्तंभों का एक साथ परीक्षण किया जाता है, जबकि एकविभिन्न परीक्षणों में Y के स्तंभों का स्वतंत्र रूप से परीक्षण किया जाता है अर्थात, एक ही डिज़ाइन आव्यूह के साथ कई अविभाज्य परीक्षणों के रूप में हैं।

एकाधिक रैखिक प्रतिगमन की तुलना
एकाधिक रैखिक प्रतिगमन एक से अधिक स्वतंत्र चर के स्थितियो में सरल रैखिक प्रतिगमन का एक सामान्यीकरण है, और सामान्य रैखिक मॉडल की एक विशेष स्थिति है, जो एक आश्रित चर तक सीमित है। एकाधिक रैखिक प्रतिगमन के लिए मूल मॉडल है


 * $$ Y_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \ldots + \beta_p X_{ip} + \epsilon_i$$ या अधिक सघन रूप से $$Y_i = \beta_0 + \sum \limits_{k=1}^{p} {\beta_k X_{ik}} + \epsilon_i$$

प्रत्येक अवलोकन के लिए i = 1, ..., n.

उपरोक्त सूत्र में हम एक आश्रित चर और p स्वतंत्र चर के n अवलोकनों पर विचार करते हैं। इस प्रकार, Yi आश्रित चर का अवलोकन है, Xij यह ith स्वतंत्र चर का अवलोकन है, j = 1, 2, ..., p मान βj अनुमानित किए जाने वाले पैरामीटर का प्रतिनिधित्व करें, εi और ith स्वतंत्र समान रूप से वितरित सामान्य त्रुटि है।

अधिक सामान्य बहुभिन्नरूपी रैखिक प्रतिगमन में, प्रत्येक m > 1 आश्रित चर के लिए उपरोक्त रूप का एक समीकरण होता है जो व्याख्यात्मक चर के समान सेट को साझा करता है और इसलिए एक दूसरे के साथ एक साथ अनुमान लगाया जाता है:


 * $$ Y_{ij} = \beta_{0j} + \beta_{1j} X_{i1} + \beta_{2j}X_{i2} + \ldots + \beta_{pj} X_{ip} + \epsilon_{ij}$$ या अधिक सघन रूप से $$Y_{ij} = \beta_{0j} + \sum \limits_{k=1}^{p} { \beta_{kj} X_{ik}} + \epsilon_{ij}$$

सभी अवलोकनों को i = 1, ..., n के रूप में अनुक्रमित किया गया है और सभी आश्रित चर को ''j = 1, ... ,'' m के रूप में अनुक्रमित किया गया है।

ध्यान दें, चूंकि प्रत्येक आश्रित चर के पास प्रतिगमन मापदंडों का अपना एक सेट है, एक कम्प्यूटेशनल दृष्टिकोण से सामान्य बहुवाद प्रतिगमन केवल एक ही व्याख्यात्मक चर का उपयोग करके मानक बहु रैखिक प्रतिगमन का एक अनुक्रम है।

सामान्यीकृत रैखिक मॉडल की तुलना
सामान्य रैखिक मॉडल और सामान्यीकृत रैखिक मॉडल (GLM) सांख्यिकी के दो सामान्य रूप से उपयोग किए जाने वाले परिवार हैं जो कुछ संख्या में निरंतर और/या श्रेणीबद्ध आश्रित और स्वतंत्र चर को आश्रित और स्वतंत्र चर से जोड़ते हैं।

दोनों दृष्टिकोणों के बीच मुख्य अंतर यह है कि सामान्य रैखिक मॉडल दृढता से मानता है कि त्रुटियां और अवशेष सशर्त संभाव्यता वितरण सामान्य वितरण का पालन करेंगे, जबकि GLM इस धारणा को शिथिल कर देता है और अवशिष्ट के लिए घातीय परिवार से कई अन्य वितरण (गणित) की अनुमति देता है। ध्यान दें, सामान्य रैखिक मॉडल GLM की एक विशेष स्थिति है जिसमें अवशिष्ट का वितरण सशर्त रूप से सामान्य वितरण का पालन करता है।

अवशिष्ट का वितरण काफी हद तक परिणाम चर के प्रकार और वितरण पर निर्भर करता है; विभिन्न प्रकार के परिणाम चर GLM परिवार के भीतर मॉडलों की विविधता को जन्म देते हैं। GLM परिवार में सामान्यतः उपयोग किए जाने वाले मॉडल में संभार तन्त्र परावर्तन द्विआधारी या द्विभाजित परिणामों के लिए, पॉइसन प्रतिगमन गणना परिणामों के लिए, और निरंतर, सामान्य रूप से वितरित परिणामों के लिए रैखिक प्रतिगमन सम्मिलित है। इसका अर्थ यह है कि GLM को सांख्यिकीय मॉडल के एक सामान्य परिवार के रूप में या विशिष्ट परिणाम प्रकारों के लिए विशिष्ट मॉडल के रूप में कहा जा सकता है।

अनुप्रयोग
सामान्य रैखिक मॉडल का एक अनुप्रयोग वैज्ञानिक प्रयोगों में कई ब्रेन स्कैन के विश्लेषण में दिखाई देता है जहां Y ब्रेन स्कैनर से आँकड़े सम्मिलित है, X में प्रयोगात्मक डिज़ाइन चर और कन्फाउन्ड सम्मिलित हैं। इसका परीक्षण सामान्यतः एकचर विधि से किया जाता है (सामान्यतः इस सेटिंग में इसे द्रव्यमान-एकचर कहा जाता है) और इसे प्राय: सांख्यिकीय पैरामीट्रिक मानचित्रण के रूप में जाना जाता है।

यह भी देखें
t- परीक्षण
 * बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन
 * एफ परीक्षण