बहुभिन्नरूपी आँकड़े

बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम वेरिएट के एक साथ अवलोकन और विश्लेषण सम्मिलितहैं।

बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं।

इसके अतिरिक्त, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं
 * देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
 * सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।।

बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन, सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष स्थिति नहीं माने जाती हैं क्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है।

बहुभिन्नरूपी विश्लेषण
बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। सामान्यतः, एमवीए का उपयोग उन स्थितियों को संबोधित करने के लिए किया जाता है जहां प्रत्येक प्रायोगिक इकाई पर कई माप किए जाते हैं और इन मापों और उनकी संरचनाओं के बीच महत्वपूर्ण संबंध होते हैं। एमवीए के एक आधुनिक, अतिव्यापी वर्गीकरण में सम्मिलित हैं:
 * सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत
 * संबंधों का अध्ययन और माप
 * बहुआयामी क्षेत्रों की संभाव्यता संगणना
 * डेटा संरचनाओं और पैटर्न की खोज

एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। सरोगेट मॉडल, भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक मोंटे कार्लो सिमुलेशन भौतिकी-आधारित कोड के साथ जटिल है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है।

विश्लेषण के प्रकार
कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है:
 * 1) विवेरिएटण का बहुभिन्नरूपी विश्लेषण (मनोवा) उन स्थितियों को आच्छादन करने के लिए विवेरिएटण के विश्लेषण का विस्तार करता है जहां एक से अधिक आश्रित वेरिएट एक साथ विश्लेषण किए जाते हैं; सहप्रसरण (मैनकोवा) का बहुभिन्नरूपी विश्लेषण भी देखें।
 * 2) बहुभिन्नरूपी प्रतिगमन एक सूत्र को निर्धारित करने का प्रयास करता है जो वर्णन कर सकता है कि कैसे वेरिएट के सदिश में तत्व दूसरों में परिवर्तनों के साथ-साथ प्रतिक्रिया करते हैं। रैखिक संबंधों के लिए, यहाँ प्रतिगमन विश्लेषण सामान्य रैखिक मॉडल के रूपों पर आधारित हैं। कुछ प्रस्ताव देते हैं कि बहुभिन्नरूपी प्रतिगमन बहुभिन्नरूपी प्रतिगमन से अलग है, चूंकि, यह वाद विवाद का विषय है और वैज्ञानिक क्षेत्रों में लगातार सत्य नहीं है।
 * 3) प्रधान घटक विश्लेषण (पीसीए) लांबिक विश्लेषण वेरिएट का एक नया समुच्चय बनाता है जिसमें मूल समुच्चय के समान जानकारी होती है। यह लांबिक विश्लेषण अक्षों का एक नया समुच्चय देने के लिए भिन्नता के अक्षों को घूर्णन कराता है, ताकि वे भिन्नता के घटते अनुपात को संक्षेप में प्रस्तुत कर सके।
 * 4) कारक विश्लेषण पीसीए के समान है, लेकिन उपयोगकर्ता को मूल समुच्चय से कम संख्या में अवास्तविक वेरिएट निकालने की अनुमति देता है, शेष अस्पष्टीकृत भिन्नता को त्रुटि के रूप में छोड़ देता है। निकाले गए वेरिएट अव्यक्त वेरिएट या कारकों के रूप में जाने जाते हैं; देखे गए वेरिएटों के समूह में प्रत्येक को सहसंयोजन के लिए जिम्मेदार माना जा सकता है।
 * 5) कैनोनिकल सहसंबंध विश्लेषण वेरिएट के दो सेटों के बीच रैखिक संबंध पाता है; यह द्विभाजित सहसंबंध का सामान्यीकृत (अर्थात् कैनोनिकल) संस्करण है।
 * 6) अतिरेक विश्लेषण (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह प्रतिगमन विश्लेषण का एक बहुभिन्नरूपी अनुरूप है।
 * 7) पत्राचार विश्लेषण (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है।
 * 8) वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को मानता है।
 * 9) बहुआयामी स्केलिंग में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
 * 10) विभेदक विश्लेषण, या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
 * 11) रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो समुच्चयों से एक रेखीय भविष्यवक्ता की गणना करता है।
 * 12) क्लस्टर विश्लेषण वस्तुओं को समूहों (क्लस्टर कहा जाता है) में निर्धारित करता है ताकि एक ही क्लस्टर से वस्तु (स्थितियों) अलग-अलग क्लस्टर की वस्तुओं की तुलना में एक दूसरे के समान हों।
 * 13) पुनरावर्ती विभाजन एक निर्णय रेखा चित्र बनाता है जो एक द्विबीजपत्री आश्रित वेरिएट के आधार पर जनसंख्या के सदस्यों को सही संरचना से वर्गीकृत करने का प्रयास करता है।
 * 14) कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं।
 * 15) बहुभिन्नरूपी डेटा का पता लगाने के लिए सांख्यिकीय ग्राफिक्स जैसे पर्यटन, समानांतर निर्देशांक, स्कैटरप्लॉट मैट्रिसेस का उपयोग किया जा सकता है।
 * 16) एक साथ अनुमानित विभिन्न निर्भर चर के साथ समीकरण मॉडल एक से अधिक प्रतिगमन समीकरण सम्मिलित हैं।।
 * 17) वेक्टर ऑटोरिग्रेशन में विभिन्न समय श्रृंखला वेरिएट के एक साथ प्रतिगमन और एक दूसरे के पिछड़े मानों पर एक साथ प्रतिगमन सम्मिलित है।
 * 18) प्रधान प्रतिक्रिया वक्रो विश्लेषण (पीआरसी) आरडीए पर आधारित एक विधि है जो उपयोगकर्ता को समय के साथ नियंत्रण अनुकूलन में बदलाव के लिए सुधार करके समय के साथ उपचार के प्रभावों पर ध्यान केंद्रित करने की अनुमति देता है।
 * 19) सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना सम्मिलित है जहां "उल्लेखनीय" सहसंबंधों को एक ठोस रेखा (सकारात्मक सहसंबंध), या एक बिंदीदार रेखा (नकारात्मक सहसंबंध) द्वारा दर्शाया जाता है।

महत्वपूर्ण प्रायिकता वितरण
बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक समुच्चय होता है जो वितरणों के संगत समुच्चय के समान भूमिका निभाते हैं जो सामान्य वितरण डेटासमुच्चय के लिए उपयुक्त होने पर अविभाज्य विश्लेषण में उपयोग किए जाते हैं। ये बहुभिन्नरूपी वितरण हैं:
 * * बहुभिन्नरूपी सामान्य वितरण
 * * विशार्ट वितरण
 * बहुभिन्नरूपी स्टूडेंट-टी वितरण

बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन में महत्वपूर्ण है। इसके अतिरिक्त, हॉटेलिंग का टी-वर्ग वितरण एक बहुभिन्नरूपी वितरण है, जो स्टूडेंट के टी-वितरण का सामान्यीकरण करता है, जिसका उपयोग बहुभिन्नरूपी सांख्यिकीय परिकल्पना परीक्षण में किया जाता है।

इतिहास
एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय, ने सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक संभावना अनुपात परीक्षण और सांख्यिकीय शक्ति कार्यों के गुणों के माध्यम से परिकल्पना परीक्षण, स्वीकार्यता,  निष्पक्षता और एकरसता का पूर्वाग्रह पर जोर देती है।

एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च संगणनात्मक उपभोग के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। संगणनात्मक शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और ओमिक्स क्षेत्रों में इसका व्यापक अनुप्रयोग है।

अनुप्रयोग

 * बहुभिन्नरूपी परिकल्पना परीक्षण
 * आयामीता में कमी
 * अव्यक्त संरचना की खोज
 * क्लस्टर विश्लेषण
 * बहुभिन्नरूपी प्रतिगमन विश्लेषण
 * सांख्यिकीय वर्गीकरण
 * फीवेरिएट चयन
 * बहुआयामी विश्लेषण
 * बहुआयामी स्केलिंग
 * डेटा माइनिंग

सॉफ्टवेयर और उपकरण
बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलित हैं:
 * जेएमपी (सांख्यिकीय सॉफ्टवेयर)
 * मिनीटैब
 * ओपनऑफिस.ओआरजी कैल्क
 * पीएसपीपी
 * आर (प्रोग्रामिंग भाषा)
 * एसएएस (सॉफ्टवेयर)
 * पायथन के लिए SciPy (प्रोग्रामिंग भाषा)
 * एसपीएसएस
 * स्टाटा
 * सांख्यिकी
 * द अनस्क्रैम्बलर


 * वारपीएलएस
 * स्मार्टपीएलएस
 * मतलब
 * समीक्षा
 * एनसीएसएस (सांख्यिकीय सॉफ्टवेयर) में बहुभिन्नरूपी विश्लेषण सम्मिलित है।
 * अनस्क्रैम्बलर® X एक बहुभिन्नरूपी विश्लेषण उपकरण है।
 * सिम्का
 * डेटापंडित (लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस द्वारा मुफ्त SaaS एप्लिकेशन)

यह भी देखें

 * सहप्रसरण मैट्रिक्स का अनुमान
 * सांख्यिकी में महत्वपूर्ण प्रकाशनों की सूची#बहुभिन्नरूपी विश्लेषण
 * विपणन में बहुभिन्नरूपी परीक्षण
 * संरचित डेटा विश्लेषण (सांख्यिकी)
 * संरचनात्मक समीकरण मॉडलिंग
 * आरवी गुणांक
 * द्विभाजित विश्लेषण
 * प्रयोगों का डिज़ाइन (DoE)
 * आयामी विश्लेषण
 * अन्वेषणात्मक डेटा विश्लेषण
 * सामान्य कम चौकोर
 * आंशिक न्यूनतम वर्ग प्रतिगमन
 * पैटर्न मान्यता
 * प्रधान घटक विश्लेषण (पीसीए)
 * प्रतिगमन विश्लेषण
 * वर्ग उपमाओं का नरम स्वतंत्र मॉडलिंग (SIMCA)
 * सांख्यिकीय हस्तक्षेप
 * वस्तु के एक प्रकार विश्लेषण

अग्रिम पठन

 * A. Sen, M. Srivastava, Regression Analysis &mdash; Theory, Methods, and Applications, Springer-Verlag, Berlin, 2011 (4th printing).
 * Malakooti, B. (2013). Operations and Production Systems with Multiple Objectives. John Wiley & Sons.
 * T. W. Anderson, An Introduction to Multivariate Statistical Analysis, Wiley, New York, 1958.
 * (M.A. level "likelihood" approach)
 * Feinstein, A. R. (1996) Multivariable Analysis. New Haven, CT: Yale University Press.
 * Hair, J. F. Jr. (1995) Multivariate Data Analysis with Readings, 4th ed. Prentice-Hall.
 * Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
 * Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
 * Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
 * "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.
 * Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
 * Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
 * Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
 * "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.

बाहरी संबंध

 * Statnotes: Topics in Multivariate Analysis, by G. David Garson
 * Mike Palmer: The Ordination Web Page
 * InsightsNow: Makers of ReportsNow, ProfilesNow, and KnowledgeNow