बहुभिन्नरूपी आँकड़े

बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम चर के एक साथ अवलोकन और विश्लेषण शामिल हैं। बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में चर के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी प्रासंगिकता को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण शामिल हो सकते हैं।

इसके अलावा, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी संभाव्यता वितरण से संबंधित हैं
 * देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
 * * उन्हें सांख्यिकीय अनुमान के हिस्से के रूप में कैसे उपयोग किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचि रखती हैं।

बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन,  नहीं  को आमतौर पर बहुभिन्नरूपी आँकड़ों के विशेष मामलों के रूप में माना जाता है क्योंकि विश्लेषण को एकल परिणाम के (अविभाजित) सशर्त वितरण पर विचार करके निपटाया जाता है। चर अन्य चर दिए गए हैं।

बहुभिन्नरूपी विश्लेषण
बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। आमतौर पर, एमवीए का उपयोग उन स्थितियों को संबोधित करने के लिए किया जाता है जहां प्रत्येक प्रायोगिक इकाई पर कई माप किए जाते हैं और इन मापों और उनकी संरचनाओं के बीच संबंध महत्वपूर्ण होते हैं। एमवीए के एक आधुनिक, अतिव्यापी वर्गीकरण में शामिल हैं:
 * सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत
 * संबंधों का अध्ययन और माप
 * बहुआयामी क्षेत्रों की संभाव्यता संगणना
 * डेटा संरचनाओं और पैटर्न की खोज

एक पदानुक्रमित सिस्टम-ऑफ-सिस्टम के लिए चर के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को शामिल करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अक्सर समस्या की विमा के कारण रुक जाते हैं। सरोगेट मॉडल, भौतिकी-आधारित कोड के अत्यधिक सटीक अनुमानों के उपयोग के माध्यम से इन चिंताओं को अक्सर कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक मोंटे कार्लो सिमुलेशन भौतिकी-आधारित कोड के साथ कठिन है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अक्सर प्रतिक्रिया सतह पद्धति का रूप ले लेता है। प्रतिक्रिया-सतह समीकरण.

विश्लेषण के प्रकार
कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है:
 * 1) विचरण का बहुभिन्नरूपी विश्लेषण (MANOVA) उन मामलों को कवर करने के लिए विचरण के विश्लेषण का विस्तार करता है जहां एक से अधिक आश्रित चर एक साथ विश्लेषण किए जाते हैं; सहप्रसरण (मैनकोवा) का बहुभिन्नरूपी विश्लेषण भी देखें।
 * 2) Multivariate प्रतिगमन एक सूत्र को निर्धारित करने का प्रयास करता है जो वर्णन कर सकता है कि कैसे चर के वेक्टर में तत्व दूसरों में परिवर्तनों के साथ-साथ प्रतिक्रिया करते हैं। रैखिक संबंधों के लिए, यहाँ प्रतिगमन विश्लेषण सामान्य रैखिक मॉडल के रूपों पर आधारित हैं। कुछ सुझाव देते हैं कि बहुभिन्नरूपी प्रतिगमन बहुभिन्नरूपी प्रतिगमन से अलग है, हालांकि, यह बहस का विषय है और वैज्ञानिक क्षेत्रों में लगातार सही नहीं है।
 * 3) प्रधान घटक विश्लेषण (पीसीए) ऑर्थोगोनल चर का एक नया सेट बनाता है जिसमें मूल सेट के समान जानकारी होती है। यह ऑर्थोगोनल अक्षों का एक नया सेट देने के लिए भिन्नता के अक्षों को घुमाता है, ताकि वे भिन्नता के घटते अनुपात को सारांशित कर सकें।
 * 4) कारक विश्लेषण पीसीए के समान है, लेकिन उपयोगकर्ता को मूल सेट से कम संख्या में सिंथेटिक चर निकालने की अनुमति देता है, शेष अस्पष्टीकृत भिन्नता को त्रुटि के रूप में छोड़ देता है। निकाले गए चर अव्यक्त चर या कारकों के रूप में जाने जाते हैं; देखे गए चरों के समूह में प्रत्येक को सहसंयोजन के लिए जिम्मेदार माना जा सकता है।
 * 5) कैनोनिकल सहसंबंध विश्लेषण चर के दो सेटों के बीच रैखिक संबंध पाता है; यह द्विभाजित का सामान्यीकृत (यानी विहित) संस्करण है सह - संबंध।
 * 6) अतिरेक विश्लेषण (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) चर के एक सेट से निर्दिष्ट संख्या में सिंथेटिक चर प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) सेट में जितना संभव हो उतना विचरण की व्याख्या करता है। यह प्रतिगमन विश्लेषण का एक बहुभिन्नरूपी एनालॉग है।
 * 7) पत्राचार विश्लेषण (सीए), या पारस्परिक औसत, मूल सेट को सारांशित करने वाले सिंथेटिक चर का एक सेट (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (मामलों) के बीच ची-स्क्वायर असमानताओं को मानता है।
 * 8) विहित पत्राचार विश्लेषण | चर के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को सारांशित करने के लिए विहित (या विवश) पत्राचार विश्लेषण (CCA); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (मामलों) के बीच ची-स्क्वायर असमानताओं को मानता है।
 * 9) बहुआयामी स्केलिंग में सिंथेटिक चर का एक सेट निर्धारित करने के लिए विभिन्न एल्गोरिदम शामिल हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
 * 10) विभेदक कार्य, या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या चर के एक सेट का उपयोग मामलों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
 * 11) रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो सेटों से एक रेखीय भविष्यवक्ता की गणना करता है।
 * 12) क्लस्टर विश्लेषण वस्तुओं को समूहों (क्लस्टर कहा जाता है) में असाइन करता है ताकि एक ही क्लस्टर से ऑब्जेक्ट (मामले) अलग-अलग क्लस्टर की वस्तुओं की तुलना में एक दूसरे के समान हों।
 * 13) पुनरावर्ती विभाजन एक निर्णय वृक्ष बनाता है जो एक द्विबीजपत्री आश्रित चर के आधार पर जनसंख्या के सदस्यों को सही ढंग से वर्गीकृत करने का प्रयास करता है।
 * 14) कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं।
 * 15) बहुभिन्नरूपी डेटा का पता लगाने के लिए पर्यटन, समानांतर निर्देशांक, स्कैटरप्लॉट मैट्रिसेस जैसे सांख्यिकीय ग्राफिक्स का उपयोग किया जा सकता है।
 * 16) एक साथ समीकरण मॉडल में एक से अधिक प्रतिगमन समीकरण शामिल होते हैं, विभिन्न आश्रित चर के साथ, एक साथ अनुमानित।
 * 17) वेक्टर ऑटोरिग्रेशन में विभिन्न समय श्रृंखला चर के एक साथ प्रतिगमन और एक दूसरे के पिछड़े मूल्यों पर एक साथ प्रतिगमन शामिल है।
 * 18) प्रधान प्रतिक्रिया वक्र्स एनालिसिस (पीआरसी) आरडीए पर आधारित एक तरीका है जो उपयोगकर्ता को समय के साथ नियंत्रण उपचार में बदलाव के लिए सुधार करके समय के साथ उपचार के प्रभावों पर ध्यान केंद्रित करने की अनुमति देता है।
 * 19) सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना शामिल है जहां "उल्लेखनीय" सहसंबंधों को एक ठोस रेखा (सकारात्मक सहसंबंध), या एक बिंदीदार रेखा (नकारात्मक सहसंबंध) द्वारा दर्शाया जाता है।

महत्वपूर्ण संभाव्यता वितरण
बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक सेट होता है जो वितरणों के संगत सेट के समान भूमिका निभाते हैं जो सामान्य वितरण डेटासेट के लिए उपयुक्त होने पर अविभाज्य विश्लेषण में उपयोग किए जाते हैं। ये बहुभिन्नरूपी वितरण हैं:
 * * बहुभिन्नरूपी सामान्य वितरण
 * * विशार्ट वितरण
 * बहुभिन्नरूपी छात्र वितरण|मल्टीवेरिएट स्टूडेंट-टी डिस्ट्रीब्यूशन।

बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन में। इसके अतिरिक्त, हॉटेलिंग का टी-स्क्वेर्ड वितरण एक बहुभिन्नरूपी वितरण है, जो छात्र के टी-वितरण का सामान्यीकरण करता है, जिसका उपयोग बहुभिन्नरूपी सांख्यिकीय परिकल्पना परीक्षण में किया जाता है।

इतिहास
एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय, सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक संभावना अनुपात परीक्षण और सांख्यिकीय शक्तियों के गुणों के माध्यम से परिकल्पना परीक्षण पर जोर देती है: स्वीकार्य निर्णय नियम, एक अनुमानक और एकरसता का पूर्वाग्रह। एमवीए एक बार केवल आकार, अंतर्निहित डेटा सेट की जटिलता और उच्च कम्प्यूटेशनल खपत के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। कम्प्यूटेशनल शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और ओमिक्स क्षेत्रों में इसका व्यापक अनुप्रयोग है।

अनुप्रयोग

 * बहुभिन्नरूपी परिकल्पना परीक्षण
 * आयामीता में कमी
 * अव्यक्त संरचना की खोज
 * क्लस्टर विश्लेषण
 * बहुभिन्नरूपी प्रतिगमन विश्लेषण
 * सांख्यिकीय वर्गीकरण
 * फीचर चयन
 * बहुआयामी विश्लेषण
 * बहुआयामी स्केलिंग
 * डेटा माइनिंग

सॉफ्टवेयर और उपकरण
बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें शामिल हैं: द अनस्क्रैम्बलर
 * जेएमपी (सांख्यिकीय सॉफ्टवेयर)
 * मिनीटैब
 * OpenOffice.org कैल्क
 * पीएसपीपी
 * आर (प्रोग्रामिंग भाषा)
 * एसएएस (सॉफ्टवेयर)
 * पायथन के लिए SciPy (प्रोग्रामिंग भाषा)
 * एसपीएसएस
 * था
 * सांख्यिकी
 * वारपीएलएस
 * स्मार्टपीएलएस
 * मतलब
 * समीक्षा
 * एनसीएसएस (सांख्यिकीय सॉफ्टवेयर) में बहुभिन्नरूपी विश्लेषण शामिल है।
 * Unscrambler® X एक बहुभिन्नरूपी विश्लेषण उपकरण है।
 * SIMCA
 * डेटापंडित (लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस द्वारा मुफ्त SaaS एप्लिकेशन)

यह भी देखें

 * सहप्रसरण मैट्रिक्स का अनुमान
 * सांख्यिकी में महत्वपूर्ण प्रकाशनों की सूची#बहुभिन्नरूपी विश्लेषण
 * विपणन में बहुभिन्नरूपी परीक्षण
 * संरचित डेटा विश्लेषण (सांख्यिकी)
 * संरचनात्मक समीकरण मॉडलिंग
 * आरवी गुणांक
 * द्विभाजित विश्लेषण
 * प्रयोगों का डिज़ाइन (DoE)
 * आयामी विश्लेषण
 * अन्वेषणात्मक डेटा विश्लेषण
 * सामान्य कम चौकोर
 * आंशिक न्यूनतम वर्ग प्रतिगमन
 * पैटर्न मान्यता
 * प्रधान घटक विश्लेषण (पीसीए)
 * प्रतिगमन विश्लेषण
 * वर्ग उपमाओं का नरम स्वतंत्र मॉडलिंग (SIMCA)
 * सांख्यिकीय हस्तक्षेप
 * वस्तु के एक प्रकार विश्लेषण

अग्रिम पठन

 * A. Sen, M. Srivastava, Regression Analysis &mdash; Theory, Methods, and Applications, Springer-Verlag, Berlin, 2011 (4th printing).
 * Malakooti, B. (2013). Operations and Production Systems with Multiple Objectives. John Wiley & Sons.
 * T. W. Anderson, An Introduction to Multivariate Statistical Analysis, Wiley, New York, 1958.
 * (M.A. level "likelihood" approach)
 * Feinstein, A. R. (1996) Multivariable Analysis. New Haven, CT: Yale University Press.
 * Hair, J. F. Jr. (1995) Multivariate Data Analysis with Readings, 4th ed. Prentice-Hall.
 * Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
 * Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
 * Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
 * "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.
 * Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
 * Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
 * Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
 * "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.

इस पेज में लापता आंतरिक लिंक की सूची

 * आंकड़े
 * सांख्यिकीय निष्कर्ष
 * परिणामी चर
 * प्रायिकता वितरण
 * प्रतिक्रिया सतह कार्यप्रणाली
 * भिन्नता का विश्लेषण
 * सहप्रसरण का बहुभिन्नरूपी विश्लेषण
 * कैननिकल सहसंबंध विश्लेषण
 * प्रमुख घटक विश्लेषण
 * कृत्रिम तंत्रिका प्रसार
 * प्रमुख निर्देशांक विश्लेषण
 * समकालिक समीकरण मॉडल
 * रैखिक विभेदक विश्लेषण
 * सहसंबंधों की आइकनोग्राफी
 * वस्तु के एक प्रकार विश्लेषण
 * उलटा-विशार्ट वितरण
 * बायेसियन निष्कर्ष
 * दिष्टता
 * एक अनुमानक का पूर्वाग्रह
 * आंकड़े
 * WarpLS
 * पायथन (प्रोग्रामिंग भाषा)
 * सहप्रसरण मैट्रिसेस का अनुमान
 * प्रमुख कंपोनेंट विश्लेषण
 * प्रयोगों की रूप रेखा

बाहरी संबंध

 * Statnotes: Topics in Multivariate Analysis, by G. David Garson
 * Mike Palmer: The Ordination Web Page
 * InsightsNow: Makers of ReportsNow, ProfilesNow, and KnowledgeNow