बहुभिन्नरूपी आँकड़े: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(6 intermediate revisions by 4 users not shown)
Line 5: Line 5:
बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं।
बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं।


इसके अलावा, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं
इसके अतिरिक्त, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं
:*देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
:*देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
:*सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।।
:*सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।।


बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए [[सरल रेखीय प्रतिगमन]] और [[एकाधिक प्रतिगमन]], सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष मामले नहीं माने जाते हैंक्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है।
बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए [[सरल रेखीय प्रतिगमन]] और [[एकाधिक प्रतिगमन]], सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष स्थिति नहीं माने जाती हैं क्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है।


== बहुभिन्नरूपी विश्लेषण ==
== बहुभिन्नरूपी विश्लेषण ==
Line 18: Line 18:
* डेटा संरचनाओं और पैटर्न की खोज
* डेटा संरचनाओं और पैटर्न की खोज


एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। [[सरोगेट मॉडल]], भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक [[मोंटे कार्लो सिमुलेशन]] भौतिकी-आधारित कोड के साथ कठिन है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है।
एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। [[सरोगेट मॉडल]], भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक [[मोंटे कार्लो सिमुलेशन]] भौतिकी-आधारित कोड के साथ जटिल है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है।


=== विश्लेषण के प्रकार ===
=== विश्लेषण के प्रकार ===
Line 30: Line 30:
# [[अतिरेक विश्लेषण]] (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह [[प्रतिगमन विश्लेषण]] का एक बहुभिन्नरूपी अनुरूप है।
# [[अतिरेक विश्लेषण]] (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह [[प्रतिगमन विश्लेषण]] का एक बहुभिन्नरूपी अनुरूप है।
# [[पत्राचार विश्लेषण]] (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है।
# [[पत्राचार विश्लेषण]] (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है।
# वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (मामलों) के बीच सीएचआई-वर्ग असमानताओं को मानता है।
# वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को मानता है।
# [[बहुआयामी स्केलिंग]] में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
# [[बहुआयामी स्केलिंग]] में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
# [[विभेदक कार्य|विभेदक विश्लेषण]], या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
# [[विभेदक कार्य|विभेदक विश्लेषण]], या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
Line 51: Line 51:


== इतिहास ==
== इतिहास ==
एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,<ref>[[Theodore Wilbur Anderson|T.W. Anderson]] (1958) '' An Introduction to Multivariate Analysis'', New York: Wiley {{ISBN|0471026409}}; 2e (1984) {{ISBN|0471889873}}; 3e (2003) {{ISBN|0471360910}}</ref> सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक [[संभावना अनुपात परीक्षण]] और [[सांख्यिकीय शक्ति]]यों के गुणों के माध्यम से [[परिकल्पना परीक्षण]] पर जोर देती है: [[स्वीकार्य निर्णय नियम]], एक अनुमानक और एकरसता का पूर्वाग्रह।<ref>{{cite journal|doi =10.2307/2289251|title =समीक्षा: बहुभिन्नरूपी सांख्यिकीय विश्लेषण पर समकालीन पाठ्यपुस्तकें: एक मनोरम मूल्यांकन और समालोचना|first9 =K. V.|last10 =Kent|first10 =J. T.|last11 =Bibby|first11 =J. M.|last12 =Morrison|first12 =D. F.|last13 =Muirhead|first13 =R. J.|last14 =Press|first14 =S. J.|last15 =Rao|first15 =C. R.|last16 =Roy|first16 =S. N.|last17 =Gnanadesikan|first17 =R.|last18 =Srivastava|first18 =J. N.|last19 =Seber|first19 =G. A. F.|last20 =Srivastava|first20 =M. S.|last21 =Khatri|first21 =C. G.|last22 =Takeuchi|first22 =K.|last23 =Yanai|first23 =H.|last24 =Mukherjee|first24 =B. N.|last9 =Mardia|first8 =A. M.|last8 =Kshirsagar|first7 =M. G.|last7 =Kendall|first6 =R.|last6 =Gnanadesikan|first5 =N. C.|last5 =Giri|first4 =M. L.|last4 =Eaton|first3 =S. F.|last3 =Arnold|first2 =T. W.|last2 =Anderson|last1=Sen|first1=Pranab Kumar|author1-link=Pranab K. Sen|journal=[[Journal of the American Statistical Association]]| volume=81 | issue=394 |date=June 1986|pages=560–564| jstor=2289251 | issn=0162-1459 |display-authors =8}}(Pages 560–561)</ref><ref>{{cite journal|doi =10.1214/ss/1177013111|title =बहुभिन्नरूपी विश्लेषण की समीक्षा|last=Schervish|first=Mark J.| journal=Statistical Science| volume=2|issue=4|date=November 1987|pages=396–413|jstor=2245530|issn =0883-4237|doi-access=free}}
एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,<ref>[[Theodore Wilbur Anderson|T.W. Anderson]] (1958) '' An Introduction to Multivariate Analysis'', New York: Wiley {{ISBN|0471026409}}; 2e (1984) {{ISBN|0471889873}}; 3e (2003) {{ISBN|0471360910}}</ref> ने सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक [[संभावना अनुपात परीक्षण]] और [[सांख्यिकीय शक्ति]] कार्यों के गुणों के माध्यम से [[परिकल्पना परीक्षण]][[स्वीकार्य निर्णय नियम|स्वीकार्यता]], निष्पक्षता और एकरसता का पूर्वाग्रह पर जोर देती है।<ref>{{cite journal|doi =10.2307/2289251|title =समीक्षा: बहुभिन्नरूपी सांख्यिकीय विश्लेषण पर समकालीन पाठ्यपुस्तकें: एक मनोरम मूल्यांकन और समालोचना|first9 =K. V.|last10 =Kent|first10 =J. T.|last11 =Bibby|first11 =J. M.|last12 =Morrison|first12 =D. F.|last13 =Muirhead|first13 =R. J.|last14 =Press|first14 =S. J.|last15 =Rao|first15 =C. R.|last16 =Roy|first16 =S. N.|last17 =Gnanadesikan|first17 =R.|last18 =Srivastava|first18 =J. N.|last19 =Seber|first19 =G. A. F.|last20 =Srivastava|first20 =M. S.|last21 =Khatri|first21 =C. G.|last22 =Takeuchi|first22 =K.|last23 =Yanai|first23 =H.|last24 =Mukherjee|first24 =B. N.|last9 =Mardia|first8 =A. M.|last8 =Kshirsagar|first7 =M. G.|last7 =Kendall|first6 =R.|last6 =Gnanadesikan|first5 =N. C.|last5 =Giri|first4 =M. L.|last4 =Eaton|first3 =S. F.|last3 =Arnold|first2 =T. W.|last2 =Anderson|last1=Sen|first1=Pranab Kumar|author1-link=Pranab K. Sen|journal=[[Journal of the American Statistical Association]]| volume=81 | issue=394 |date=June 1986|pages=560–564| jstor=2289251 | issn=0162-1459 |display-authors =8}}(Pages 560–561)</ref><ref>{{cite journal|doi =10.1214/ss/1177013111|title =बहुभिन्नरूपी विश्लेषण की समीक्षा|last=Schervish|first=Mark J.| journal=Statistical Science| volume=2|issue=4|date=November 1987|pages=396–413|jstor=2245530|issn =0883-4237|doi-access=free}}
</ref>
</ref>
एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च कम्प्यूटेशनल खपत के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। कम्प्यूटेशनल शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और [[ओमिक्स]] क्षेत्रों में इसका व्यापक अनुप्रयोग है।
 
एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च संगणनात्मक उपभोग के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। संगणनात्मक शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और [[ओमिक्स]] क्षेत्रों में इसका व्यापक अनुप्रयोग है।


== अनुप्रयोग ==
== अनुप्रयोग ==
Line 68: Line 69:


== सॉफ्टवेयर और उपकरण ==
== सॉफ्टवेयर और उपकरण ==
बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलितहैं:
बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलित हैं:
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]]
* [[जेएमपी (सांख्यिकीय सॉफ्टवेयर)]]
* [[मिनीटैब]]
* [[मिनीटैब]]
* OpenOffice.org कैल्क
* ओपनऑफिस.ओआरजी कैल्क
* [[पीएसपीपी]]
* [[पीएसपीपी]]
* [[आर (प्रोग्रामिंग भाषा)]]<ref>[https://cran.r-project.org/web/views/Multivariate.html CRAN] has details on the packages available for multivariate data analysis</ref>
* [[आर (प्रोग्रामिंग भाषा)]]<ref>[https://cran.r-project.org/web/views/Multivariate.html CRAN] has details on the packages available for multivariate data analysis</ref>
Line 77: Line 78:
* पायथन के लिए [[SciPy]] (प्रोग्रामिंग भाषा)
* पायथन के लिए [[SciPy]] (प्रोग्रामिंग भाषा)
* [[एसपीएसएस]]
* [[एसपीएसएस]]
* [[था]]
* [[था|स्टाटा]]
* सांख्यिकी
* सांख्यिकी
[[द अनस्क्रैम्बलर]]
*[[द अनस्क्रैम्बलर]]
 
* वारपीएलएस
* वारपीएलएस
* [[स्मार्टपीएलएस]]
* [[स्मार्टपीएलएस]]
* [[मतलब]]
* [[मतलब]]
* [[समीक्षा]]
* [[समीक्षा]]
*[[एनसीएसएस (सांख्यिकीय सॉफ्टवेयर)]] में बहुभिन्नरूपी विश्लेषण सम्मिलितहै।
*[[एनसीएसएस (सांख्यिकीय सॉफ्टवेयर)]] में बहुभिन्नरूपी विश्लेषण सम्मिलित है।
*[http://www.camo.com/rt/Products/Unscrambler/unscrambler.html Unscrambler® X] एक बहुभिन्नरूपी विश्लेषण उपकरण है।
*[http://www.camo.com/rt/Products/Unscrambler/unscrambler.html अनस्क्रैम्बलर® X] एक बहुभिन्नरूपी विश्लेषण उपकरण है।
*[https://umetrics.com/products/simca SIMCA]
*[https://umetrics.com/products/simca सिम्का]
*डेटापंडित ([http://letsexcel.in लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस] द्वारा मुफ्त SaaS एप्लिकेशन)
*डेटापंडित ([http://letsexcel.in लेट्स एक्सेल एनालिटिक्स सॉल्यूशंस] द्वारा मुफ्त SaaS एप्लिकेशन)


Line 132: Line 134:




==इस पेज में लापता आंतरिक लिंक की सूची==


*आंकड़े
 
*सांख्यिकीय निष्कर्ष
 
*परिणामी वेरिएट
 
*प्रायिकता वितरण
 
*प्रतिक्रिया सतह कार्यप्रणाली
 
*भिन्नता का विश्लेषण
 
*सहप्रसरण का बहुभिन्नरूपी विश्लेषण
 
*कैननिकल सहसंबंध विश्लेषण
 
*प्रमुख घटक विश्लेषण
 
*कृत्रिम तंत्रिका प्रसार
 
*प्रमुख निर्देशांक विश्लेषण
 
*समकालिक समीकरण मॉडल
 
*रैखिक विभेदक विश्लेषण
*सहसंबंधों की आइकनोग्राफी
*वस्तु के एक प्रकार विश्लेषण
*उलटा-विशार्ट वितरण
*बायेसियन निष्कर्ष
*दिष्टता
*एक अनुमानक का पूर्वाग्रह
*आंकड़े
*WarpLS
*पायथन (प्रोग्रामिंग भाषा)
*सहप्रसरण मैट्रिसेस का अनुमान
*प्रमुख कंपोनेंट विश्लेषण
*प्रयोगों की रूप रेखा
==बाहरी संबंध==
==बाहरी संबंध==
{{Commons category}}
{{Commons category}}
Line 169: Line 157:


{{Authority control}}
{{Authority control}}
[[Category:बहुभिन्नरूपी आंकड़े| ]]


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category:Articles with short description]]
[[Category:Collapse templates]]
[[Category:Commons category link is the pagename]]
[[Category:Created On 05/12/2022]]
[[Category:Created On 05/12/2022]]
[[Category:Exclude in print]]
[[Category:Interwiki category linking templates]]
[[Category:Interwiki link templates]]
[[Category:Machine Translated Page]]
[[Category:Missing redirects]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with empty portal template]]
[[Category:Pages with script errors]]
[[Category:Portal-inline template with redlinked portals]]
[[Category:Portal templates with redlinked portals]]
[[Category:Short description with empty Wikidata description]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates generating microformats]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates using TemplateData]]
[[Category:Wikimedia Commons templates]]
[[Category:Wikipedia metatemplates]]
[[Category:बहुभिन्नरूपी आंकड़े| ]]

Latest revision as of 18:06, 3 January 2023

बहुभिन्नरूपी आँकड़े आँकड़ों का एक उपखंड है जिसमें एक से अधिक परिणाम वेरिएट के एक साथ अवलोकन और विश्लेषण सम्मिलितहैं।

बहुभिन्नरूपी आँकड़े बहुभिन्नरूपी विश्लेषण के विभिन्न रूपों में से प्रत्येक के विभिन्न उद्देश्यों और पृष्ठभूमि को समझने से संबंधित हैं, और वे एक दूसरे से कैसे संबंधित हैं। किसी विशेष समस्या के लिए बहुभिन्नरूपी आँकड़ों के व्यावहारिक अनुप्रयोग में वेरिएट के बीच संबंधों और अध्ययन की जा रही समस्या के लिए उनकी संबद्ध को समझने के लिए कई प्रकार के अविभाज्य और बहुभिन्नरूपी विश्लेषण सम्मिलितहो सकते हैं।

इसके अतिरिक्त, बहुभिन्नरूपी आँकड़े दोनों के संदर्भ में बहुभिन्नरूपी प्रायिकता वितरण से संबंधित हैं

  • देखे गए डेटा के वितरण का प्रतिनिधित्व करने के लिए इनका उपयोग कैसे किया जा सकता है;
  • सांख्यिकीय अनुमान के हिस्से के रूप में उनका उपयोग कैसे किया जा सकता है, विशेष रूप से जहां एक ही विश्लेषण के लिए कई अलग-अलग मात्राएं रुचिकर हों।।

बहुभिन्नरूपी डेटा से जुड़ी कुछ प्रकार की समस्याएं, उदाहरण के लिए सरल रेखीय प्रतिगमन और एकाधिक प्रतिगमन, सामान्यतः बहुभिन्नरूपी आँकड़ों के विशेष स्थिति नहीं माने जाती हैं क्योंकि विश्लेषण अन्य वेरिएटों को दिए गए एकल परिणाम वेरिएट के (अविभाजित) सशर्त वितरण पर विचार करके किया जाता है।

बहुभिन्नरूपी विश्लेषण

बहुभिन्नरूपी विश्लेषण (एमवीए) बहुभिन्नरूपी सांख्यिकी के सिद्धांतों पर आधारित है। सामान्यतः, एमवीए का उपयोग उन स्थितियों को संबोधित करने के लिए किया जाता है जहां प्रत्येक प्रायोगिक इकाई पर कई माप किए जाते हैं और इन मापों और उनकी संरचनाओं के बीच महत्वपूर्ण संबंध होते हैं।[1] एमवीए के एक आधुनिक, अतिव्यापी वर्गीकरण में सम्मिलित हैं:[1]

  • सामान्य और सामान्य बहुभिन्नरूपी मॉडल और वितरण सिद्धांत
  • संबंधों का अध्ययन और माप
  • बहुआयामी क्षेत्रों की संभाव्यता संगणना
  • डेटा संरचनाओं और पैटर्न की खोज

एक पदानुक्रमित पद्धति-का-पद्धति के लिए वेरिएट के प्रभावों की गणना करने के लिए भौतिकी-आधारित विश्लेषण को सम्मिलित करने की इच्छा से बहुभिन्नरूपी विश्लेषण जटिल हो सकता है। बहुभिन्नरूपी विश्लेषण का उपयोग करने की इच्छा रखने वाले अध्ययन अधिकांश समस्या की विमा के कारण रुक जाते हैं। सरोगेट मॉडल, भौतिकी-आधारित कोड के अत्यधिक यथार्थ अनुमानों के उपयोग के माध्यम से इन चिंताओं को अधिकांश कम किया जाता है। चूंकि सरोगेट मॉडल एक समीकरण का रूप लेते हैं, इसलिए उनका मूल्यांकन बहुत जल्दी किया जा सकता है। यह बड़े पैमाने पर एमवीए अध्ययनों के लिए एक संबल बन जाता है: जबकि डिज़ाइन स्पेस में एक मोंटे कार्लो सिमुलेशन भौतिकी-आधारित कोड के साथ जटिल है, सरोगेट मॉडल का मूल्यांकन करते समय यह तुच्छ हो जाता है, जो अधिकांश प्रतिक्रिया-सतह समीकरणों का रूप ले लेता है।

विश्लेषण के प्रकार

कई अलग-अलग मॉडल हैं, जिनमें से प्रत्येक का अपना विश्लेषण प्रकार है:

  1. विवेरिएटण का बहुभिन्नरूपी विश्लेषण (मनोवा) उन स्थितियों को आच्छादन करने के लिए विवेरिएटण के विश्लेषण का विस्तार करता है जहां एक से अधिक आश्रित वेरिएट एक साथ विश्लेषण किए जाते हैं; सहप्रसरण (मैनकोवा) का बहुभिन्नरूपी विश्लेषण भी देखें।
  2. बहुभिन्नरूपी प्रतिगमन एक सूत्र को निर्धारित करने का प्रयास करता है जो वर्णन कर सकता है कि कैसे वेरिएट के सदिश में तत्व दूसरों में परिवर्तनों के साथ-साथ प्रतिक्रिया करते हैं। रैखिक संबंधों के लिए, यहाँ प्रतिगमन विश्लेषण सामान्य रैखिक मॉडल के रूपों पर आधारित हैं। कुछ प्रस्ताव देते हैं कि बहुभिन्नरूपी प्रतिगमन बहुभिन्नरूपी प्रतिगमन से अलग है, चूंकि, यह वाद विवाद का विषय है और वैज्ञानिक क्षेत्रों में लगातार सत्य नहीं है।[2]
  3. प्रधान घटक विश्लेषण (पीसीए) लांबिक विश्लेषण वेरिएट का एक नया समुच्चय बनाता है जिसमें मूल समुच्चय के समान जानकारी होती है। यह लांबिक विश्लेषण अक्षों का एक नया समुच्चय देने के लिए भिन्नता के अक्षों को घूर्णन कराता है, ताकि वे भिन्नता के घटते अनुपात को संक्षेप में प्रस्तुत कर सके।
  4. कारक विश्लेषण पीसीए के समान है, लेकिन उपयोगकर्ता को मूल समुच्चय से कम संख्या में अवास्तविक वेरिएट निकालने की अनुमति देता है, शेष अस्पष्टीकृत भिन्नता को त्रुटि के रूप में छोड़ देता है। निकाले गए वेरिएट अव्यक्त वेरिएट या कारकों के रूप में जाने जाते हैं; देखे गए वेरिएटों के समूह में प्रत्येक को सहसंयोजन के लिए जिम्मेदार माना जा सकता है।
  5. कैनोनिकल सहसंबंध विश्लेषण वेरिएट के दो सेटों के बीच रैखिक संबंध पाता है; यह द्विभाजित सहसंबंध का सामान्यीकृत (अर्थात् कैनोनिकल) संस्करण है।[3]
  6. अतिरेक विश्लेषण (आरडीए) कैनोनिकल सहसंबंध विश्लेषण के समान है, लेकिन उपयोगकर्ता को (स्वतंत्र) वेरिएट के एक समुच्चय से निर्दिष्ट संख्या में अवास्तविक वेरिएट प्राप्त करने की अनुमति देता है जो दूसरे (स्वतंत्र) समुच्चय में जितना संभव हो उतना विवेरिएटण की व्याख्या करता है। यह प्रतिगमन विश्लेषण का एक बहुभिन्नरूपी अनुरूप है।
  7. पत्राचार विश्लेषण (सीए), या पारस्परिक औसत, मूल समुच्चय को संक्षिप्त करने वाले अवास्तविक वेरिएट का एक समुच्चय (पीसीए की तरह) पाता है। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को दर्शाता है।
  8. वेरिएट के दो सेटों (जैसे अतिरेक विश्लेषण) में संयुक्त भिन्नता को संक्षिप्त करने के लिए कैननिकल (या "विवश") पत्राचार विश्लेषण (सीसीए); पत्राचार विश्लेषण और बहुभिन्नरूपी प्रतिगमन विश्लेषण का संयोजन। अंतर्निहित मॉडल रिकॉर्ड (स्थितियों) के बीच सीएचआई-वर्ग असमानताओं को मानता है।
  9. बहुआयामी स्केलिंग में अवास्तविक वेरिएट का एक समुच्चय निर्धारित करने के लिए विभिन्न कलन विधि सम्मिलित हैं जो रिकॉर्ड के बीच जोड़ीदार दूरी का सबसे अच्छा प्रतिनिधित्व करते हैं। मूल विधि प्रधान निर्देशांक विश्लेषण (PCoA; PCA पर आधारित) है।
  10. विभेदक विश्लेषण, या कैनोनिकल वेरिएट एनालिसिस, यह स्थापित करने का प्रयास करता है कि क्या वेरिएट के एक समुच्चय का उपयोग स्थितियों के दो या अधिक समूहों के बीच अंतर करने के लिए किया जा सकता है।
  11. रेखीय विभेदक विश्लेषण (LDA) नई टिप्पणियों के वर्गीकरण की अनुमति देने के लिए सामान्य रूप से वितरित डेटा के दो समुच्चयों से एक रेखीय भविष्यवक्ता की गणना करता है।
  12. क्लस्टर विश्लेषण वस्तुओं को समूहों (क्लस्टर कहा जाता है) में निर्धारित करता है ताकि एक ही क्लस्टर से वस्तु (स्थितियों) अलग-अलग क्लस्टर की वस्तुओं की तुलना में एक दूसरे के समान हों।
  13. पुनरावर्ती विभाजन एक निर्णय रेखा चित्र बनाता है जो एक द्विबीजपत्री आश्रित वेरिएट के आधार पर जनसंख्या के सदस्यों को सही संरचना से वर्गीकृत करने का प्रयास करता है।
  14. कृत्रिम तंत्रिका नेटवर्क गैर-रैखिक बहुभिन्नरूपी मॉडल के प्रतिगमन और क्लस्टरिंग विधियों का विस्तार करते हैं।
  15. बहुभिन्नरूपी डेटा का पता लगाने के लिए सांख्यिकीय ग्राफिक्स जैसे पर्यटन, समानांतर निर्देशांक, स्कैटरप्लॉट मैट्रिसेस का उपयोग किया जा सकता है।
  16. एक साथ अनुमानित विभिन्न निर्भर चर के साथ समीकरण मॉडल एक से अधिक प्रतिगमन समीकरण सम्मिलित हैं।।
  17. वेक्टर ऑटोरिग्रेशन में विभिन्न समय श्रृंखला वेरिएट के एक साथ प्रतिगमन और एक दूसरे के पिछड़े मानों पर एक साथ प्रतिगमन सम्मिलित है।
  18. प्रधान प्रतिक्रिया वक्रो विश्लेषण (पीआरसी) आरडीए पर आधारित एक विधि है जो उपयोगकर्ता को समय के साथ नियंत्रण अनुकूलन में बदलाव के लिए सुधार करके समय के साथ उपचार के प्रभावों पर ध्यान केंद्रित करने की अनुमति देता है।[4]
  19. सहसंबंधों की प्रतीकात्मकता में सहसंबंध मैट्रिक्स को एक आरेख द्वारा प्रतिस्थापित करना सम्मिलित है जहां "उल्लेखनीय" सहसंबंधों को एक ठोस रेखा (सकारात्मक सहसंबंध), या एक बिंदीदार रेखा (नकारात्मक सहसंबंध) द्वारा दर्शाया जाता है।

महत्वपूर्ण प्रायिकता वितरण

बहुभिन्नरूपी विश्लेषणों में उपयोग किए जाने वाले प्रायिकता वितरणों का एक समुच्चय होता है जो वितरणों के संगत समुच्चय के समान भूमिका निभाते हैं जो सामान्य वितरण डेटासमुच्चय के लिए उपयुक्त होने पर अविभाज्य विश्लेषण में उपयोग किए जाते हैं। ये बहुभिन्नरूपी वितरण हैं:

* बहुभिन्नरूपी सामान्य वितरण
* विशार्ट वितरण

बायेसियन अनुमान में व्युत्क्रम-विशार्ट वितरण महत्वपूर्ण है, उदाहरण के लिए बायेसियन बहुभिन्नरूपी रैखिक प्रतिगमन में महत्वपूर्ण है। इसके अतिरिक्त, हॉटेलिंग का टी-वर्ग वितरण एक बहुभिन्नरूपी वितरण है, जो स्टूडेंट के टी-वितरण का सामान्यीकरण करता है, जिसका उपयोग बहुभिन्नरूपी सांख्यिकीय परिकल्पना परीक्षण में किया जाता है।

इतिहास

एंडरसन की 1958 की पाठ्यपुस्तक, बहुभिन्नरूपी सांख्यिकीय विश्लेषण का एक परिचय,[5] ने सिद्धांतकारों और अनुप्रयुक्त सांख्यिकीविदों की एक पीढ़ी को शिक्षित किया; एंडरसन की पुस्तक संभावना अनुपात परीक्षण और सांख्यिकीय शक्ति कार्यों के गुणों के माध्यम से परिकल्पना परीक्षण, स्वीकार्यता, निष्पक्षता और एकरसता का पूर्वाग्रह पर जोर देती है।[6][7]

एमवीए एक बार केवल आकार, अंतर्निहित डेटा समुच्चय की जटिलता और उच्च संगणनात्मक उपभोग के कारण सांख्यिकीय सिद्धांत क्षेत्र में खड़ा था। संगणनात्मक शक्ति के नाटकीय विकास के साथ, एमवीए अब डेटा विश्लेषण में तेजी से महत्वपूर्ण भूमिका निभाता है और ओमिक्स क्षेत्रों में इसका व्यापक अनुप्रयोग है।

अनुप्रयोग

सॉफ्टवेयर और उपकरण

बहुभिन्नरूपी विश्लेषण के लिए बड़ी संख्या में सॉफ्टवेयर पैकेज और अन्य उपकरण हैं, जिनमें सम्मिलित हैं:

यह भी देखें

संदर्भ

  1. 1.0 1.1 Olkin, I.; Sampson, A. R. (2001-01-01), "Multivariate Analysis: Overview", in Smelser, Neil J.; Baltes, Paul B. (eds.), International Encyclopedia of the Social & Behavioral Sciences, Pergamon, pp. 10240–10247, ISBN 9780080430768, retrieved 2019-09-02
  2. Hidalgo, B; Goodman, M (2013). "बहुभिन्नरूपी या बहुभिन्नरूपी प्रतिगमन?". Am J Public Health. 103: 39–40. doi:10.2105/AJPH.2012.300897. PMC 3518362. PMID 23153131.
  3. Unsophisticated analysts of bivariate Gaussian problems may find useful a crude but accurate method of accurately gauging probability by simply taking the sum S of the N residuals' squares, subtracting the sum Sm at minimum, dividing this difference by Sm, multiplying the result by (N - 2) and taking the inverse anti-ln of half that product.
  4. ter Braak, Cajo J.F. & Šmilauer, Petr (2012). Canoco reference manual and user's guide: software for ordination (version 5.0), p292. Microcomputer Power, Ithaca, NY.
  5. T.W. Anderson (1958) An Introduction to Multivariate Analysis, New York: Wiley ISBN 0471026409; 2e (1984) ISBN 0471889873; 3e (2003) ISBN 0471360910
  6. Sen, Pranab Kumar; Anderson, T. W.; Arnold, S. F.; Eaton, M. L.; Giri, N. C.; Gnanadesikan, R.; Kendall, M. G.; Kshirsagar, A. M.; et al. (June 1986). "समीक्षा: बहुभिन्नरूपी सांख्यिकीय विश्लेषण पर समकालीन पाठ्यपुस्तकें: एक मनोरम मूल्यांकन और समालोचना". Journal of the American Statistical Association. 81 (394): 560–564. doi:10.2307/2289251. ISSN 0162-1459. JSTOR 2289251.(Pages 560–561)
  7. Schervish, Mark J. (November 1987). "बहुभिन्नरूपी विश्लेषण की समीक्षा". Statistical Science. 2 (4): 396–413. doi:10.1214/ss/1177013111. ISSN 0883-4237. JSTOR 2245530.
  8. CRAN has details on the packages available for multivariate data analysis


अग्रिम पठन

  • Johnson, Richard A.; Wichern, Dean W. (2007). Applied Multivariate Statistical Analysis (Sixth ed.). Prentice Hall. ISBN 978-0-13-187715-3.
  • KV Mardia; JT Kent; JM Bibby (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5.
  • A. Sen, M. Srivastava, Regression Analysis — Theory, Methods, and Applications, Springer-Verlag, Berlin, 2011 (4th printing).
  • Cook, Swayne (2007). Interactive Graphics for Data Analysis.
  • Malakooti, B. (2013). Operations and Production Systems with Multiple Objectives. John Wiley & Sons.
  • T. W. Anderson, An Introduction to Multivariate Statistical Analysis, Wiley, New York, 1958.
  • KV Mardia; JT Kent & JM Bibby (1979). Multivariate Analysis. Academic Press. ISBN 978-0124712522. (M.A. level "likelihood" approach)
  • Feinstein, A. R. (1996) Multivariable Analysis. New Haven, CT: Yale University Press.
  • Hair, J. F. Jr. (1995) Multivariate Data Analysis with Readings, 4th ed. Prentice-Hall.
  • Johnson, Richard A.; Wichern, Dean W. (2007). Applied Multivariate Statistical Analysis (Sixth ed.). Prentice Hall. ISBN 978-0-13-187715-3.
  • Schafer, J. L. (1997) Analysis of Incomplete Multivariate Data. CRC Press. (Advanced)
  • Sharma, S. (1996) Applied Multivariate Techniques. Wiley. (Informal, applied)
  • Izenman, Alan J. (2008). Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 9780387781884.
  • "Handbook of Applied Multivariate Statistics and Mathematical Modeling | ScienceDirect". Retrieved 2019-09-03.









बाहरी संबंध