दिशात्मक घटक विश्लेषण

दिशात्मक कॉम्पोनेन्ट विश्लेषण (डीसीए)  ऐतिहासिक जलवायु अवलोकन जैसे स्पेस-टाइम डेटा-सेट में परिवर्तनशीलता के प्रतिनिधि पैटर्न की पहचान करने के लिए जलवायु विज्ञान में उपयोग की जाने वाली सांख्यिकीय विधि है, सामूहिक पूर्वानुमान या जलवायु समूह है।

पहला डीसीए पैटर्न मौसम या जलवायु परिवर्तनशीलता का पैटर्न है जो घटित होने की संभावना है (संभावना फ़ंक्शन का उपयोग करके मापा जाता है) और इसका बड़ा प्रभाव होता है ( निर्दिष्ट रैखिक प्रभाव फ़ंक्शन के लिए, और कुछ गणितीय स्थितियों को देखते हुए: नीचे देखें)।

पहला डीसीए पैटर्न पहले प्रमुख कॉम्पोनेन्ट विश्लेषण पैटर्न के विपरीत है, जिसके घटित होने की संभावना है, किन्तु इसका बड़ा प्रभाव नहीं हो सकता है, और इस प्रकार प्रभाव फ़ंक्शन के ग्रेडियेंट से प्राप्त पैटर्न के साथ, जिसका बड़ा प्रभाव होता है, किन्तु घटित होने की संभावना नहीं है।

डीसीए जलवायु अनुसंधान में उपयोग किए जाने वाले अन्य पैटर्न पहचान विधियों जैसे ईओएफ, क्रमावर्तित ईओएफ और विस्तारित ईओएफ से भिन्न है, इस प्रकार जिसमें यह बाहरी वेक्टर प्रभाव के ग्रेडिएंट को ध्यान में रखता है।

डीसीए एन्सेम्बल पूर्वानुमान से बड़े एन्सेम्बल को कम करने का विधि प्रदान करता है या जलवायु पहनावा सिर्फ दो पैटर्न के लिए पहला पैटर्न संयोजन माध्य है, और इस प्रकार दूसरा पैटर्न डीसीए पैटर्न है, इस प्रकार जो संयोजन माध्य के आसपास परिवर्तनशीलता को तरह से दर्शाता है जो प्रभाव को ध्यान में रखता है।

डीसीए उन अन्य विधियों से विरोधाभासी है जो संयोजनों को कम करने के लिए प्रस्तावित किए गए हैं इसमें समूह की संरचना के अतिरिक्त प्रभाव को भी ध्यान में रखा जाता है।

इनपुट
DCA की गणना दो इनपुट से की जाती है:


 * मौसम या जलवायु डेटा का बहुभिन्नरूपी डेटासेट, जैसे ऐतिहासिक जलवायु अवलोकन, या मौसम या जलवायु समूह है


 * रैखिक प्रभाव फ़ंक्शन रैखिक प्रभाव फ़ंक्शन एक फ़ंक्शन है जो स्थानिक पैटर्न में विभिन्न स्थानों पर मूल्यों के भारित योग के रूप में मौसम या जलवायु डेटा में प्रत्येक स्थानिक पैटर्न के लिए प्रभाव के स्तर को परिभाषित करता है। उदाहरण स्थानिक पैटर्न में औसत मान है। रैखिक प्रभाव फ़ंक्शन को गैर-रेखीय प्रभाव फ़ंक्शन की बहुभिन्नरूपी टेलर श्रृंखला में पहले पद के रूप में उत्पन्न किया जा सकता है।

सूत्र
एक स्पेस-टाइम डेटा सेट $$X$$ पर विचार करें जिसमें व्यक्तिगत स्थानिक पैटर्न वैक्टर $$x$$ सम्मिलित हैं, जहां प्रत्येक पैटर्न को माध्य शून्य और सहप्रसरण मीट्रिक $$C$$ के साथ बहुभिन्नरूपी सामान्य वितरण से एकल प्रतिरूप के रूप में माना जाता है।

हम एक स्थानिक पैटर्न के रैखिक प्रभाव फ़ंक्शन को $$r^tx$$ के रूप में परिभाषित करते हैं, जहां $$r$$ स्थानिक भार का एक वेक्टर है।

पहला डीसीए पैटर्न सहप्रसरण मीट्रिक $$C$$ और भार $$r$$ के संदर्भ में आनुपातिक अभिव्यक्ति $$x \propto Cr$$ द्वारा दिया गया है

फिर पैटर्न को आवश्यकतानुसार किसी भी लंबाई तक सामान्यीकृत किया जा सकता है।

गुण
यदि मौसम या जलवायु डेटा को वृत्ताकार रूप से वितरित किया जाता है (उदाहरण के लिए, बहुभिन्नरूपी सामान्य वितरण या बहुभिन्नरूपी टी-वितरण के रूप में वितरित किया जाता है) तो पहले DCA पैटर्न (DCA1) को निम्नलिखित गणितीय गुणों के साथ स्थानिक पैटर्न के रूप में परिभाषित किया गया है:
 * DCA1 प्रभाव के किसी दिए गए मान के लिए संभाव्यता घनत्व को अधिकतम करता है
 * DCA1 संभाव्यता घनत्व के दिए गए मान के लिए प्रभाव को अधिकतम करता है
 * DCA1 प्रभाव और संभाव्यता घनत्व के उत्पाद को अधिकतम करता है
 * DCA1 नियमबद्ध अपेक्षा है, प्रभाव के निश्चित स्तर से अधिक होने पर नियमबद्ध है
 * DCA1 प्रभाव-भारित संयोजन माध्य है
 * DCA1 में कोई भी संशोधन ऐसे पैटर्न को जन्म देगा जो या तो कम किनारा होगा, या कम संभावना घनत्व होगा।

रेनफाल उदाहरण
उदाहरण के लिए, रेनफाल विसंगति डेटासेट में, कुल रेनफाल विसंगति के रूप में परिभाषित प्रभाव मीट्रिक का उपयोग करते हुए, पहला डीसीए पैटर्न स्थानिक पैटर्न है जिसमें किसी दिए गए कुल रेनफाल विसंगति के लिए उच्चतम संभावना घनत्व होता है। यदि दी गई कुल रेनफाल विसंगति को बड़े मूल्य के लिए चुना जाता है, जिससे यह पैटर्न मीट्रिक के संदर्भ में किनारा होने (अर्थात, कुल रेनफाल की बड़ी मात्रा का प्रतिनिधित्व करने) को पैटर्न के संदर्भ में संभावित होने के साथ जोड़ता है, और इसलिए प्रतिनिधि किनारा पैटर्न के रूप में उपयुक्त है।

पीसीए के साथ तुलना
प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) और डीसीए के बीच मुख्य अंतर हैं


 * पीसीए केवल सहप्रसरण मीट्रिक का कार्य है, और पहले पीसीए पैटर्न को परिभाषित किया गया है जिससे स्पष्ट विचरण को अधिकतम किया जा सकता है


 * डीसीए सहप्रसरण मीट्रिक और वेक्टर दिशा (प्रभाव फ़ंक्शन का ग्रेडिएंट) का फ़ंक्शन है, और पहले डीसीए पैटर्न को परिभाषित किया गया है जिससे प्रभाव मीट्रिक के दिए गए मूल्य के लिए संभाव्यता घनत्व को अधिकतम किया जा सकता है।

परिणामस्वरूप, इकाई वेक्टर स्थानिक पैटर्न के लिए:
 * पहला पीसीए स्थानिक पैटर्न सदैव उच्च स्पष्ट विचरण से मेल खाता है, किन्तु अपकृष्ट स्थितियों को छोड़कर, प्रभाव मीट्रिक का मूल्य कम होता है (उदाहरण के लिए, कुल रेनफाल विसंगति)।
 * पहला डीसीए स्थानिक पैटर्न सदैव प्रभाव मीट्रिक के उच्च मूल्य से मेल खाता है, किन्तु अपकृष्ट स्थितियों को छोड़कर, इसमें समझाए गए विचरण का कम मूल्य होता है

विकृत स्थिति तब घटित होते हैं जब पीसीए और डीसीए पैटर्न समान होते हैं।

इसके अतिरिक्त, पहले पीसीए पैटर्न को देखते हुए, डीसीए पैटर्न को स्केल किया जा सकता है जिससे:
 * स्केल किए गए डीसीए पैटर्न में पहले पीसीए पैटर्न के समान संभाव्यता घनत्व है, किन्तु उच्च प्रभाव, या
 * स्केल किए गए डीसीए पैटर्न का प्रभाव पहले पीसीए पैटर्न के समान है, किन्तु उच्च संभावना घनत्व है।

दो आयामी उदाहरण
चित्र 1 उदाहरण देता है, जिसे इस प्रकार समझा जा सकता है:
 * दो अक्ष दो स्थानों पर वार्षिक औसत रेनफाल की विसंगतियों का प्रतिनिधित्व करते हैं, जिसमें आरेख के शीर्ष दाएं कोण की ओर उच्चतम कुल रेनफाल विसंगति मान हैं।
 * दो स्थानों पर रेनफाल विसंगतियों की संयुक्त परिवर्तनशीलता को द्विचर सामान्य वितरण के अनुरूप माना जाता है
 * दीर्घवृत्त इस द्विचर सामान्य से संभाव्यता घनत्व का एकल समोच्च दिखाता है, दीर्घवृत्त के अंदर उच्च मान के साथ
 * दीर्घवृत्त के केंद्र में लाल बिंदु दोनों स्थानों पर शून्य रेनफाल विसंगतियों को दर्शाता है
 * नीला समानांतर-रेखा तीर दीर्घवृत्त के मुख्य अक्ष को दर्शाता है, जो पहला पीसीए स्थानिक पैटर्न वेक्टर भी है
 * इस स्थिति में, पीसीए पैटर्न को स्केल किया जाता है जिससे यह दीर्घवृत्त को स्पर्श कर सकता है
 * विकर्ण सीधी रेखा निरंतर धनात्मक कुल रेनफाल विसंगति की रेखा दिखाती है, जिसे कुछ किनारा स्तर पर माना जाता है
 * लाल बिंदु रेखा वाला तीर पहला DCA पैटर्न दिखाता है, जो उस बिंदु की ओर इशारा करता है जिस पर विकर्ण रेखा दीर्घवृत्त की स्पर्शरेखा है
 * इस स्थिति में, DCA पैटर्न को स्केल किया जाता है जिससे यह दीर्घवृत्त को स्पर्श कर सकता है

इस आरेख से, DCA पैटर्न में निम्नलिखित गुण देखे जा सकते हैं:
 * विकर्ण रेखा पर सभी बिंदुओं में से, यह सबसे अधिक संभावना घनत्व वाला बिंदु है
 * दीर्घवृत्त पर सभी बिंदुओं में से, यह सबसे अधिक कुल रेनफाल विसंगति वाला बिंदु है
 * इसमें पीसीए पैटर्न के समान संभाव्यता घनत्व है, किन्तु उच्च कुल रेनफाल का प्रतिनिधित्व करता है (अर्थात, आरेख के शीर्ष दाएं कोण की ओर इंगित करता है)
 * डीसीए पैटर्न में कोई भी परिवर्तन या तो संभाव्यता घनत्व को कम कर देगा (यदि यह दीर्घवृत्त से बाहर चला जाता है) या कुल रेनफाल विसंगति को कम कर देगा (यदि यह दीर्घवृत्त के साथ या अंदर जाता है)

इस स्थिति में पीसीए पैटर्न की कुल रेनफाल विसंगति अधिक छोटी है, क्योंकि दोनों स्थानों पर रेनफाल विसंगतियों के बीच परस्पर संबंध हैं। परिणामस्वरूप, पहला पीसीए पैटर्न बड़े कुल रेनफाल विसंगति वाले पैटर्न का अच्छा प्रतिनिधि उदाहरण नहीं है, जबकि पहला डीसीए पैटर्न है।

$$n$$ आयामों में दीर्घवृत्त एक दीर्घवृत्त बन जाता है, विकर्ण रेखा एक $$n-1$$ आयामी समतल बन जाती है और PCA और DCA पैटर्न $$n$$ आयामों में सदिश होते हैं।

जलवायु परिवर्तनशीलता के लिए आवेदन
अमेरिका और चीन में वर्षा की चरम सीमा के सबसे संभावित पैटर्न को समझने के लिए डीसीए को ऐतिहासिक वर्षा परिवर्तनशीलता के सीआरयू डेटा-सेट पर प्रयुक्त किया गया है।

मौसम पूर्वानुमानों को एकत्रित करने के लिए आवेदन
डीसीए को मध्यम दूरी के मौसम पूर्वानुमान के लिए यूरोपीय केंद्र मीडियम-रेंज वेदर फोरकास्ट्स में प्रयुक्त किया गया है जिससे एसेम्बली फोरकास्ट में अत्यधिक तापमान के सबसे संभावित पैटर्न की पहचान की जा सकती है।

जलवायु मॉडल अनुमानों को एकत्रित करने के लिए आवेदन
अत्यधिक भविष्य की रेनफाल के सबसे संभावित पैटर्न की पहचान करने के लिए डीसीए को जलवायु मॉडल अनुमानों को इकट्ठा करने के लिए प्रयुक्त किया गया है।

प्रथम डीसीए पैटर्न की व्युत्पत्ति
एक स्पेस-टाइम डेटा-सेट $$X$$ पर विचार करें जिसमें व्यक्तिगत स्थानिक पैटर्न वैक्टर $$x$$ सम्मिलित हों जहां प्रत्येक पैटर्न को माध्य शून्य और सहप्रसरण मैट्रिक्स $$C$$ के साथ बहुभिन्नरूपी सामान्य वितरण से एकल प्रतिरूप के रूप में माना जाता है।

$$x$$ के एक फलन के रूप में लॉग संभाव्यता घनत्व $$-x^t C^{-1} x$$ के समानुपाती होता है

हम एक स्थानिक पैटर्न के रैखिक प्रभाव फ़ंक्शन को $$r^tx$$ के रूप में परिभाषित करते हैं, जहां $$r$$ स्थानिक भार का एक वेक्टर है।

फिर हम उस स्थानिक पैटर्न को खोजना चाहते हैं जो रैखिक प्रभाव फ़ंक्शन के दिए गए मान के लिए संभाव्यता घनत्व को अधिकतम करता है। यह स्थानिक पैटर्न खोजने के सामान है जो रैखिक प्रभाव फ़ंक्शन के दिए गए मान के लिए लॉग संभाव्यता घनत्व को अधिकतम करता है, जिसे हल करना थोड़ा सरल है।

यह प्रतिबंधित अधिकतमीकरण समस्या है, और इसे लैग्रेंज गुणक की विधि का उपयोग करके हल किया जा सकता है।

लैग्रेंजियन फ़ंक्शन द्वारा दिया गया है

$$L(x,\lambda)=-x^t C^{-1}x-\lambda(r^tx-1)$$

$$x$$ द्वारा विभेदन करने और शून्य पर सेट करने से समाधान मिलता है

$$x \propto Cr$$

जिससे सामान्यीकरण किया जा सके $$x$$ यूनिट वेक्टर देता है

$$x = Cr / (r^tCCr)^{1/2}$$

यह पहला DCA पैटर्न है.

इसके पश्चात् पैटर्न प्राप्त किए जा सकते हैं जो ऑर्थोनॉर्मल सेट बनाने और मैट्रिक्स फ़ैक्टराइज़ेशन के लिए एक विधि बनाने के लिए पहले ऑर्थोगोनल हैं।

== संदर्भ                                                                                                                                                                                                        ==