करणीय ग्राफ

सांख्यिकी, अर्थमिति, महामारी विज्ञान, आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन (पथ विश्लेषण (सांख्यिकी) के रूप में भी जाना जाता है, कारण बायेसियन नेटवर्क या निर्देशित अचक्रीय ग्राफ ) ग्राफिकल मॉडल हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।

संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं, उदाहरण के लिए कारण समानता संकेतन का उपयोग करना। संचार उपकरणों के रूप में, रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में, ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,   एन्कोडेड मान्यताओं के परीक्षण योग्य निहितार्थ प्राप्त करें,   बाहरी वैधता के लिए परीक्षण, और लापता डेटा का प्रबंधन करें और चयन पूर्वाग्रह। कारण रेखांकन का उपयोग सबसे पहले आनुवंशिकीविद् सेवल राइट द्वारा किया गया था रूब्रिक पथ आरेख के तहत। बाद में उन्हें सामाजिक वैज्ञानिकों द्वारा अपनाया गया     और, कुछ हद तक, अर्थशास्त्रियों द्वारा। ये मॉडल शुरू में निश्चित मापदंडों के साथ रैखिक समीकरणों तक ही सीमित थे। आधुनिक विकास ने ग्राफिकल मॉडल को गैर-पैरामीट्रिक विश्लेषण तक विस्तारित किया है, और इस प्रकार एक सामान्यता और लचीलापन प्राप्त किया है जिसने कंप्यूटर विज्ञान, महामारी विज्ञान, में कारण विश्लेषण को बदल दिया है। और सामाजिक विज्ञान।

निर्माण और शब्दावली
कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का जवाब देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से वाई से जुड़े वेरिएबल्स को वाई के माता-पिता या वाई के प्रत्यक्ष कारण कहा जाता है, और इन्हें पा (वाई) द्वारा निरूपित किया जाता है।

आकस्मिक मॉडल में अक्सर त्रुटि शब्द या छोड़े गए कारक शामिल होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब Pa(Y) को स्थिर रखा जाता है। ज्यादातर मामलों में, त्रुटि शर्तों को ग्राफ़ से बाहर रखा गया है। हालाँकि, यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि शर्तें निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि शर्तों के बीच उत्पन्न करते हैं, जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।

मौलिक उपकरण
ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क#डी-सेपरेशन|डी-सेपरेशन है, जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि शर्तों के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये सशर्त स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।

उदाहरण
मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं, और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित संरचनात्मक समीकरण मॉडल (SEM) विनिर्देश में व्यक्त किया जा सकता है।

मॉडल 1



\begin{align} Q_1 &= U_1\\ C &= a \cdot Q_1 + U_2\\ Q_2 &= c \cdot C + d \cdot Q_1 + U_3\\ S &= b \cdot C + e \cdot Q_2 + U_4, \end{align}$$ कहाँ $$Q_1$$ कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, $$Q_2$$ कॉलेज के बाद योग्यता का प्रतिनिधित्व करता है, $$C$$ कॉलेज में भाग लेने की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ शामिल हैं, और $$S$$ व्यक्ति का वेतन।

चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक वेरिएबल में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त, प्रत्येक समीकरण के लिए, स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ मामलों में, हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।

अगर $$Q_1$$ और $$Q_2$$ अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है $$C$$ और $$S$$ उनकी त्रुटि शर्तों के लिए जिम्मेदार ठहराया जा सकता है। उन्हें हटाकर, हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:

मॉडल 2



\begin{align} C &= U_C \\ S &= \beta C + U_S \end{align}$$ मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि की जानकारी का अर्थ है कि त्रुटि शब्द $$S$$, $$U_S$$, C के साथ सहसंबद्ध है त्रुटिपूर्ण शर्त, $$U_C$$. नतीजतन, हम चित्रा 2 में एस और सी के बीच एक द्विपक्षीय चाप जोड़ते हैं।

तब से $$U_S$$ से सहसम्बन्धित है $$U_C$$ और इसलिए, $$C$$, $$C$$ अंतर्जात है और $$\beta$$ मॉडल 2 में पहचाना नहीं गया है। हालांकि, अगर हम किसी व्यक्ति के कॉलेज आवेदन की ताकत शामिल करते हैं, $$A$$, जैसा चित्र 3 में दिखाया गया है, हम निम्नलिखित मॉडल प्राप्त करते हैं:

मॉडल 3



\begin{align} Q_1 &= U_1\\ A &= a \cdot Q_1 + U_2 \\ C &= b \cdot A + U_3\\ Q_2 &= e \cdot Q_1 + d \cdot C + U_4\\ S &= c \cdot C + f \cdot Q_2 + U_5, \end{align}$$ हम प्राप्त मॉडल विनिर्देश से अव्यक्त चर को हटाकर:

मॉडल 4



\begin{align} A &= a \cdot Q_1 + U_A \\ C &= b \cdot A + U_C\\ S &= \beta \cdot C + U_S, \end{align}$$ साथ $$U_A$$ से सम्बंधित $$U_S$$.

अब, $$\beta$$ की पहचान की जाती है और के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है $$S$$ पर $$C$$ और $$A$$. इसे सिंगल-डोर मानदंड का उपयोग करके सत्यापित किया जा सकता है, एक संरचनात्मक गुणांक की पहचान के लिए एक आवश्यक और पर्याप्त चित्रमय स्थिति, जैसे $$\beta$$, प्रतिगमन का उपयोग करना।