करणीय ग्राफ

सांख्यिकी अर्थमिति महामारी विज्ञान आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन (पथ विश्लेषण (सांख्यिकी) के रूप में भी जाना जाता है, कारण बायेसियन नेटवर्क या निर्देशित अचक्रीय ग्राफ ) ग्राफिकल मॉडल हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।

संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं उदाहरण के लिए कारण समानता संकेतन का उपयोग करना संचार उपकरणों के रूप में रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,   एन्कोडेड मान्यताओं के परीक्षण योग्य निहितार्थ प्राप्त करें,   बाहरी वैधता के लिए परीक्षण, और लापता डेटा का प्रबंधन करें और चयन पूर्वाग्रह है ।

रूब्रिक "पथ आरेख" के तहत अनुवांशिकी विज्ञानी सीवेल राइट द्वारा कारणात्मक रेखांकन का पहली बार उपयोग किया गया था । उन्हें बाद में सामाजिक वैज्ञानिकों द्वारा और कुछ सीमा तक अर्थशास्त्रियों द्वारा अपनाया गया।     ये मॉडल प्रारंभ में निश्चित मापदंडों के साथ रैखिक समीकरणों तक ही सीमित थे। आधुनिक विकास ने ग्राफिकल मॉडल को गैर-पैरामीट्रिक विश्लेषण तक विस्तारित किया है और इस प्रकार एक सामान्यता और लचीलापन प्राप्त किया है जिसने कंप्यूटर विज्ञान महामारी विज्ञान और सामाजिक विज्ञान में कारण विश्लेषण को बदल दिया है।

निर्माण और शब्दावली
कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का उत्तर देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से Y से जुड़े चर को Y के पेरेंट्स या Y के प्रत्यक्ष कारण कहा जाता है, और इन्हें Pa(Y) द्वारा निरूपित किया जाता है।

आकस्मिक मॉडल में अधिकांशतः त्रुटि शब्द या छोड़े गए कारक सम्मिलित होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब Pa(Y) को स्थिर रखा जाता है। अधिकत्तर स्थितियों में, त्रुटि नियमो को ग्राफ़ से बाहर रखा गया है। चूँकि यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि नियम निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि नियमो के बीच उत्पन्न करते हैं जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।

मौलिक उपकरण
ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क या डी-सेपरेशन है जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि नियमो के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये नियमबद्द स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।

उदाहरण
मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित संरचनात्मक समीकरण मॉडल (एसईएम) विनिर्देश में व्यक्त किया जा सकता है।

मॉडल 1



\begin{align} Q_1 &= U_1\\ C &= a \cdot Q_1 + U_2\\ Q_2 &= c \cdot C + d \cdot Q_1 + U_3\\ S &= b \cdot C + e \cdot Q_2 + U_4, \end{align}$$ जहाँ $$Q_1$$ कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, $$Q_2$$ कॉलेज के बाद की योग्यता का प्रतिनिधित्व करता है, $$C$$ में सम्मिलित कॉलेज की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ होती हैं और $$S$$ व्यक्ति का वेतन होता है।

चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक चर में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त प्रत्येक समीकरण के लिए स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ स्थितियों में हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।

यदि $$Q_1$$ और $$Q_2$$ अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है $$C$$ और $$S$$ उनकी त्रुटि नियमो के लिए उत्तरदाई ठहराया जा सकता है। उन्हें हटाकर हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:

मॉडल 2



\begin{align} C &= U_C \\ S &= \beta C + U_S \end{align}$$ मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि जानकारी का अर्थ है कि $$S$$ $$U_S$$ का त्रुटि शब्द, C के त्रुटि शब्द $$U_C$$ के साथ सहसंबद्ध है। परिणामस्वरूप हम चित्र 2 में S और C के बीच एक द्विदिश चाप जोड़ते हैं।



चूँकि $$U_S$$, $$U_C$$ के साथ सहसंबद्ध है और इसलिए, $$C$$, $$C$$अंतर्जात है और $$\beta$$ को मॉडल 2 में पहचाना नहीं गया है। चूँकि यदि हम किसी व्यक्ति के कॉलेज आवेदन$$A$$ की ताकत को सम्मिलित करते हैं जैसा कि चित्र 3 में दिखाया गया है निम्नलिखित मॉडल प्राप्त करें:

मॉडल 3



\begin{align} Q_1 &= U_1\\ A &= a \cdot Q_1 + U_2 \\ C &= b \cdot A + U_3\\ Q_2 &= e \cdot Q_1 + d \cdot C + U_4\\ S &= c \cdot C + f \cdot Q_2 + U_5, \end{align}$$ हम प्राप्त मॉडल विनिर्देश से अव्यक्त चर को हटाकर:

मॉडल 4



\begin{align} A &= a \cdot Q_1 + U_A \\ C &= b \cdot A + U_C\\ S &= \beta \cdot C + U_S, \end{align}$$ $$U_A$$ के साथ $$U_S$$ के साथ सहसंबद्ध।

अब, $$\beta$$ की पहचान की गई है और $$C$$ और $$A$$ पर $$S$$ के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है। इसे एकल-द्वार मानदंड का उपयोग करके सत्यापित किया जा सकता है एक संरचनात्मक गुणांक की पहचान के लिए एक आवश्यक और पर्याप्त चित्रमय स्थिति जैसे $$\beta$$ प्रतिगमन का उपयोग करना है ।