करणीय ग्राफ
सांख्यिकी अर्थमिति महामारी विज्ञान आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन (पथ विश्लेषण (सांख्यिकी) के रूप में भी जाना जाता है, कारण बायेसियन नेटवर्क या निर्देशित अचक्रीय ग्राफ ) ग्राफिकल मॉडल हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।
संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं उदाहरण के लिए कारण समानता संकेतन का उपयोग करना संचार उपकरणों के रूप में रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,[1][2][3][4][5] एन्कोडेड मान्यताओं के परीक्षण योग्य निहितार्थ प्राप्त करें,[1][6][7][8] बाहरी वैधता के लिए परीक्षण,[9] और लापता डेटा का प्रबंधन करें[10] और चयन पूर्वाग्रह है ।[11]
रूब्रिक "पथ आरेख" के तहत अनुवांशिकी विज्ञानी सीवेल राइट द्वारा कारणात्मक रेखांकन का पहली बार उपयोग किया गया था[12]। उन्हें बाद में सामाजिक वैज्ञानिकों द्वारा और कुछ सीमा तक अर्थशास्त्रियों द्वारा अपनाया गया।[13][14][15][16][17][18] ये मॉडल प्रारंभ में निश्चित मापदंडों के साथ रैखिक समीकरणों तक ही सीमित थे।[19] आधुनिक विकास ने ग्राफिकल मॉडल को गैर-पैरामीट्रिक विश्लेषण तक विस्तारित किया है और इस प्रकार एक सामान्यता और लचीलापन प्राप्त किया है जिसने कंप्यूटर विज्ञान महामारी विज्ञान और सामाजिक विज्ञान में कारण विश्लेषण को बदल दिया है।[20][21]
निर्माण और शब्दावली
कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का उत्तर देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से Y से जुड़े चर को Y के पेरेंट्स या Y के प्रत्यक्ष कारण कहा जाता है, और इन्हें Pa(Y) द्वारा निरूपित किया जाता है।
आकस्मिक मॉडल में अक्सर त्रुटि शब्द या छोड़े गए कारक शामिल होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब Pa(Y) को स्थिर रखा जाता है। ज्यादातर मामलों में, त्रुटि शर्तों को ग्राफ़ से बाहर रखा गया है। हालाँकि, यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि शर्तें निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि शर्तों के बीच उत्पन्न करते हैं, जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।
मौलिक उपकरण
ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क#डी-सेपरेशन|डी-सेपरेशन है, जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि शर्तों के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये सशर्त स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।[22]
उदाहरण
मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं, और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित संरचनात्मक समीकरण मॉडल (SEM) विनिर्देश में व्यक्त किया जा सकता है।
मॉडल 1
कहाँ कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, कॉलेज के बाद योग्यता का प्रतिनिधित्व करता है, कॉलेज में भाग लेने की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ शामिल हैं, और व्यक्ति का वेतन।
चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक वेरिएबल में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त, प्रत्येक समीकरण के लिए, स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ मामलों में, हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।
अगर और अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है और उनकी त्रुटि शर्तों के लिए जिम्मेदार ठहराया जा सकता है। उन्हें हटाकर, हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:
मॉडल 2
मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि की जानकारी का अर्थ है कि त्रुटि शब्द , , C के साथ सहसंबद्ध है's त्रुटिपूर्ण शर्त, . नतीजतन, हम चित्रा 2 में एस और सी के बीच एक द्विपक्षीय चाप जोड़ते हैं।
तब से से सहसम्बन्धित है और इसलिए, , अंतर्जात है और मॉडल 2 में पहचाना नहीं गया है। हालांकि, अगर हम किसी व्यक्ति के कॉलेज आवेदन की ताकत शामिल करते हैं, , जैसा चित्र 3 में दिखाया गया है, हम निम्नलिखित मॉडल प्राप्त करते हैं:
मॉडल 3
हम प्राप्त मॉडल विनिर्देश से अव्यक्त चर को हटाकर:
मॉडल 4
साथ से सम्बंधित .
अब, की पहचान की जाती है और के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है पर