करणीय ग्राफ

From Vigyanwiki

सांख्यिकी अर्थमिति महामारी विज्ञान आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन (पथ विश्लेषण (सांख्यिकी) के रूप में भी जाना जाता है, कारण बायेसियन नेटवर्क या निर्देशित अचक्रीय ग्राफ ) ग्राफिकल मॉडल हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।

संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं उदाहरण के लिए कारण समानता संकेतन का उपयोग करना संचार उपकरणों के रूप में रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,[1][2][3][4][5] एन्कोडेड मान्यताओं के परीक्षण योग्य निहितार्थ प्राप्त करें,[1][6][7][8] बाहरी वैधता के लिए परीक्षण,[9] और लापता डेटा का प्रबंधन करें[10] और चयन पूर्वाग्रह है ।[11]

रूब्रिक "पथ आरेख" के तहत अनुवांशिकी विज्ञानी सीवेल राइट द्वारा कारणात्मक रेखांकन का पहली बार उपयोग किया गया था[12]। उन्हें बाद में सामाजिक वैज्ञानिकों द्वारा और कुछ सीमा तक अर्थशास्त्रियों द्वारा अपनाया गया।[13][14][15][16][17][18] ये मॉडल प्रारंभ में निश्चित मापदंडों के साथ रैखिक समीकरणों तक ही सीमित थे।[19] आधुनिक विकास ने ग्राफिकल मॉडल को गैर-पैरामीट्रिक विश्लेषण तक विस्तारित किया है और इस प्रकार एक सामान्यता और लचीलापन प्राप्त किया है जिसने कंप्यूटर विज्ञान महामारी विज्ञान और सामाजिक विज्ञान में कारण विश्लेषण को बदल दिया है।[20][21]

निर्माण और शब्दावली

कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का उत्तर देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से Y से जुड़े चर को Y के पेरेंट्स या Y के प्रत्यक्ष कारण कहा जाता है, और इन्हें Pa(Y) द्वारा निरूपित किया जाता है।

आकस्मिक मॉडल में अधिकांशतः त्रुटि शब्द या छोड़े गए कारक सम्मिलित होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब Pa(Y) को स्थिर रखा जाता है। अधिकत्तर स्थितियों में, त्रुटि नियमो को ग्राफ़ से बाहर रखा गया है। चूँकि यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि नियम निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि नियमो के बीच उत्पन्न करते हैं जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।

मौलिक उपकरण

ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क या डी-सेपरेशन है जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि नियमो के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये नियमबद्द स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।[22]

उदाहरण

मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित संरचनात्मक समीकरण मॉडल (एसईएम) विनिर्देश में व्यक्त किया जा सकता है।

मॉडल 1

जहाँ कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, कॉलेज के बाद की योग्यता का प्रतिनिधित्व करता है, में सम्मिलित कॉलेज की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ होती हैं और व्यक्ति का वेतन होता है।

चित्र 1: अव्यक्त चर के साथ अज्ञात मॉडल ( और ) स्पष्ट रूप से दिखाया गया
चित्र 2: अव्यक्त चरों के साथ अज्ञात मॉडल का सारांश

चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक चर में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त प्रत्येक समीकरण के लिए स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ स्थितियों में हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।

यदि और अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है और उनकी त्रुटि नियमो के लिए उत्तरदाई ठहराया जा सकता है। उन्हें हटाकर हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:

मॉडल 2

मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि जानकारी का अर्थ है कि का त्रुटि शब्द, C के त्रुटि शब्द के साथ सहसंबद्ध है। परिणामस्वरूप हम चित्र 2 में S और C के बीच एक द्विदिश चाप जोड़ते हैं।

चित्र 3: अव्यक्त चर के साथ पहचाना गया मॉडल ( और ) स्पष्ट रूप से दिखाया गया
चित्र 4: अव्यक्त चरों के साथ पहचाने गए मॉडल का सारांश


चूँकि , के साथ सहसंबद्ध है और इसलिए, , अंतर्जात है और को मॉडल 2 में पहचाना नहीं गया है। चूँकि यदि हम किसी व्यक्ति के कॉलेज आवेदन की ताकत को सम्मिलित करते हैं जैसा कि चित्र 3 में दिखाया गया है निम्नलिखित मॉडल प्राप्त करें:

मॉडल 3

हम प्राप्त मॉडल विनिर्देश से अव्यक्त चर को हटाकर:

मॉडल 4

के साथ के साथ सहसंबद्ध।

अब, की पहचान की गई है और और पर के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है। इसे एकल-द्वार मानदंड का उपयोग करके सत्यापित किया जा सकता है[1] [23] एक संरचनात्मक गुणांक की पहचान के लिए एक आवश्यक और पर्याप्त चित्रमय स्थिति जैसे प्रतिगमन का उपयोग करना है ।

संदर्भ

  1. 1.0 1.1 1.2 Pearl, Judea (2000). करणीय संबंध. Cambridge, MA: MIT Press. ISBN 9780521773621.
  2. Tian, Jin; Pearl, Judea (2002). "A general identification condition for causal effects". आर्टिफिशियल इंटेलिजेंस पर अठारहवें राष्ट्रीय सम्मेलन की कार्यवाही. ISBN 978-0-262-51129-2.
  3. Shpitser, Ilya; Pearl, Judea (2008). "कारण पदानुक्रम के लिए पूर्ण पहचान के तरीके" (PDF). Journal of Machine Learning Research. 9: 1941–1979.
  4. Huang, Y.; Valtorta, M. (2006). "Identifiability in causal bayesian networks: A sound and complete algorithm" (PDF). Proceedings of AAAI.
  5. Bareinboim, Elias; Pearl, Judea (2012). "Causal Inference by Surrogate Experiments: z-Identifiability". आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर ट्वेंटी-आठवें सम्मेलन की कार्यवाही. arXiv:1210.4842. Bibcode:2012arXiv1210.4842B. ISBN 978-0-9749039-8-9.
  6. Tian, Jin; Pearl, Judea (2002). "On the Testable Implications of Causal Models with Hidden Variables". आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर अठारहवें सम्मेलन की कार्यवाही. pp. 519–27. arXiv:1301.0608. Bibcode:2013arXiv1301.0608T. ISBN 978-1-55860-897-9.
  7. Shpitser, Ilya; Pearl, Judea (2008). "निष्क्रिय स्वतंत्रता". Proceedings of AAAI.
  8. Chen, Bryant; Pearl, Judea (2014). "रैखिक संरचनात्मक समीकरण मॉडल के परीक्षण योग्य निहितार्थ". Proceedings of AAAI. 28. doi:10.1609/aaai.v28i1.9065. S2CID 1612893.
  9. Bareinmboim, Elias; Pearl, Judea (2014). "External Validity: From do-calculus to Transportability across Populations". Statistical Science. 29 (4): 579–595. arXiv:1503.01603. doi:10.1214/14-sts486. S2CID 5586184.
  10. Mohan, Karthika; Pearl, Judea; Tian, Jin (2013). "गुम डेटा के साथ अनुमान के लिए ग्राफिकल मॉडल" (PDF). Advances in Neural Information Processing Systems.
  11. Bareinboim, Elias; Tian, Jin; Pearl, Judea (2014). "कारण और सांख्यिकीय अनुमान में चयन पूर्वाग्रह से उबरना". Proceedings of AAAI. 28. doi:10.1609/aaai.v28i1.9074.
  12. Wright, S. (1921). "सहसंबंध और करणीय". Journal of Agricultural Research. 20: 557–585.
  13. Blalock, H. M. (1960). "सहसंबंध विश्लेषण और कारण निष्कर्ष". American Anthropologist. 62 (4): 624–631. doi:10.1525/aa.1960.62.4.02a00060.
  14. Duncan, O. D. (1966). "Path analysis: Sociological examples". American Journal of Sociology. 72: 1–16. doi:10.1086/224256. S2CID 59428866.
  15. Duncan, O. D. (1976). "संरचनात्मक समीकरण मॉडल का परिचय". American Journal of Sociology. 82 (3): 731–733. doi:10.1086/226377.
  16. Jöreskog, K. G. (1969). "अधिकतम संभावना कारक विश्लेषण की पुष्टि करने के लिए एक सामान्य दृष्टिकोण". Psychometrika. 34 (2): 183–202. doi:10.1007/bf02289343. S2CID 186236320.
  17. Goldberger, A. S.; Duncan, O. D. (1973). सामाजिक विज्ञान में संरचनात्मक समीकरण मॉडल. New York: Seminar Press.
  18. Goldberger, A. S. (1972). "सामाजिक विज्ञान में संरचनात्मक समीकरण मॉडल". Econometrica. 40 (6): 979–1001. doi:10.2307/1913851. JSTOR 1913851.
  19. White, Halbert; Chalak, Karim; Lu, Xun (2011). "सेटटेबल सिस्टम के साथ ग्रेंजर कारणता और मोती कारण मॉडल को जोड़ना" (PDF). Causality in Time Series Challenges in Machine Learning. 5.
  20. Rothman, Kenneth J.; Greenland, Sander; Lash, Timothy (2008). आधुनिक महामारी विज्ञान. Lippincott Williams & Wilkins.
  21. Morgan, S. L.; Winship, C. (2007). Counterfactuals and causal inference: Methods and principles for social research. New York: Cambridge University Press.
  22. Geiger, Dan; Pearl, Judea (1993). "सशर्त स्वतंत्रता के तार्किक और एल्गोरिथम गुण". Annals of Statistics. 21 (4): 2001–2021. CiteSeerX 10.1.1.295.2043. doi:10.1214/aos/1176349407.
  23. Chen, B.; Pearl, J (2014). "रेखीय संरचनात्मक समीकरण मॉडलिंग के लिए चित्रमय उपकरण" (PDF). Technical Report.