करणीय ग्राफ: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(7 intermediate revisions by 3 users not shown)
Line 1: Line 1:
सांख्यिकी अर्थमिति महामारी विज्ञान आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन ([[पथ विश्लेषण (सांख्यिकी)]] के रूप में भी जाना जाता है, कारण [[बायेसियन नेटवर्क]] या [[ निर्देशित अचक्रीय ग्राफ ]]) [[ग्राफिकल मॉडल]] हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।
सांख्यिकी अर्थमिति महामारी विज्ञान आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन ([[पथ विश्लेषण (सांख्यिकी)]] के रूप में भी जाना जाता है, कारण [[बायेसियन नेटवर्क]] या [[ निर्देशित अचक्रीय ग्राफ |निर्देशित अचक्रीय ग्राफ]] ) [[ग्राफिकल मॉडल]] हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।


संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं उदाहरण के लिए [[कारण समानता संकेतन]] का उपयोग करना संचार उपकरणों के रूप में रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,<ref name=causality>{{cite book|last1=Pearl|first1=Judea|author-link=Judea Pearl|title=करणीय संबंध|url=https://archive.org/details/causalitymodelsr0000pear|url-access=registration|date=2000|publisher=MIT Press|location=Cambridge, MA|isbn=9780521773621 }}</ref><ref>{{cite book|last1=Tian|first1=Jin|last2=Pearl|first2=Judea|chapter=A general identification condition for causal effects|title=आर्टिफिशियल इंटेलिजेंस पर अठारहवें राष्ट्रीय सम्मेलन की कार्यवाही|date=2002|chapter-url=https://escholarship.org/uc/item/17r754xz|isbn=978-0-262-51129-2 }}</ref><ref>{{cite journal|last1=Shpitser|first1=Ilya|last2=Pearl|first2=Judea|title=कारण पदानुक्रम के लिए पूर्ण पहचान के तरीके|url=http://www.jmlr.org/papers/volume9/shpitser08a/shpitser08a.pdf|journal=Journal of Machine Learning Research|date=2008|volume=9|pages=1941–1979}}</ref><ref>{{cite journal|last1=Huang|first1=Y.|last2=Valtorta|first2=M.|title=Identifiability in causal bayesian networks: A sound and complete algorithm|journal=Proceedings of AAAI|date=2006|url=https://www.aaai.org/Papers/AAAI/2006/AAAI06-180.pdf}}</ref><ref>{{cite book|last1=Bareinboim|first1=Elias|last2=Pearl|first2=Judea|chapter=Causal Inference by Surrogate Experiments: z-Identifiability|title=आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर ट्वेंटी-आठवें सम्मेलन की कार्यवाही|date=2012|isbn=978-0-9749039-8-9 |arxiv=1210.4842|bibcode=2012arXiv1210.4842B}}</ref> एन्कोडेड मान्यताओं के [[परीक्षण योग्य]] निहितार्थ प्राप्त करें,<ref name=causality /><ref>{{cite book|last1=Tian|first1=Jin|last2=Pearl|first2=Judea|chapter=On the Testable Implications of Causal Models with Hidden Variables|title=आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर अठारहवें सम्मेलन की कार्यवाही|date=2002|pages=519–27 |isbn=978-1-55860-897-9 |arxiv=1301.0608 |bibcode=2013arXiv1301.0608T}}</ref><ref>{{cite journal|last1=Shpitser|first1=Ilya|last2=Pearl|first2=Judea|title=निष्क्रिय स्वतंत्रता|journal=Proceedings of AAAI|date=2008}}</ref><ref>{{cite journal|last1=Chen|first1=Bryant|last2=Pearl|first2=Judea|title=रैखिक संरचनात्मक समीकरण मॉडल के परीक्षण योग्य निहितार्थ|journal=Proceedings of AAAI|date=2014|volume=28 |doi=10.1609/aaai.v28i1.9065 |s2cid=1612893 |url=https://ojs.aaai.org/index.php/AAAI/article/download/9065/8924|doi-access=free}}</ref> बाहरी वैधता के लिए परीक्षण,<ref>{{cite journal|last1=Bareinmboim|first1=Elias|last2=Pearl|first2=Judea|title=External Validity: From do-calculus to Transportability across Populations|journal=Statistical Science|date=2014|doi=10.1214/14-sts486|volume=29|issue=4|pages=579–595|arxiv=1503.01603|s2cid=5586184 }}</ref> और लापता डेटा का प्रबंधन करें<ref>{{cite journal|last1=Mohan|first1=Karthika|last2=Pearl|first2=Judea|last3=Tian|first3=Jin|title=गुम डेटा के साथ अनुमान के लिए ग्राफिकल मॉडल|journal=Advances in Neural Information Processing Systems|date=2013|url=https://proceedings.neurips.cc/paper/2013/file/0ff8033cf9437c213ee13937b1c4c455-Paper.pdf}}</ref> और चयन पूर्वाग्रह है ।<ref>{{cite journal|last1=Bareinboim|first1=Elias|last2=Tian|first2=Jin|last3=Pearl|first3=Judea|title=कारण और सांख्यिकीय अनुमान में चयन पूर्वाग्रह से उबरना|journal=Proceedings of AAAI|date=2014|volume=28 |doi=10.1609/aaai.v28i1.9074 |url=https://ojs.aaai.org/index.php/AAAI/article/view/9074/8933|doi-access=free}}</ref>
संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं उदाहरण के लिए [[कारण समानता संकेतन]] का उपयोग करना संचार उपकरणों के रूप में रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,<ref name=causality>{{cite book|last1=Pearl|first1=Judea|author-link=Judea Pearl|title=करणीय संबंध|url=https://archive.org/details/causalitymodelsr0000pear|url-access=registration|date=2000|publisher=MIT Press|location=Cambridge, MA|isbn=9780521773621 }}</ref><ref>{{cite book|last1=Tian|first1=Jin|last2=Pearl|first2=Judea|chapter=A general identification condition for causal effects|title=आर्टिफिशियल इंटेलिजेंस पर अठारहवें राष्ट्रीय सम्मेलन की कार्यवाही|date=2002|chapter-url=https://escholarship.org/uc/item/17r754xz|isbn=978-0-262-51129-2 }}</ref><ref>{{cite journal|last1=Shpitser|first1=Ilya|last2=Pearl|first2=Judea|title=कारण पदानुक्रम के लिए पूर्ण पहचान के तरीके|url=http://www.jmlr.org/papers/volume9/shpitser08a/shpitser08a.pdf|journal=Journal of Machine Learning Research|date=2008|volume=9|pages=1941–1979}}</ref><ref>{{cite journal|last1=Huang|first1=Y.|last2=Valtorta|first2=M.|title=Identifiability in causal bayesian networks: A sound and complete algorithm|journal=Proceedings of AAAI|date=2006|url=https://www.aaai.org/Papers/AAAI/2006/AAAI06-180.pdf}}</ref><ref>{{cite book|last1=Bareinboim|first1=Elias|last2=Pearl|first2=Judea|chapter=Causal Inference by Surrogate Experiments: z-Identifiability|title=आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर ट्वेंटी-आठवें सम्मेलन की कार्यवाही|date=2012|isbn=978-0-9749039-8-9 |arxiv=1210.4842|bibcode=2012arXiv1210.4842B}}</ref> एन्कोडेड मान्यताओं के [[परीक्षण योग्य]] निहितार्थ प्राप्त करें,<ref name=causality /><ref>{{cite book|last1=Tian|first1=Jin|last2=Pearl|first2=Judea|chapter=On the Testable Implications of Causal Models with Hidden Variables|title=आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर अठारहवें सम्मेलन की कार्यवाही|date=2002|pages=519–27 |isbn=978-1-55860-897-9 |arxiv=1301.0608 |bibcode=2013arXiv1301.0608T}}</ref><ref>{{cite journal|last1=Shpitser|first1=Ilya|last2=Pearl|first2=Judea|title=निष्क्रिय स्वतंत्रता|journal=Proceedings of AAAI|date=2008}}</ref><ref>{{cite journal|last1=Chen|first1=Bryant|last2=Pearl|first2=Judea|title=रैखिक संरचनात्मक समीकरण मॉडल के परीक्षण योग्य निहितार्थ|journal=Proceedings of AAAI|date=2014|volume=28 |doi=10.1609/aaai.v28i1.9065 |s2cid=1612893 |url=https://ojs.aaai.org/index.php/AAAI/article/download/9065/8924|doi-access=free}}</ref> बाहरी वैधता के लिए परीक्षण,<ref>{{cite journal|last1=Bareinmboim|first1=Elias|last2=Pearl|first2=Judea|title=External Validity: From do-calculus to Transportability across Populations|journal=Statistical Science|date=2014|doi=10.1214/14-sts486|volume=29|issue=4|pages=579–595|arxiv=1503.01603|s2cid=5586184 }}</ref> और लापता डेटा का प्रबंधन करें<ref>{{cite journal|last1=Mohan|first1=Karthika|last2=Pearl|first2=Judea|last3=Tian|first3=Jin|title=गुम डेटा के साथ अनुमान के लिए ग्राफिकल मॉडल|journal=Advances in Neural Information Processing Systems|date=2013|url=https://proceedings.neurips.cc/paper/2013/file/0ff8033cf9437c213ee13937b1c4c455-Paper.pdf}}</ref> और चयन पूर्वाग्रह है ।<ref>{{cite journal|last1=Bareinboim|first1=Elias|last2=Tian|first2=Jin|last3=Pearl|first3=Judea|title=कारण और सांख्यिकीय अनुमान में चयन पूर्वाग्रह से उबरना|journal=Proceedings of AAAI|date=2014|volume=28 |doi=10.1609/aaai.v28i1.9074 |url=https://ojs.aaai.org/index.php/AAAI/article/view/9074/8933|doi-access=free}}</ref>
Line 7: Line 7:
कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का उत्तर देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से Y से जुड़े चर को Y के पेरेंट्स या Y के प्रत्यक्ष कारण कहा जाता है, और इन्हें ''Pa(Y)'' द्वारा निरूपित किया जाता है।
कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का उत्तर देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से Y से जुड़े चर को Y के पेरेंट्स या Y के प्रत्यक्ष कारण कहा जाता है, और इन्हें ''Pa(Y)'' द्वारा निरूपित किया जाता है।


 
आकस्मिक मॉडल में अधिकांशतः त्रुटि शब्द या छोड़े गए कारक सम्मिलित होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब ''Pa(Y)'' को स्थिर रखा जाता है। अधिकत्तर स्थितियों में, त्रुटि नियमो को ग्राफ़ से बाहर रखा गया है। चूँकि यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि नियम निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि नियमो के बीच उत्पन्न करते हैं जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।
'''आकस्मिक मॉडल में अ'''क्सर त्रुटि शब्द या छोड़े गए कारक शामिल होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब Pa(Y) को स्थिर रखा जाता है। ज्यादातर मामलों में, त्रुटि शर्तों को ग्राफ़ से बाहर रखा गया है। हालाँकि, यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि शर्तें निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि शर्तों के बीच उत्पन्न करते हैं, जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।


== मौलिक उपकरण ==
== मौलिक उपकरण ==


ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क#डी-सेपरेशन|डी-सेपरेशन है, जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि शर्तों के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये सशर्त स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।<ref>{{cite journal|last1=Geiger|first1=Dan|last2=Pearl|first2=Judea|title=सशर्त स्वतंत्रता के तार्किक और एल्गोरिथम गुण|journal=Annals of Statistics|date=1993|volume=21|issue=4|pages=2001–2021|doi=10.1214/aos/1176349407|citeseerx=10.1.1.295.2043}}</ref>
ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क या डी-सेपरेशन है जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि नियमो के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये नियमबद्द स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।<ref>{{cite journal|last1=Geiger|first1=Dan|last2=Pearl|first2=Judea|title=सशर्त स्वतंत्रता के तार्किक और एल्गोरिथम गुण|journal=Annals of Statistics|date=1993|volume=21|issue=4|pages=2001–2021|doi=10.1214/aos/1176349407|citeseerx=10.1.1.295.2043}}</ref>
 
== उदाहरण                                                                                                         ==
 
== उदाहरण ==


मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं, और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित [[संरचनात्मक समीकरण मॉडल]] (SEM) विनिर्देश में व्यक्त किया जा सकता है।
मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित [[संरचनात्मक समीकरण मॉडल]] (एसईएम) विनिर्देश में व्यक्त किया जा सकता है।


मॉडल 1
मॉडल 1
Line 28: Line 25:
S &= b \cdot C + e \cdot Q_2 + U_4,
S &= b \cdot C + e \cdot Q_2 + U_4,
\end{align}</math>
\end{align}</math>
कहाँ <math>Q_1</math> कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, <math>Q_2</math> कॉलेज के बाद योग्यता का प्रतिनिधित्व करता है, <math>C</math> कॉलेज में भाग लेने की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ शामिल हैं, और <math>S</math> व्यक्ति का वेतन।
जहाँ <math>Q_1</math> कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, <math>Q_2</math> कॉलेज के बाद की योग्यता का प्रतिनिधित्व करता है, <math>C</math> में सम्मिलित कॉलेज की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ होती हैं और <math>S</math> व्यक्ति का वेतन होता है।


[[File:College notID.png|thumb|चित्र 1: अव्यक्त चर के साथ अज्ञात मॉडल (<math>Q_1</math> और <math> Q_2 </math>) स्पष्ट रूप से दिखाया गया]]
[[File:College notID.png|thumb|चित्र 1: अव्यक्त चर के साथ अज्ञात मॉडल (<math>Q_1</math> और <math> Q_2 </math>) स्पष्ट रूप से दिखाया गया]]
[[File:College notID proj.png|thumb|चित्र 2: अव्यक्त चरों के साथ अज्ञात मॉडल का सारांश]]चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक वेरिएबल में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त, प्रत्येक समीकरण के लिए, स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ मामलों में, हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।
[[File:College notID proj.png|thumb|चित्र 2: अव्यक्त चरों के साथ अज्ञात मॉडल का सारांश]]चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक चर में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त प्रत्येक समीकरण के लिए स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ स्थितियों में हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।


अगर <math>Q_1</math> और <math>Q_2</math> अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है <math>C</math> और <math>S</math> उनकी त्रुटि शर्तों के लिए जिम्मेदार ठहराया जा सकता है। उन्हें हटाकर, हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:
यदि <math>Q_1</math> और <math>Q_2</math> अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है <math>C</math> और <math>S</math> उनकी त्रुटि नियमो के लिए उत्तरदाई ठहराया जा सकता है। उन्हें हटाकर हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:


मॉडल 2
मॉडल 2
Line 42: Line 39:
S &= \beta C + U_S
S &= \beta C + U_S
\end{align}</math>
\end{align}</math>
मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि की जानकारी का अर्थ है कि त्रुटि शब्द <math>S</math>, <math>U_S</math>, C के साथ सहसंबद्ध है{{'s}} त्रुटिपूर्ण शर्त, <math>U_C</math>. नतीजतन, हम चित्रा 2 में एस और सी के बीच एक द्विपक्षीय चाप जोड़ते हैं।
मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि जानकारी का अर्थ है कि <math>S</math> <math>U_S</math> का त्रुटि शब्द, C के त्रुटि शब्द <math>U_C</math> के साथ सहसंबद्ध है। परिणामस्वरूप हम चित्र 2 में S और C के बीच एक द्विदिश चाप जोड़ते हैं।


[[File:College.png|thumb|चित्र 3: अव्यक्त चर के साथ पहचाना गया मॉडल (<math>Q_1</math> और <math> Q_2 </math>) स्पष्ट रूप से दिखाया गया]]
[[File:College.png|thumb|चित्र 3: अव्यक्त चर के साथ पहचाना गया मॉडल (<math>Q_1</math> और <math> Q_2 </math>) स्पष्ट रूप से दिखाया गया]]
[[File:College proj.png|thumb|चित्र 4: अव्यक्त चरों के साथ पहचाने गए मॉडल का सारांश]]तब से <math>U_S</math> से सहसम्बन्धित है <math>U_C</math> और इसलिए, <math>C</math>, <math>C</math> [[अंतर्जात]] है और <math>\beta</math> मॉडल 2 में पहचाना नहीं गया है। हालांकि, अगर हम किसी व्यक्ति के कॉलेज आवेदन की ताकत शामिल करते हैं, <math>A</math>, जैसा चित्र 3 में दिखाया गया है, हम निम्नलिखित मॉडल प्राप्त करते हैं:
[[File:College proj.png|thumb|चित्र 4: अव्यक्त चरों के साथ पहचाने गए मॉडल का सारांश]]
 
 
चूँकि <math>U_S</math> , <math>U_C</math> के साथ सहसंबद्ध है और इसलिए, <math>C</math>, <math>C</math>अंतर्जात है और <math>\beta</math> को मॉडल 2 में पहचाना नहीं गया है। चूँकि यदि हम किसी व्यक्ति के कॉलेज आवेदन<math>A</math> की ताकत को सम्मिलित करते हैं जैसा कि चित्र 3 में दिखाया गया है निम्नलिखित मॉडल प्राप्त करें:


मॉडल 3
मॉडल 3
Line 67: Line 67:
S &= \beta \cdot C + U_S,
S &= \beta \cdot C + U_S,
\end{align}</math>
\end{align}</math>
साथ <math>U_A</math> से सम्बंधित <math>U_S</math>.
<math>U_A</math> के साथ <math>U_S</math> के साथ सहसंबद्ध।
 
अब, <math>\beta</math> की पहचान की जाती है और के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है <math>S</math> पर <math>C</math> और <math>A</math>. इसे सिंगल-डोर मानदंड का उपयोग करके सत्यापित किया जा सकता है,<ref name=causality /><ref>{{cite journal|last1=Chen|first1=B.|last2=Pearl|first2=J|title=रेखीय संरचनात्मक समीकरण मॉडलिंग के लिए चित्रमय उपकरण|journal=Technical Report|date=2014|url=https://apps.dtic.mil/sti/pdfs/ADA609131.pdf}}</ref> एक संरचनात्मक गुणांक की पहचान के लिए एक आवश्यक और पर्याप्त चित्रमय स्थिति, जैसे <math>\beta</math>, प्रतिगमन का उपयोग करना।


{{clear}}
अब, <math>\beta</math> की पहचान की गई है और <math>C</math> और <math>A</math> पर <math>S</math> के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है। इसे एकल-द्वार मानदंड का उपयोग करके सत्यापित किया जा सकता है<ref name=causality /> <ref>{{cite journal|last1=Chen|first1=B.|last2=Pearl|first2=J|title=रेखीय संरचनात्मक समीकरण मॉडलिंग के लिए चित्रमय उपकरण|journal=Technical Report|date=2014|url=https://apps.dtic.mil/sti/pdfs/ADA609131.pdf}}</ref> एक संरचनात्मक गुणांक की पहचान के लिए एक आवश्यक और पर्याप्त चित्रमय स्थिति जैसे <math>\beta</math> प्रतिगमन का उपयोग करना है ।


==संदर्भ==
==संदर्भ==
{{reflist}}
{{reflist}}
[[Category: ग्राफिकल मॉडल]]


[[Category: Machine Translated Page]]
[[Category:Created On 18/05/2023]]
[[Category:Created On 18/05/2023]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:ग्राफिकल मॉडल]]

Latest revision as of 15:46, 14 June 2023

सांख्यिकी अर्थमिति महामारी विज्ञान आनुवंशिकी और संबंधित विषयों में, कारण रेखांकन (पथ विश्लेषण (सांख्यिकी) के रूप में भी जाना जाता है, कारण बायेसियन नेटवर्क या निर्देशित अचक्रीय ग्राफ ) ग्राफिकल मॉडल हैं जिनका उपयोग डेटा-जनरेटिंग प्रक्रिया के बारे में मान्यताओं को एनकोड करने के लिए किया जाता है।

संचार और अनुमान के लिए कारण रेखांकन का उपयोग किया जा सकता है। वे कारण तर्क के अन्य रूपों के पूरक हैं उदाहरण के लिए कारण समानता संकेतन का उपयोग करना संचार उपकरणों के रूप में रेखांकन उन कारणात्मक मान्यताओं का औपचारिक और पारदर्शी प्रतिनिधित्व प्रदान करता है जो शोधकर्ता संप्रेषित और बचाव करना चाहते हैं। अनुमान उपकरण के रूप में ग्राफ़ शोधकर्ताओं को गैर-प्रयोगात्मक डेटा से प्रभाव के आकार का अनुमान लगाने में सक्षम बनाता है,[1][2][3][4][5] एन्कोडेड मान्यताओं के परीक्षण योग्य निहितार्थ प्राप्त करें,[1][6][7][8] बाहरी वैधता के लिए परीक्षण,[9] और लापता डेटा का प्रबंधन करें[10] और चयन पूर्वाग्रह है ।[11]

रूब्रिक "पथ आरेख" के तहत अनुवांशिकी विज्ञानी सीवेल राइट द्वारा कारणात्मक रेखांकन का पहली बार उपयोग किया गया था[12]। उन्हें बाद में सामाजिक वैज्ञानिकों द्वारा और कुछ सीमा तक अर्थशास्त्रियों द्वारा अपनाया गया।[13][14][15][16][17][18] ये मॉडल प्रारंभ में निश्चित मापदंडों के साथ रैखिक समीकरणों तक ही सीमित थे।[19] आधुनिक विकास ने ग्राफिकल मॉडल को गैर-पैरामीट्रिक विश्लेषण तक विस्तारित किया है और इस प्रकार एक सामान्यता और लचीलापन प्राप्त किया है जिसने कंप्यूटर विज्ञान महामारी विज्ञान और सामाजिक विज्ञान में कारण विश्लेषण को बदल दिया है।[20][21]

निर्माण और शब्दावली

कारणात्मक ग्राफ निम्न प्रकार से खींचा जा सकता है। मॉडल में प्रत्येक चर में एक संबंधित शीर्ष या नोड होता है और एक तीर को एक चर X से एक चर Y तक खींचा जाता है जब भी Y को X में परिवर्तन का उत्तर देने के लिए आंका जाता है जब अन्य सभी चर को स्थिर रखा जाता है। प्रत्यक्ष तीरों के माध्यम से Y से जुड़े चर को Y के पेरेंट्स या Y के प्रत्यक्ष कारण कहा जाता है, और इन्हें Pa(Y) द्वारा निरूपित किया जाता है।

आकस्मिक मॉडल में अधिकांशतः त्रुटि शब्द या छोड़े गए कारक सम्मिलित होते हैं जो सभी अनमाने कारकों का प्रतिनिधित्व करते हैं जो एक चर Y को प्रभावित करते हैं जब Pa(Y) को स्थिर रखा जाता है। अधिकत्तर स्थितियों में, त्रुटि नियमो को ग्राफ़ से बाहर रखा गया है। चूँकि यदि ग्राफ़ लेखक को संदेह है कि किन्हीं दो चरों की त्रुटि नियम निर्भर हैं (उदाहरण के लिए दो चरों का एक अप्रमाणित या अव्यक्त सामान्य कारण है) तो उनके बीच एक द्विदिश चाप खींचा जाता है। इस प्रकार, अव्यक्त चर की उपस्थिति को उन सहसंबंधों के माध्यम से ध्यान में रखा जाता है जो वे त्रुटि नियमो के बीच उत्पन्न करते हैं जैसा कि द्विदिश चापों द्वारा दर्शाया गया है।

मौलिक उपकरण

ग्राफिकल विश्लेषण में एक मौलिक उपकरण बायेसियन नेटवर्क या डी-सेपरेशन है जो शोधकर्ताओं को निरीक्षण द्वारा यह निर्धारित करने की अनुमति देता है कि क्या कारण संरचना का अर्थ है कि चर के दो सेट एक तीसरे सेट को देखते हुए स्वतंत्र हैं। सहसंबद्ध त्रुटि नियमो के बिना पुनरावर्ती मॉडल में (कभी-कभी मार्कोवियन कहा जाता है), ये नियमबद्द स्वतंत्रता मॉडल के सभी परीक्षण योग्य प्रभावों का प्रतिनिधित्व करती हैं।[22]

उदाहरण

मान लीजिए हम भविष्य की कमाई पर एक विशिष्ट कॉलेज में भाग लेने के प्रभाव का अनुमान लगाना चाहते हैं। केवल कॉलेज रेटिंग पर आय को कम करने से लक्ष्य प्रभाव का निष्पक्ष अनुमान नहीं मिलेगा क्योंकि कुलीन कॉलेज अत्यधिक चयनात्मक होते हैं और उनमें भाग लेने वाले छात्रों के पास स्कूल जाने से पहले उच्च कमाई वाली नौकरियों के लिए योग्यता होने की संभावना होती है। यह मानते हुए कि कारण संबंध रैखिक हैं, यह पृष्ठभूमि ज्ञान निम्नलिखित संरचनात्मक समीकरण मॉडल (एसईएम) विनिर्देश में व्यक्त किया जा सकता है।

मॉडल 1

जहाँ कॉलेज से पहले व्यक्ति की योग्यता का प्रतिनिधित्व करता है, कॉलेज के बाद की योग्यता का प्रतिनिधित्व करता है, में सम्मिलित कॉलेज की गुणवत्ता का प्रतिनिधित्व करने वाली विशेषताएँ होती हैं और व्यक्ति का वेतन होता है।

चित्र 1: अव्यक्त चर के साथ अज्ञात मॉडल ( और ) स्पष्ट रूप से दिखाया गया
चित्र 2: अव्यक्त चरों के साथ अज्ञात मॉडल का सारांश

चित्रा 1 एक कारणात्मक ग्राफ है जो इस मॉडल विनिर्देश का प्रतिनिधित्व करता है। मॉडल के प्रत्येक चर में ग्राफ़ में संबंधित नोड या वर्टेक्स होता है। इसके अतिरिक्त प्रत्येक समीकरण के लिए स्वतंत्र चर से आश्रित चर के लिए तीर खींचे जाते हैं। ये तीर कार्य-कारण की दिशा को दर्शाते हैं। कुछ स्थितियों में हम तीर को इसके संबंधित संरचनात्मक गुणांक के साथ चित्र 1 में लेबल कर सकते हैं।

यदि और अप्राप्य या अव्यक्त चर हैं जिन पर उनका प्रभाव है और उनकी त्रुटि नियमो के लिए उत्तरदाई ठहराया जा सकता है। उन्हें हटाकर हम निम्नलिखित मॉडल विनिर्देश प्राप्त करते हैं:

मॉडल 2

मॉडल 1 द्वारा निर्दिष्ट पृष्ठभूमि जानकारी का अर्थ है कि का त्रुटि शब्द, C के त्रुटि शब्द के साथ सहसंबद्ध है। परिणामस्वरूप हम चित्र 2 में S और C के बीच एक द्विदिश चाप जोड़ते हैं।

चित्र 3: अव्यक्त चर के साथ पहचाना गया मॉडल ( और ) स्पष्ट रूप से दिखाया गया
चित्र 4: अव्यक्त चरों के साथ पहचाने गए मॉडल का सारांश


चूँकि , के साथ सहसंबद्ध है और इसलिए, , अंतर्जात है और को मॉडल 2 में पहचाना नहीं गया है। चूँकि यदि हम किसी व्यक्ति के कॉलेज आवेदन की ताकत को सम्मिलित करते हैं जैसा कि चित्र 3 में दिखाया गया है निम्नलिखित मॉडल प्राप्त करें:

मॉडल 3

हम प्राप्त मॉडल विनिर्देश से अव्यक्त चर को हटाकर:

मॉडल 4

के साथ के साथ सहसंबद्ध।

अब, की पहचान की गई है और और पर के प्रतिगमन का उपयोग करके अनुमान लगाया जा सकता है। इसे एकल-द्वार मानदंड का उपयोग करके सत्यापित किया जा सकता है[1] [23] एक संरचनात्मक गुणांक की पहचान के लिए एक आवश्यक और पर्याप्त चित्रमय स्थिति जैसे प्रतिगमन का उपयोग करना है ।

संदर्भ

  1. 1.0 1.1 1.2 Pearl, Judea (2000). करणीय संबंध. Cambridge, MA: MIT Press. ISBN 9780521773621.
  2. Tian, Jin; Pearl, Judea (2002). "A general identification condition for causal effects". आर्टिफिशियल इंटेलिजेंस पर अठारहवें राष्ट्रीय सम्मेलन की कार्यवाही. ISBN 978-0-262-51129-2.
  3. Shpitser, Ilya; Pearl, Judea (2008). "कारण पदानुक्रम के लिए पूर्ण पहचान के तरीके" (PDF). Journal of Machine Learning Research. 9: 1941–1979.
  4. Huang, Y.; Valtorta, M. (2006). "Identifiability in causal bayesian networks: A sound and complete algorithm" (PDF). Proceedings of AAAI.
  5. Bareinboim, Elias; Pearl, Judea (2012). "Causal Inference by Surrogate Experiments: z-Identifiability". आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर ट्वेंटी-आठवें सम्मेलन की कार्यवाही. arXiv:1210.4842. Bibcode:2012arXiv1210.4842B. ISBN 978-0-9749039-8-9.
  6. Tian, Jin; Pearl, Judea (2002). "On the Testable Implications of Causal Models with Hidden Variables". आर्टिफिशियल इंटेलिजेंस में अनिश्चितता पर अठारहवें सम्मेलन की कार्यवाही. pp. 519–27. arXiv:1301.0608. Bibcode:2013arXiv1301.0608T. ISBN 978-1-55860-897-9.
  7. Shpitser, Ilya; Pearl, Judea (2008). "निष्क्रिय स्वतंत्रता". Proceedings of AAAI.
  8. Chen, Bryant; Pearl, Judea (2014). "रैखिक संरचनात्मक समीकरण मॉडल के परीक्षण योग्य निहितार्थ". Proceedings of AAAI. 28. doi:10.1609/aaai.v28i1.9065. S2CID 1612893.
  9. Bareinmboim, Elias; Pearl, Judea (2014). "External Validity: From do-calculus to Transportability across Populations". Statistical Science. 29 (4): 579–595. arXiv:1503.01603. doi:10.1214/14-sts486. S2CID 5586184.
  10. Mohan, Karthika; Pearl, Judea; Tian, Jin (2013). "गुम डेटा के साथ अनुमान के लिए ग्राफिकल मॉडल" (PDF). Advances in Neural Information Processing Systems.
  11. Bareinboim, Elias; Tian, Jin; Pearl, Judea (2014). "कारण और सांख्यिकीय अनुमान में चयन पूर्वाग्रह से उबरना". Proceedings of AAAI. 28. doi:10.1609/aaai.v28i1.9074.
  12. Wright, S. (1921). "सहसंबंध और करणीय". Journal of Agricultural Research. 20: 557–585.
  13. Blalock, H. M. (1960). "सहसंबंध विश्लेषण और कारण निष्कर्ष". American Anthropologist. 62 (4): 624–631. doi:10.1525/aa.1960.62.4.02a00060.
  14. Duncan, O. D. (1966). "Path analysis: Sociological examples". American Journal of Sociology. 72: 1–16. doi:10.1086/224256. S2CID 59428866.
  15. Duncan, O. D. (1976). "संरचनात्मक समीकरण मॉडल का परिचय". American Journal of Sociology. 82 (3): 731–733. doi:10.1086/226377.
  16. Jöreskog, K. G. (1969). "अधिकतम संभावना कारक विश्लेषण की पुष्टि करने के लिए एक सामान्य दृष्टिकोण". Psychometrika. 34 (2): 183–202. doi:10.1007/bf02289343. S2CID 186236320.
  17. Goldberger, A. S.; Duncan, O. D. (1973). सामाजिक विज्ञान में संरचनात्मक समीकरण मॉडल. New York: Seminar Press.
  18. Goldberger, A. S. (1972). "सामाजिक विज्ञान में संरचनात्मक समीकरण मॉडल". Econometrica. 40 (6): 979–1001. doi:10.2307/1913851. JSTOR 1913851.
  19. White, Halbert; Chalak, Karim; Lu, Xun (2011). "सेटटेबल सिस्टम के साथ ग्रेंजर कारणता और मोती कारण मॉडल को जोड़ना" (PDF). Causality in Time Series Challenges in Machine Learning. 5.
  20. Rothman, Kenneth J.; Greenland, Sander; Lash, Timothy (2008). आधुनिक महामारी विज्ञान. Lippincott Williams & Wilkins.
  21. Morgan, S. L.; Winship, C. (2007). Counterfactuals and causal inference: Methods and principles for social research. New York: Cambridge University Press.
  22. Geiger, Dan; Pearl, Judea (1993). "सशर्त स्वतंत्रता के तार्किक और एल्गोरिथम गुण". Annals of Statistics. 21 (4): 2001–2021. CiteSeerX 10.1.1.295.2043. doi:10.1214/aos/1176349407.
  23. Chen, B.; Pearl, J (2014). "रेखीय संरचनात्मक समीकरण मॉडलिंग के लिए चित्रमय उपकरण" (PDF). Technical Report.