बायेसियन सांख्यिकी: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 2: Line 2:
{{Bayesian statistics}}
{{Bayesian statistics}}


बायेसियन सांख्यिकी बायेसियन संभाव्यता पर आधारित सांख्यिकी के क्षेत्र में एक सिद्धांत है जहां संभाव्यता एक घटना ([[संभावना|प्रायिकता]] सिद्धांत) में ''धारणा का परिमाण'' व्यक्त करती है। धारणा का परिमाण घटना के बारे में पूर्व ज्ञान पर आधारित हो सकती है, जैसे कि पिछले प्रयोगों के परिणाम, या घटना के बारे में व्यक्तिगत धारणाओं पर यह कई अन्य प्रायिकता व्याख्याओं से भिन्न है | जैसे फ़्रीक्वेंटिस्ट प्रायिकता व्याख्या जो प्रायिकता को कई परीक्षणों के बाद किसी घटना की सापेक्ष आवृत्ति के [[अनुक्रम की सीमा]] के रूप में देखती है।<ref name="bda">{{Cite book|last1=Gelman|first1=Andrew|title=बायेसियन डेटा विश्लेषण|edition=Third|last2=Carlin|first2=John B.|last3=Stern|first3=Hal S.|last4=Dunson|first4=David B.|last5=Vehtari|first5=Aki|last6=Rubin|first6=Donald B.|publisher=Chapman and Hall/CRC|year=2013|isbn=978-1-4398-4095-5|author-link1=Andrew Gelman|author-link2=John Carlin (professor)|author-link6=Donald Rubin}}</ref>
बायेसियन सांख्यिकी बायेसियन संभाव्यता पर आधारित सांख्यिकी के क्षेत्र में सिद्धांत है जहां संभाव्यता घटना ([[संभावना|प्रायिकता]] सिद्धांत) में ''धारणा का परिमाण'' व्यक्त करती है। धारणा का परिमाण घटना के बारे में पूर्व ज्ञान पर आधारित हो सकती है, जैसे कि पिछले प्रयोगों के परिणाम, या घटना के बारे में व्यक्तिगत धारणाओं पर यह कई अन्य प्रायिकता व्याख्याओं से भिन्न है। जैसे फ़्रीक्वेंटिस्ट प्रायिकता व्याख्या जो प्रायिकता को कई परीक्षणों के बाद किसी घटना की सापेक्ष आवृत्ति के [[अनुक्रम की सीमा]] के रूप में देखती है।<ref name="bda">{{Cite book|last1=Gelman|first1=Andrew|title=बायेसियन डेटा विश्लेषण|edition=Third|last2=Carlin|first2=John B.|last3=Stern|first3=Hal S.|last4=Dunson|first4=David B.|last5=Vehtari|first5=Aki|last6=Rubin|first6=Donald B.|publisher=Chapman and Hall/CRC|year=2013|isbn=978-1-4398-4095-5|author-link1=Andrew Gelman|author-link2=John Carlin (professor)|author-link6=Donald Rubin}}</ref>
 
बायेसियन सांख्यिकीय विधियां नया डेटा प्राप्त करने के बाद संभावनाओं की गणना और अद्यतन करने के लिए बेयस प्रमेय का उपयोग करती हैं। बेयस प्रमेय डेटा के साथ-साथ घटना या घटना से संबंधित स्थितियों के बारे में पूर्व सूचना या मान्यताओं के आधार पर किसी घटना की सशर्त प्रायिकता का वर्णन करता है।<ref name="rethinking">{{Cite book| title = Statistical Rethinking : A Bayesian Course with Examples in R and Stan |edition=2nd | publisher = Chapman and Hall/CRC | year = 2020 | isbn = 978-0-367-13991-9 |last1=McElreath|first1=Richard|author-link1=Richard McElreath}}</ref><ref>{{cite book |first=John |last=Kruschke |author-link=John K. Kruschke |title=Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan |location= |publisher=Academic Press |edition=2nd |year=2014 |isbn=978-0-12-405888-0 }}</ref> उदाहरण के लिए, बायेसियन निष्कर्ष में, बेयस प्रमेय का उपयोग संभाव्यता वितरण या [[सांख्यिकीय मॉडल]] के मापदंडो का निष्कर्ष लगाने के लिए किया जा सकता है। चूंकि बेयसियन सांख्यिकी संभाव्यता को धारणा का परिमाण के रूप में मानते हैं, बेयस प्रमेय सीधे एक संभाव्यता वितरण प्रदान कर सकता है जो मापदंड या मापदंड के समुच्चय को धारणा को मापता है।<ref name="bda" /><ref name="rethinking" />
 
बायेसियन सांख्यिकी का नाम [[थॉमस बेयस]] के नाम पर रखा गया है | जिन्होंने 1763 में प्रकाशित डॉक्ट्रिन ऑफ चांस में एक समस्या को हल करने की दिशा में एक निबंध में बेयस प्रमेय का एक विशिष्ट स्थिति तैयार किया था। लाप्लास ने संभाव्यता की बायेसियन व्याख्या विकसित की थी।<ref>{{Cite book| title = The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy |edition=First | publisher = Chapman and Hall/CRC | year = 2012 | isbn = 978-0-3001-8822-6|last1=McGrayne|first1=Sharon|author-link1=Richard McElreath}}</ref> लाप्लास ने कई सांख्यिकीय समस्याओं को हल करने के लिए उन विधियों का उपयोग किया जिन्हें अब बायेसियन माना जाता है। कई बायेसियन विधियों को बाद के लेखकों द्वारा विकसित किया गया था | किन्तु 1950 के दशक तक इस तरह के विधियों का वर्णन करने के लिए सामान्यतः इस शब्द का उपयोग नहीं किया गया था। 20वीं शताब्दी के अधिकांश समय के पश्चात्, दार्शनिक और व्यावहारिक विचारों के कारण कई सांख्यिकीविदों द्वारा बायेसियन विधियों को प्रतिकूल रूप से देखा गया था। कई बायेसियन विधियों को पूरा करने के लिए बहुत अधिक संगणना की आवश्यकता होती है, और शताब्दी के पश्चात् व्यापक रूप से उपयोग की जाने वाली अधिकांश विधियाँ बारंबारतावादी व्याख्या पर आधारित थीं। चूँकि, [[मार्कोव चेन मोंटे कार्लो]] जैसे शक्तिशाली कंप्यूटरों और नए [[कलन विधि]] के आगमन के साथ, 21वीं सदी में बायेसियन विधियों का सांख्यिकी में उपयोग बढ़ता हुआ देखा गया है।<ref name="bda" /><ref>{{cite journal |last1=Fienberg |first1=Stephen E. |title=When Did Bayesian Inference Become "Bayesian"? |date=2006|journal=Bayesian Analysis|volume=1|issue=1|pages=1–40 |doi=10.1214/06-BA101 |doi-access=free }}</ref>
 


बायेसियन सांख्यिकीय विधियां नया डेटा प्राप्त करने के बाद संभावनाओं की गणना और अद्यतन करने के लिए बेयस प्रमेय का उपयोग करती हैं। बेयस प्रमेय डेटा के साथ-साथ घटना या घटना से संबंधित स्थितियों के बारे में पूर्व सूचना या मान्यताओं के आधार पर किसी घटना की सशर्त प्रायिकता का वर्णन करता है।<ref name="rethinking">{{Cite book| title = Statistical Rethinking : A Bayesian Course with Examples in R and Stan |edition=2nd | publisher = Chapman and Hall/CRC | year = 2020 | isbn = 978-0-367-13991-9 |last1=McElreath|first1=Richard|author-link1=Richard McElreath}}</ref><ref>{{cite book |first=John |last=Kruschke |author-link=John K. Kruschke |title=Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan |location= |publisher=Academic Press |edition=2nd |year=2014 |isbn=978-0-12-405888-0 }}</ref> उदाहरण के लिए, बायेसियन निष्कर्ष में, बेयस प्रमेय का उपयोग संभाव्यता वितरण या [[सांख्यिकीय मॉडल]] के मापदंडो का निष्कर्ष लगाने के लिए किया जा सकता है। चूंकि बेयसियन सांख्यिकी संभाव्यता को धारणा का परिमाण के रूप में मानते हैं, बेयस प्रमेय सीधे संभाव्यता वितरण प्रदान कर सकता है जो मापदंड या मापदंड के समुच्चय को धारणा को मापता है।<ref name="bda" /><ref name="rethinking" />


बायेसियन सांख्यिकी का नाम [[थॉमस बेयस]] के नाम पर रखा गया है। जिन्होंने 1763 में प्रकाशित डॉक्ट्रिन ऑफ चांस में समस्या को हल करने की दिशा में निबंध में बेयस प्रमेय का विशिष्ट स्थिति तैयार किया था। लाप्लास ने संभाव्यता की बायेसियन व्याख्या विकसित की थी।<ref>{{Cite book| title = The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy |edition=First | publisher = Chapman and Hall/CRC | year = 2012 | isbn = 978-0-3001-8822-6|last1=McGrayne|first1=Sharon|author-link1=Richard McElreath}}</ref> लाप्लास ने कई सांख्यिकीय समस्याओं को हल करने के लिए उन विधियों का उपयोग किया जिन्हें अब बायेसियन माना जाता है। कई बायेसियन विधियों को बाद के लेखकों द्वारा विकसित किया गया था। किन्तु 1950 के दशक तक इस तरह के विधियों का वर्णन करने के लिए सामान्यतः इस शब्द का उपयोग नहीं किया गया था। 20वीं शताब्दी के अधिकांश समय के पश्चात्, दार्शनिक और व्यावहारिक विचारों के कारण कई सांख्यिकीविदों द्वारा बायेसियन विधियों को प्रतिकूल रूप से देखा गया था। कई बायेसियन विधियों को पूरा करने के लिए बहुत अधिक संगणना की आवश्यकता होती है, और शताब्दी के पश्चात् व्यापक रूप से उपयोग की जाने वाली अधिकांश विधियाँ बारंबारतावादी व्याख्या पर आधारित थीं। चूँकि, [[मार्कोव चेन मोंटे कार्लो]] जैसे शक्तिशाली कंप्यूटरों और नए [[कलन विधि]] के आगमन के साथ, 21वीं सदी में बायेसियन विधियों का सांख्यिकी में उपयोग बढ़ता हुआ देखा गया है।<ref name="bda" /><ref>{{cite journal |last1=Fienberg |first1=Stephen E. |title=When Did Bayesian Inference Become "Bayesian"? |date=2006|journal=Bayesian Analysis|volume=1|issue=1|pages=1–40 |doi=10.1214/06-BA101 |doi-access=free }}</ref>
== बेयस प्रमेय ==
== बेयस प्रमेय ==
{{Main|बेयस प्रमेय}}
{{Main|बेयस प्रमेय}}


बेयस प्रमेय का उपयोग बायेसियन विधियों में संभावनाओं को अद्यतन करने के लिए किया जाता है, जो नए डेटा प्राप्त करने के बाद धारणा का परिमाण हैं। दो घटनाओं <math>A</math> और <math>B</math> को देखते हुए <math>A</math> की सशर्त प्रायिकता दी गई है कि <math>B</math> सत्य है, इस प्रकार व्यक्त किया गया है | <ref name="grinsteadsnell2006">{{cite book |last1=Grinstead |first1=Charles M. |last2=Snell |first2=J. Laurie |title=संभाव्यता का परिचय|date=2006 |publisher=American Mathematical Society |location=Providence, RI |isbn=978-0-8218-9414-9 |edition=2nd}}</ref>
बेयस प्रमेय का उपयोग बायेसियन विधियों में संभावनाओं को अद्यतन करने के लिए किया जाता है, जो नए डेटा प्राप्त करने के बाद धारणा का परिमाण हैं। दो घटनाओं <math>A</math> और <math>B</math> को देखते हुए <math>A</math> की सशर्त प्रायिकता दी गई है कि <math>B</math> सत्य है, इस प्रकार व्यक्त किया गया है। <ref name="grinsteadsnell2006">{{cite book |last1=Grinstead |first1=Charles M. |last2=Snell |first2=J. Laurie |title=संभाव्यता का परिचय|date=2006 |publisher=American Mathematical Society |location=Providence, RI |isbn=978-0-8218-9414-9 |edition=2nd}}</ref>


<math display="block">P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}</math>
<math display="block">P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}</math>
जहां <math>P(B) \neq 0</math> चूँकि बेयस प्रमेय संभाव्यता सिद्धांत का एक मौलिक परिणाम है, किन्तु बायेसियन सांख्यिकी में इसकी एक विशिष्ट व्याख्या है। उपरोक्त समीकरण में, <math>A</math> सामान्यतः एक [[प्रस्ताव]] का प्रतिनिधित्व करता है (जैसे कथन है कि एक सिक्का पचास प्रतिशत समय पर सिर पर पड़ता है) और <math>B</math> प्रमाण का प्रतिनिधित्व करता है, या नया डेटा जिसे ध्यान में रखा जाना है (जैसे परिणाम सिक्का फ़्लिप की श्रृंखला)। <math>P(A)</math> <math>A</math> की [[पूर्व संभावना|पूर्व प्रायिकता]] है जो प्रमाण को ध्यान में रखे जाने से पहले <math>A</math> के बारे में किसी के विश्वास को व्यक्त करता है। पूर्व संभाव्यता भी <math>A</math>. <math>P(B \mid A)</math> के बारे में जानकारी की मात्रा निर्धारित कर सकती है, प्रायिकता कार्य है, जिसे प्रमाण <math>B</math> की प्रायिकता के रूप में व्याख्या किया जा सकता है कि <math>A</math> सच है। प्रायिकता यह निर्धारित करती है कि प्रमाण <math>B</math> किस सीमा तक प्रस्ताव का समर्थन करता है <math>A</math>. <math>P(A \mid B)</math> पश्च संभाव्यता है, प्रमाण <math>B</math> को ध्यान में रखने के बाद प्रस्ताव <math>A</math> की प्रायिकता नए प्रमाण <math>B</math> पर विचार करने के बाद अनिवार्य रूप से, बेयस प्रमेय किसी के पूर्व विश्वास <math>P(A)</math> को अद्यतन करता है |<ref name="bda" />
जहां <math>P(B) \neq 0</math> चूँकि बेयस प्रमेय संभाव्यता सिद्धांत का मौलिक परिणाम है, किन्तु बायेसियन सांख्यिकी में इसकी विशिष्ट व्याख्या है। उपरोक्त समीकरण में, <math>A</math> सामान्यतः [[प्रस्ताव]] का प्रतिनिधित्व करता है (जैसे कथन है कि एक सिक्का पचास प्रतिशत समय पर सिर पर पड़ता है) और <math>B</math> प्रमाण का प्रतिनिधित्व करता है, या नया डेटा जिसे ध्यान में रखा जाना है (जैसे परिणाम सिक्का फ़्लिप की श्रृंखला)। <math>P(A)</math> <math>A</math> की [[पूर्व संभावना|पूर्व प्रायिकता]] है जो प्रमाण को ध्यान में रखे जाने से पहले <math>A</math> के बारे में किसी के विश्वास को व्यक्त करता है। पूर्व संभाव्यता भी <math>A</math>. <math>P(B \mid A)</math> के बारे में जानकारी की मात्रा निर्धारित कर सकती है, प्रायिकता कार्य है, जिसे प्रमाण <math>B</math> की प्रायिकता के रूप में व्याख्या किया जा सकता है कि <math>A</math> सच है। प्रायिकता यह निर्धारित करती है कि प्रमाण <math>B</math> किस सीमा तक प्रस्ताव का समर्थन करता है <math>A</math>. <math>P(A \mid B)</math> पश्च संभाव्यता है, प्रमाण <math>B</math> को ध्यान में रखने के बाद प्रस्ताव <math>A</math> की प्रायिकता नए प्रमाण <math>B</math> पर विचार करने के बाद अनिवार्य रूप से, बेयस प्रमेय किसी के पूर्व विश्वास <math>P(A)</math> को अद्यतन करता है।<ref name="bda" />


प्रमाण की प्रायिकता <math>P(B)</math> कुल संभाव्यता के नियम का उपयोग करके गणना की जा सकती है। यदि <math>\{A_1, A_2, \dots, A_n\}</math> प्रतिरूप स्थान के [[एक सेट का विभाजन|एक समुच्चय का विभाजन]] है, जो एक प्रयोग के सभी परिणाम (संभाव्यता) का समुच्चय है, फिर,<ref name="bda" /><ref name="grinsteadsnell2006" />
प्रमाण की प्रायिकता <math>P(B)</math> कुल संभाव्यता के नियम का उपयोग करके गणना की जा सकती है। यदि <math>\{A_1, A_2, \dots, A_n\}</math> प्रतिरूप स्थान के [[एक सेट का विभाजन|एक समुच्चय का विभाजन]] है, जो एक प्रयोग के सभी परिणाम (संभाव्यता) का समुच्चय है, फिर,<ref name="bda" /><ref name="grinsteadsnell2006" />


<math display="block">P(B) = P(B \mid A_1)P(A_1) + P(B \mid A_2)P(A_2) + \dots + P(B \mid A_n)P(A_n) = \sum_i P(B \mid A_i)P(A_i)</math>
<math display="block">P(B) = P(B \mid A_1)P(A_1) + P(B \mid A_2)P(A_2) + \dots + P(B \mid A_n)P(A_n) = \sum_i P(B \mid A_i)P(A_i)</math>
जब अनंत संख्या में परिणाम हों तो कुल संभाव्यता के नियम का उपयोग करके <math>P(B)</math> की गणना करने के लिए सभी परिणामों को एकीकृत करना आवश्यक है। अधिकांशतः <math>P(B)</math> की गणना करना कठिन होता है क्योंकि गणना में रकम या इंटीग्रल सम्मिलित होते हैं जो मूल्यांकन करने के लिए समय लेने वाली होती हैं | इसलिए अधिकांशतः केवल पूर्व और संभावना के उत्पाद पर विचार किया जाता है क्योंकि प्रमाण उसी विश्लेषण में नहीं बदलते हैं। पश्च भाग इस उत्पाद के समानुपाती होता है | <ref name="bda" />
जब अनंत संख्या में परिणाम हों तो कुल संभाव्यता के नियम का उपयोग करके <math>P(B)</math> की गणना करने के लिए सभी परिणामों को एकीकृत करना आवश्यक है। अधिकांशतः <math>P(B)</math> की गणना करना कठिन होता है क्योंकि गणना में रकम या इंटीग्रल सम्मिलित होते हैं जो मूल्यांकन करने के लिए समय लेने वाली होती हैं | इसलिए अधिकांशतः केवल पूर्व और संभावना के उत्पाद पर विचार किया जाता है क्योंकि प्रमाण उसी विश्लेषण में नहीं बदलते हैं। पश्च भाग इस उत्पाद के समानुपाती होता है। <ref name="bda" />


<math display="block">P(A \mid B) \propto P(B \mid A)P(A)</math>
<math display="block">P(A \mid B) \propto P(B \mid A)P(A)</math>


अधिकतम एक पोस्टरियोरी, जो कि पोस्टीरियर का [[मोड (सांख्यिकी)]] है और अधिकांशतः [[गणितीय अनुकूलन]] विधियों का उपयोग करके बायेसियन आँकड़ों में गणना की जाती है, वही रहता है। मार्कोव श्रृंखला मोंटे कार्लो या परिवर्तनशील बायेसियन विधियों जैसे विधियों के साथ <math>P(B)</math> के स्पष्ट मान की गणना किए बिना भी पश्च का निष्कर्ष लगाया जा सकता है। <ref name="bda" />
अधिकतम पोस्टरियोरी, जो कि पोस्टीरियर का [[मोड (सांख्यिकी)]] है और अधिकांशतः [[गणितीय अनुकूलन]] विधियों का उपयोग करके बायेसियन आँकड़ों में गणना की जाती है, वही रहता है। मार्कोव श्रृंखला मोंटे कार्लो या परिवर्तनशील बायेसियन विधियों जैसे विधियों के साथ <math>P(B)</math> के स्पष्ट मान की गणना किए बिना भी पश्च का निष्कर्ष लगाया जा सकता है। <ref name="bda" />
== बायेसियन विधियों की रूपरेखा ==
== बायेसियन विधियों की रूपरेखा ==


सांख्यिकीय विधियों के सामान्य समुच्चय को कई गतिविधियों में विभाजित किया जा सकता है | जिनमें से कई विशेष बायेसियन संस्करण हैं।
सांख्यिकीय विधियों के सामान्य समुच्चय को कई गतिविधियों में विभाजित किया जा सकता है। जिनमें से कई विशेष बायेसियन संस्करण हैं।


=== बायेसियन निष्कर्ष ===
=== बायेसियन निष्कर्ष ===
{{Main|बायेसियन निष्कर्ष}}
{{Main|बायेसियन निष्कर्ष}}


बायेसियन निष्कर्ष सांख्यिकीय निष्कर्ष को संदर्भित करता है जहां संभाव्यता का उपयोग करके अनुमानों में अनिश्चितता की मात्रा निर्धारित की जाती है।<ref>{{Cite journal |last=Lee|first=Se Yoon|  title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|volume=51 |issue=6 |pages=1549–1568 |doi=10.1080/03610926.2021.1921214|arxiv=2008.01006|s2cid=220935477 }}</ref> मौलिक आवृत्तिवादी निष्कर्ष में, मॉडल [[पैरामीटर|मापदंड]] और परिकल्पना को निश्चित माना जाता है। प्रायिकतावादी निष्कर्ष में प्रायिकताओं को प्राचलों या परिकल्पनाओं के लिए निर्दिष्ट नहीं किया जाता है। उदाहरण के लिए, बारंबारतावादी निष्कर्ष में किसी घटना को स्पष्ट रूप से प्रायिकता निर्दिष्ट करने का कोई कारण नहीं होगा जो केवल एक बार हो सकती है, जैसे कि एक निष्पक्ष सिक्के के अगले फ्लिप का परिणाम चूँकि, यह कहना समझदारी होगी कि बड़ी संख्या के नियम के प्रमुखों का अनुपात सिक्का उछालने की संख्या बढ़ने पर आधा हो जाता है।<ref name="wakefield2013">{{cite book |last1=Wakefield |first1=Jon |title=बायेसियन और फ़्रीक्वेंटिस्ट रिग्रेशन के तरीके|date=2013 |publisher=Springer |location=New York, NY |isbn=978-1-4419-0924-4}}</ref>
बायेसियन निष्कर्ष सांख्यिकीय निष्कर्ष को संदर्भित करता है जहां संभाव्यता का उपयोग करके अनुमानों में अनिश्चितता की मात्रा निर्धारित की जाती है।<ref>{{Cite journal |last=Lee|first=Se Yoon|  title = Gibbs sampler and coordinate ascent variational inference: A set-theoretical review|journal=Communications in Statistics - Theory and Methods|year=2021|volume=51 |issue=6 |pages=1549–1568 |doi=10.1080/03610926.2021.1921214|arxiv=2008.01006|s2cid=220935477 }}</ref> मौलिक आवृत्तिवादी निष्कर्ष में, मॉडल [[पैरामीटर|मापदंड]] और परिकल्पना को निश्चित माना जाता है। प्रायिकतावादी निष्कर्ष में प्रायिकताओं को प्राचलों या परिकल्पनाओं के लिए निर्दिष्ट नहीं किया जाता है। उदाहरण के लिए, बारंबारतावादी निष्कर्ष में किसी घटना को स्पष्ट रूप से प्रायिकता निर्दिष्ट करने का कोई कारण नहीं होगा जो केवल एक बार हो सकती है, जैसे कि निष्पक्ष सिक्के के अगले फ्लिप का परिणाम चूँकि, यह कहना समझदारी होगी कि बड़ी संख्या के नियम के प्रमुखों का अनुपात सिक्का उछालने की संख्या बढ़ने पर आधा हो जाता है।<ref name="wakefield2013">{{cite book |last1=Wakefield |first1=Jon |title=बायेसियन और फ़्रीक्वेंटिस्ट रिग्रेशन के तरीके|date=2013 |publisher=Springer |location=New York, NY |isbn=978-1-4419-0924-4}}</ref>
 
[[सांख्यिकीय मॉडल]] सांख्यिकीय मान्यताओं और प्रक्रियाओं का एक समुच्चय निर्दिष्ट करते हैं | जो दर्शाते हैं कि प्रतिरूप डेटा कैसे उत्पन्न होता है। सांख्यिकीय मॉडल में कई मापदंड होते हैं जिन्हें संशोधित किया जा सकता है। उदाहरण के लिए, एक सिक्के को बर्नौली वितरण से प्रतिरूप के रूप में दर्शाया जा सकता है, जो दो संभावित परिणामों को मॉडल करता है। बर्नौली वितरण में एक परिणाम की प्रायिकता के समान एक एकल मापदंड है | जो अधिकतर स्थितियों में सिर पर उतरने की प्रायिकता है। बायेसियन निष्कर्ष में डेटा के लिए एक अच्छा मॉडल तैयार करना केंद्रीय है। अधिकतर स्थितियों में, मॉडल केवल वास्तविक प्रक्रिया का निष्कर्ष लगाते हैं, और डेटा को प्रभावित करने वाले कुछ कारकों को ध्यान में नहीं रख सकते हैं।<ref name="bda" /> बायेसियन निष्कर्ष में, प्रायिकताएं मॉडल पैरामीटर्स को असाइन की जा सकती हैं। मापदंडों को यादृच्छिक चर के रूप में दर्शाया जा सकता है। बायेसियन निष्कर्ष अधिक प्रमाण प्राप्त या ज्ञात होने के बाद संभावनाओं को अद्यतन करने के लिए बेयस प्रमेय का उपयोग करता है।<ref name="bda" /><ref name="congdon2014">{{cite book |last1=Congdon |first1=Peter |title=एप्लाइड बायेसियन मॉडलिंग|date=2014 |publisher=Wiley |isbn=978-1119951513 |edition=2nd}}</ref>
 
 


[[सांख्यिकीय मॉडल]] सांख्यिकीय मान्यताओं और प्रक्रियाओं का समुच्चय निर्दिष्ट करते हैं | जो दर्शाते हैं कि प्रतिरूप डेटा कैसे उत्पन्न होता है। सांख्यिकीय मॉडल में कई मापदंड होते हैं जिन्हें संशोधित किया जा सकता है। उदाहरण के लिए, एक सिक्के को बर्नौली वितरण से प्रतिरूप के रूप में दर्शाया जा सकता है, जो दो संभावित परिणामों को मॉडल करता है। बर्नौली वितरण में परिणाम की प्रायिकता के समान एकल मापदंड है। जो अधिकतर स्थितियों में सिर पर उतरने की प्रायिकता है। बायेसियन निष्कर्ष में डेटा के लिए अच्छा मॉडल तैयार करना केंद्रीय है। अधिकतर स्थितियों में, मॉडल केवल वास्तविक प्रक्रिया का निष्कर्ष लगाते हैं, और डेटा को प्रभावित करने वाले कुछ कारकों को ध्यान में नहीं रख सकते हैं।<ref name="bda" /> बायेसियन निष्कर्ष में, प्रायिकताएं मॉडल पैरामीटर्स को असाइन की जा सकती हैं। मापदंडों को यादृच्छिक चर के रूप में दर्शाया जा सकता है। बायेसियन निष्कर्ष अधिक प्रमाण प्राप्त या ज्ञात होने के बाद संभावनाओं को अद्यतन करने के लिए बेयस प्रमेय का उपयोग करता है।<ref name="bda" /><ref name="congdon2014">{{cite book |last1=Congdon |first1=Peter |title=एप्लाइड बायेसियन मॉडलिंग|date=2014 |publisher=Wiley |isbn=978-1119951513 |edition=2nd}}</ref>
=== सांख्यिकीय मॉडलिंग ===
=== सांख्यिकीय मॉडलिंग ===
बायेसियन आँकड़ों का उपयोग करते हुए सांख्यिकीय मॉडल के निर्माण में किसी भी अज्ञात मापदंडों के लिए [[पूर्व वितरण]] के विनिर्देश की आवश्यकता की पहचान करने की विशेषता है। वास्तव में, पूर्व वितरण के मापदंडों में स्वयं पूर्व वितरण हो सकते हैं, जिससे [[बायेसियन पदानुक्रमित मॉडलिंग]] हो सकती है |<ref name="KruschkeVanpaemel2015">{{cite book |last1=Kruschke|first1=J K|author-link1=John K. Kruschke |last2=Vanpaemel |first2=W |chapter=Bayesian Estimation in Hierarchical Models |pages=279–299 |title=कम्प्यूटेशनल और गणितीय मनोविज्ञान की ऑक्सफोर्ड हैंडबुक|editor-last1=Busemeyer |editor-first1=J R |editor-last2=Wang |editor-first2=Z |editor-last3=Townsend |editor-first3=J T |editor-last4=Eidels |editor-first4=A |year=2015 |publisher=Oxford University Press |url=https://jkkweb.sitehost.iu.edu/articles/KruschkeVanpaemel2015.pdf}}</ref><ref name=":bmdl">Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NIPS 2018), Montréal, Canada. {{ArXiv|1810.09433}}</ref><ref>{{Cite journal |last1=Lee|first1=Se Yoon |first2=Bani|last2=Mallick|  title = Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas|journal=Sankhya B|year=2021|volume=84 |pages=1–43 |doi=10.1007/s13571-020-00245-8|doi-access=free}}</ref> बहु-स्तरीय मॉडलिंग के रूप में भी जाना जाता है। एक विशेष स्थिति [[बायेसियन नेटवर्क]] है।
बायेसियन आँकड़ों का उपयोग करते हुए सांख्यिकीय मॉडल के निर्माण में किसी भी अज्ञात मापदंडों के लिए [[पूर्व वितरण]] के विनिर्देश की आवश्यकता की पहचान करने की विशेषता है। वास्तव में, पूर्व वितरण के मापदंडों में स्वयं पूर्व वितरण हो सकते हैं, जिससे [[बायेसियन पदानुक्रमित मॉडलिंग]] हो सकती है।<ref name="KruschkeVanpaemel2015">{{cite book |last1=Kruschke|first1=J K|author-link1=John K. Kruschke |last2=Vanpaemel |first2=W |chapter=Bayesian Estimation in Hierarchical Models |pages=279–299 |title=कम्प्यूटेशनल और गणितीय मनोविज्ञान की ऑक्सफोर्ड हैंडबुक|editor-last1=Busemeyer |editor-first1=J R |editor-last2=Wang |editor-first2=Z |editor-last3=Townsend |editor-first3=J T |editor-last4=Eidels |editor-first4=A |year=2015 |publisher=Oxford University Press |url=https://jkkweb.sitehost.iu.edu/articles/KruschkeVanpaemel2015.pdf}}</ref><ref name=":bmdl">Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NIPS 2018), Montréal, Canada. {{ArXiv|1810.09433}}</ref><ref>{{Cite journal |last1=Lee|first1=Se Yoon |first2=Bani|last2=Mallick|  title = Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas|journal=Sankhya B|year=2021|volume=84 |pages=1–43 |doi=10.1007/s13571-020-00245-8|doi-access=free}}</ref> बहु-स्तरीय मॉडलिंग के रूप में भी जाना जाता है। विशेष स्थिति [[बायेसियन नेटवर्क]] है।


बायेसियन सांख्यिकीय विश्लेषण करने के लिए, वैन डी शूट एट अल द्वारा सर्वोत्तम प्रथाओं पर चर्चा की जाती है।<ref name="vandeShootEtAl2021">{{cite journal|last1=van de Schoot |first1=Rens|last2=Depaoli |first2=Sarah |last3=King |first3=Ruth |last4=Kramer |first4=Bianca |last5=Märtens |first5=Kaspar |last6=Tadesse |first6=Mahlet G. |last7=Vannucci |first7=Marina |last8=Gelman |first8=Andrew |last9=Veen |first9=Duco |last10=Willemsen |first10=Joukje |last11=Yau |first11=Christopher |title=बायेसियन सांख्यिकी और मॉडलिंग|journal=Nature Reviews Methods Primers|date=January 14, 2021|volume=1|number=1|pages=1–26|doi=10.1038/s43586-020-00001-2|hdl=1874/415909 |s2cid=234108684 |url=https://osf.io/wdtmc/}}</ref> बायेसियन सांख्यिकीय विश्लेषण के परिणामों की रिपोर्टिंग के लिए, बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश (बर्ग) जॉन के. क्रुश्के द्वारा एक ओपन-एक्सेस लेख में प्रदान किए गए हैं।<ref name="Kruschke2021BARG">{{cite journal|last=Kruschke|first=J K|author-link=John K. Kruschke|title=बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश|journal=Nature Human Behaviour|date=Aug 16, 2021|volume=5|issue=10 |pages=1282–1291|doi=10.1038/s41562-021-01177-7|pmid=34400814 |pmc=8526359 }}</ref>
बायेसियन सांख्यिकीय विश्लेषण करने के लिए, वैन डी शूट एट अल द्वारा सर्वोत्तम प्रथाओं पर चर्चा की जाती है।<ref name="vandeShootEtAl2021">{{cite journal|last1=van de Schoot |first1=Rens|last2=Depaoli |first2=Sarah |last3=King |first3=Ruth |last4=Kramer |first4=Bianca |last5=Märtens |first5=Kaspar |last6=Tadesse |first6=Mahlet G. |last7=Vannucci |first7=Marina |last8=Gelman |first8=Andrew |last9=Veen |first9=Duco |last10=Willemsen |first10=Joukje |last11=Yau |first11=Christopher |title=बायेसियन सांख्यिकी और मॉडलिंग|journal=Nature Reviews Methods Primers|date=January 14, 2021|volume=1|number=1|pages=1–26|doi=10.1038/s43586-020-00001-2|hdl=1874/415909 |s2cid=234108684 |url=https://osf.io/wdtmc/}}</ref> बायेसियन सांख्यिकीय विश्लेषण के परिणामों की रिपोर्टिंग के लिए, बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश (बर्ग) जॉन के. क्रुश्के द्वारा एक ओपन-एक्सेस लेख में प्रदान किए गए हैं।<ref name="Kruschke2021BARG">{{cite journal|last=Kruschke|first=J K|author-link=John K. Kruschke|title=बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश|journal=Nature Human Behaviour|date=Aug 16, 2021|volume=5|issue=10 |pages=1282–1291|doi=10.1038/s41562-021-01177-7|pmid=34400814 |pmc=8526359 }}</ref>
=== प्रयोगों की रचना ===
=== प्रयोगों की रचना ===
प्रयोगों के बेयसियन रचना में 'पूर्व मान्यताओं का प्रभाव' नामक एक अवधारणा सम्मिलित है। यह दृष्टिकोण अगले प्रयोग के रचना में पहले के प्रयोगों के परिणाम को सम्मिलित करने के लिए [[अनुक्रमिक विश्लेषण]] विधियों का उपयोग करता है। यह पूर्व और [[पश्च वितरण]] के उपयोग के माध्यम से 'धारणाओं' को अद्यतन करके प्राप्त किया जाता है। यह प्रयोगों के रचना को सभी प्रकार के संसाधनों का अच्छा उपयोग करने की अनुमति देता है। इसका एक उदाहरण मल्टी-आर्म्ड बैंडिट समस्या है।
प्रयोगों के बेयसियन रचना में 'पूर्व मान्यताओं का प्रभाव' नामक अवधारणा सम्मिलित है। यह दृष्टिकोण अगले प्रयोग के रचना में पहले के प्रयोगों के परिणाम को सम्मिलित करने के लिए [[अनुक्रमिक विश्लेषण]] विधियों का उपयोग करता है। यह पूर्व और [[पश्च वितरण]] के उपयोग के माध्यम से 'धारणाओं' को अद्यतन करके प्राप्त किया जाता है। यह प्रयोगों के रचना को सभी प्रकार के संसाधनों का अच्छा उपयोग करने की अनुमति देता है। इसका उदाहरण मल्टी-आर्म्ड बैंडिट समस्या है।


=== बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण ===
=== बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण ===


बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण बायेसियन मॉडलिंग की आवश्यकताओं और विशिष्टताओं के लिए [[अन्वेषणात्मक डेटा विश्लेषण]] दृष्टिकोण का एक अनुकूलन या विस्तार है। फारसी डायकोनिस के शब्दों में:<ref>Diaconis, Persi (2011) Theories of Data Analysis: From Magical Thinking Through Classical Statistics. John Wiley & Sons, Ltd 2:e55 {{doi|10.1002/9781118150702.ch1}}</ref>  
बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण बायेसियन मॉडलिंग की आवश्यकताओं और विशिष्टताओं के लिए [[अन्वेषणात्मक डेटा विश्लेषण]] दृष्टिकोण का अनुकूलन या विस्तार है। फारसी डायकोनिस के शब्दों में:<ref>Diaconis, Persi (2011) Theories of Data Analysis: From Magical Thinking Through Classical Statistics. John Wiley & Sons, Ltd 2:e55 {{doi|10.1002/9781118150702.ch1}}</ref>  
{{Quote|खोजपूर्ण डेटा विश्लेषण संरचना, या डेटा में सरल विवरण प्रकट करना चाहता है। हम संख्याओं या ग्राफ़ को देखते हैं और पैटर्न खोजने का प्रयास करते हैं। हम पृष्ठभूमि की जानकारी, कल्पना, कथित पैटर्न और अन्य डेटा विश्लेषणों के साथ अनुभव द्वारा सुझाए गए लीड का पीछा करते हैं}}
{{Quote|खोजपूर्ण डेटा विश्लेषण संरचना, या डेटा में सरल विवरण प्रकट करना चाहता है। हम संख्याओं या ग्राफ़ को देखते हैं और पैटर्न खोजने का प्रयास करते हैं। हम पृष्ठभूमि की जानकारी, कल्पना, कथित पैटर्न और अन्य डेटा विश्लेषणों के साथ अनुभव द्वारा सुझाए गए लीड का पीछा करते हैं}}


बायेसियन इंट्रेंस पोस्टीरियर डिस्ट्रीब्यूशन उत्पन्न करता है | जिसमें बायेसियन स्टैटिस्टिक्स में एक केंद्रीय भूमिका होती है, साथ में अन्य डिस्ट्रीब्यूशन जैसे पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन और प्री प्रेडिक्टिव डिस्ट्रीब्यूशन इन वितरणों का सही विज़ुअलाइज़ेशन, विश्लेषण और व्याख्या उन सवालों के सही उत्तर देने के लिए महत्वपूर्ण है जो निष्कर्ष प्रक्रिया को प्रेरित करते हैं।<ref>{{cite journal |doi=10.21105/joss.01143 |title=ArviZ Python में बायेसियन मॉडल के अन्वेषणात्मक विश्लेषण के लिए एक एकीकृत पुस्तकालय है|year=2019 |last1=Kumar |first1=Ravin |last2=Carroll |first2=Colin |last3=Hartikainen |first3=Ari |last4=Martin |first4=Osvaldo |journal=Journal of Open Source Software |volume=4 |issue=33 |page=1143 |bibcode=2019JOSS....4.1143K |doi-access=free }}</ref>
बायेसियन इंट्रेंस पोस्टीरियर डिस्ट्रीब्यूशन उत्पन्न करता है। जिसमें बायेसियन स्टैटिस्टिक्स में केंद्रीय भूमिका होती है, साथ में अन्य डिस्ट्रीब्यूशन जैसे पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन और प्री प्रेडिक्टिव डिस्ट्रीब्यूशन इन वितरणों का सही विज़ुअलाइज़ेशन, विश्लेषण और व्याख्या उन सवालों के सही उत्तर देने के लिए महत्वपूर्ण है जो निष्कर्ष प्रक्रिया को प्रेरित करते हैं।<ref>{{cite journal |doi=10.21105/joss.01143 |title=ArviZ Python में बायेसियन मॉडल के अन्वेषणात्मक विश्लेषण के लिए एक एकीकृत पुस्तकालय है|year=2019 |last1=Kumar |first1=Ravin |last2=Carroll |first2=Colin |last3=Hartikainen |first3=Ari |last4=Martin |first4=Osvaldo |journal=Journal of Open Source Software |volume=4 |issue=33 |page=1143 |bibcode=2019JOSS....4.1143K |doi-access=free }}</ref>


बायेसियन मॉडल के साथ काम करते समय संबंधित कार्यों की एक श्रृंखला होती है | जिसे स्वयं निष्कर्ष के अलावा संबोधित करने की आवश्यकता होती है |
बायेसियन मॉडल के साथ काम करते समय संबंधित कार्यों की श्रृंखला होती है। जिसे स्वयं निष्कर्ष के अलावा संबोधित करने की आवश्यकता होती है।


* निष्कर्ष की गुणवत्ता का निदान, मार्कोव श्रृंखला मोंटे कार्लो विधियों जैसे संख्यात्मक विधियों का उपयोग करते समय इसकी आवश्यकता होती है |
* निष्कर्ष की गुणवत्ता का निदान, मार्कोव श्रृंखला मोंटे कार्लो विधियों जैसे संख्यात्मक विधियों का उपयोग करते समय इसकी आवश्यकता होती है।
* मॉडल आलोचना, जिसमें मॉडल मान्यताओं और मॉडल पूर्वानुमानो दोनों का मूल्यांकन सम्मिलित है |
* मॉडल आलोचना, जिसमें मॉडल मान्यताओं और मॉडल पूर्वानुमानो दोनों का मूल्यांकन सम्मिलित है।
* मॉडल चयन या मॉडल औसत सहित मॉडलों की तुलना करती है |
* मॉडल चयन या मॉडल औसत सहित मॉडलों की तुलना करती है।
* किसी विशेष दर्शक वर्ग के लिए परिणामों की तैयारी होती है |
* किसी विशेष दर्शक वर्ग के लिए परिणामों की तैयारी होती है।


ये सभी कार्य बायेसियन मॉडल दृष्टिकोण के अन्वेषणात्मक विश्लेषण का भाग हैं और उनका सफलतापूर्वक प्रदर्शन करना पुनरावृत्त और इंटरैक्टिव मॉडलिंग प्रक्रिया का केंद्र है। इन कार्यों के लिए संख्यात्मक और दृश्य सारांश दोनों की आवश्यकता होती है।<ref>{{cite journal |arxiv=1709.01449 |doi=10.1111/rssa.12378 |title=बायेसियन वर्कफ़्लो में विज़ुअलाइज़ेशन|year=2019 |last1=Gabry |first1=Jonah |last2=Simpson |first2=Daniel |last3=Vehtari |first3=Aki |last4=Betancourt |first4=Michael |last5=Gelman |first5=Andrew |s2cid=26590874 |journal=Journal of the Royal Statistical Society, Series A (Statistics in Society) |volume=182 |issue=2 |pages=389–402 }}</ref><ref>{{cite journal |arxiv=1903.08008 |last1=Vehtari |first1=Aki |last2=Gelman |first2=Andrew |last3=Simpson |first3=Daniel |last4=Carpenter |first4=Bob |last5=Bürkner |first5=Paul-Christian |title=Rank-Normalization, Folding, and Localization: An Improved Rˆ for Assessing Convergence of MCMC (With Discussion) |journal=Bayesian Analysis |year=2021 |volume=16 |issue=2 |doi=10.1214/20-BA1221 |s2cid=88522683 }}</ref><ref name="Martin2018">{{cite book|url=https://books.google.com/books?id=1Z2BDwAAQBAJ|title=Bayesian Analysis with Python: Introduction to statistical modeling and probabilistic programming using PyMC3 and ArviZ|last1=Martin|first1=Osvaldo|date=2018|publisher=Packt Publishing Ltd|isbn=9781789341652|language=en}}</ref>
ये सभी कार्य बायेसियन मॉडल दृष्टिकोण के अन्वेषणात्मक विश्लेषण का भाग हैं और उनका सफलतापूर्वक प्रदर्शन करना पुनरावृत्त और इंटरैक्टिव मॉडलिंग प्रक्रिया का केंद्र है। इन कार्यों के लिए संख्यात्मक और दृश्य सारांश दोनों की आवश्यकता होती है।<ref>{{cite journal |arxiv=1709.01449 |doi=10.1111/rssa.12378 |title=बायेसियन वर्कफ़्लो में विज़ुअलाइज़ेशन|year=2019 |last1=Gabry |first1=Jonah |last2=Simpson |first2=Daniel |last3=Vehtari |first3=Aki |last4=Betancourt |first4=Michael |last5=Gelman |first5=Andrew |s2cid=26590874 |journal=Journal of the Royal Statistical Society, Series A (Statistics in Society) |volume=182 |issue=2 |pages=389–402 }}</ref><ref>{{cite journal |arxiv=1903.08008 |last1=Vehtari |first1=Aki |last2=Gelman |first2=Andrew |last3=Simpson |first3=Daniel |last4=Carpenter |first4=Bob |last5=Bürkner |first5=Paul-Christian |title=Rank-Normalization, Folding, and Localization: An Improved Rˆ for Assessing Convergence of MCMC (With Discussion) |journal=Bayesian Analysis |year=2021 |volume=16 |issue=2 |doi=10.1214/20-BA1221 |s2cid=88522683 }}</ref><ref name="Martin2018">{{cite book|url=https://books.google.com/books?id=1Z2BDwAAQBAJ|title=Bayesian Analysis with Python: Introduction to statistical modeling and probabilistic programming using PyMC3 and ArviZ|last1=Martin|first1=Osvaldo|date=2018|publisher=Packt Publishing Ltd|isbn=9781789341652|language=en}}</ref>
== यह भी देखें ==
== यह भी देखें ==
* [[बायेसियन ज्ञानमीमांसा|बायेसियन ज्ञानशास्त्र]]
* [[बायेसियन ज्ञानमीमांसा|बायेसियन ज्ञानशास्त्र]]

Revision as of 17:58, 9 June 2023

बायेसियन सांख्यिकी बायेसियन संभाव्यता पर आधारित सांख्यिकी के क्षेत्र में सिद्धांत है जहां संभाव्यता घटना (प्रायिकता सिद्धांत) में धारणा का परिमाण व्यक्त करती है। धारणा का परिमाण घटना के बारे में पूर्व ज्ञान पर आधारित हो सकती है, जैसे कि पिछले प्रयोगों के परिणाम, या घटना के बारे में व्यक्तिगत धारणाओं पर यह कई अन्य प्रायिकता व्याख्याओं से भिन्न है। जैसे फ़्रीक्वेंटिस्ट प्रायिकता व्याख्या जो प्रायिकता को कई परीक्षणों के बाद किसी घटना की सापेक्ष आवृत्ति के अनुक्रम की सीमा के रूप में देखती है।[1]

बायेसियन सांख्यिकीय विधियां नया डेटा प्राप्त करने के बाद संभावनाओं की गणना और अद्यतन करने के लिए बेयस प्रमेय का उपयोग करती हैं। बेयस प्रमेय डेटा के साथ-साथ घटना या घटना से संबंधित स्थितियों के बारे में पूर्व सूचना या मान्यताओं के आधार पर किसी घटना की सशर्त प्रायिकता का वर्णन करता है।[2][3] उदाहरण के लिए, बायेसियन निष्कर्ष में, बेयस प्रमेय का उपयोग संभाव्यता वितरण या सांख्यिकीय मॉडल के मापदंडो का निष्कर्ष लगाने के लिए किया जा सकता है। चूंकि बेयसियन सांख्यिकी संभाव्यता को धारणा का परिमाण के रूप में मानते हैं, बेयस प्रमेय सीधे संभाव्यता वितरण प्रदान कर सकता है जो मापदंड या मापदंड के समुच्चय को धारणा को मापता है।[1][2]

बायेसियन सांख्यिकी का नाम थॉमस बेयस के नाम पर रखा गया है। जिन्होंने 1763 में प्रकाशित डॉक्ट्रिन ऑफ चांस में समस्या को हल करने की दिशा में निबंध में बेयस प्रमेय का विशिष्ट स्थिति तैयार किया था। लाप्लास ने संभाव्यता की बायेसियन व्याख्या विकसित की थी।[4] लाप्लास ने कई सांख्यिकीय समस्याओं को हल करने के लिए उन विधियों का उपयोग किया जिन्हें अब बायेसियन माना जाता है। कई बायेसियन विधियों को बाद के लेखकों द्वारा विकसित किया गया था। किन्तु 1950 के दशक तक इस तरह के विधियों का वर्णन करने के लिए सामान्यतः इस शब्द का उपयोग नहीं किया गया था। 20वीं शताब्दी के अधिकांश समय के पश्चात्, दार्शनिक और व्यावहारिक विचारों के कारण कई सांख्यिकीविदों द्वारा बायेसियन विधियों को प्रतिकूल रूप से देखा गया था। कई बायेसियन विधियों को पूरा करने के लिए बहुत अधिक संगणना की आवश्यकता होती है, और शताब्दी के पश्चात् व्यापक रूप से उपयोग की जाने वाली अधिकांश विधियाँ बारंबारतावादी व्याख्या पर आधारित थीं। चूँकि, मार्कोव चेन मोंटे कार्लो जैसे शक्तिशाली कंप्यूटरों और नए कलन विधि के आगमन के साथ, 21वीं सदी में बायेसियन विधियों का सांख्यिकी में उपयोग बढ़ता हुआ देखा गया है।[1][5]

बेयस प्रमेय

बेयस प्रमेय का उपयोग बायेसियन विधियों में संभावनाओं को अद्यतन करने के लिए किया जाता है, जो नए डेटा प्राप्त करने के बाद धारणा का परिमाण हैं। दो घटनाओं और को देखते हुए की सशर्त प्रायिकता दी गई है कि सत्य है, इस प्रकार व्यक्त किया गया है। [6]

जहां चूँकि बेयस प्रमेय संभाव्यता सिद्धांत का मौलिक परिणाम है, किन्तु बायेसियन सांख्यिकी में इसकी विशिष्ट व्याख्या है। उपरोक्त समीकरण में, सामान्यतः प्रस्ताव का प्रतिनिधित्व करता है (जैसे कथन है कि एक सिक्का पचास प्रतिशत समय पर सिर पर पड़ता है) और प्रमाण का प्रतिनिधित्व करता है, या नया डेटा जिसे ध्यान में रखा जाना है (जैसे परिणाम सिक्का फ़्लिप की श्रृंखला)। की पूर्व प्रायिकता है जो प्रमाण को ध्यान में रखे जाने से पहले के बारे में किसी के विश्वास को व्यक्त करता है। पूर्व संभाव्यता भी . के बारे में जानकारी की मात्रा निर्धारित कर सकती है, प्रायिकता कार्य है, जिसे प्रमाण की प्रायिकता के रूप में व्याख्या किया जा सकता है कि सच है। प्रायिकता यह निर्धारित करती है कि प्रमाण किस सीमा तक प्रस्ताव का समर्थन करता है . पश्च संभाव्यता है, प्रमाण को ध्यान में रखने के बाद प्रस्ताव की प्रायिकता नए प्रमाण पर विचार करने के बाद अनिवार्य रूप से, बेयस प्रमेय किसी के पूर्व विश्वास को अद्यतन करता है।[1]

प्रमाण की प्रायिकता कुल संभाव्यता के नियम का उपयोग करके गणना की जा सकती है। यदि प्रतिरूप स्थान के एक समुच्चय का विभाजन है, जो एक प्रयोग के सभी परिणाम (संभाव्यता) का समुच्चय है, फिर,[1][6]

जब अनंत संख्या में परिणाम हों तो कुल संभाव्यता के नियम का उपयोग करके की गणना करने के लिए सभी परिणामों को एकीकृत करना आवश्यक है। अधिकांशतः की गणना करना कठिन होता है क्योंकि गणना में रकम या इंटीग्रल सम्मिलित होते हैं जो मूल्यांकन करने के लिए समय लेने वाली होती हैं | इसलिए अधिकांशतः केवल पूर्व और संभावना के उत्पाद पर विचार किया जाता है क्योंकि प्रमाण उसी विश्लेषण में नहीं बदलते हैं। पश्च भाग इस उत्पाद के समानुपाती होता है। [1]

अधिकतम पोस्टरियोरी, जो कि पोस्टीरियर का मोड (सांख्यिकी) है और अधिकांशतः गणितीय अनुकूलन विधियों का उपयोग करके बायेसियन आँकड़ों में गणना की जाती है, वही रहता है। मार्कोव श्रृंखला मोंटे कार्लो या परिवर्तनशील बायेसियन विधियों जैसे विधियों के साथ के स्पष्ट मान की गणना किए बिना भी पश्च का निष्कर्ष लगाया जा सकता है। [1]

बायेसियन विधियों की रूपरेखा

सांख्यिकीय विधियों के सामान्य समुच्चय को कई गतिविधियों में विभाजित किया जा सकता है। जिनमें से कई विशेष बायेसियन संस्करण हैं।

बायेसियन निष्कर्ष

बायेसियन निष्कर्ष सांख्यिकीय निष्कर्ष को संदर्भित करता है जहां संभाव्यता का उपयोग करके अनुमानों में अनिश्चितता की मात्रा निर्धारित की जाती है।[7] मौलिक आवृत्तिवादी निष्कर्ष में, मॉडल मापदंड और परिकल्पना को निश्चित माना जाता है। प्रायिकतावादी निष्कर्ष में प्रायिकताओं को प्राचलों या परिकल्पनाओं के लिए निर्दिष्ट नहीं किया जाता है। उदाहरण के लिए, बारंबारतावादी निष्कर्ष में किसी घटना को स्पष्ट रूप से प्रायिकता निर्दिष्ट करने का कोई कारण नहीं होगा जो केवल एक बार हो सकती है, जैसे कि निष्पक्ष सिक्के के अगले फ्लिप का परिणाम चूँकि, यह कहना समझदारी होगी कि बड़ी संख्या के नियम के प्रमुखों का अनुपात सिक्का उछालने की संख्या बढ़ने पर आधा हो जाता है।[8]

सांख्यिकीय मॉडल सांख्यिकीय मान्यताओं और प्रक्रियाओं का समुच्चय निर्दिष्ट करते हैं | जो दर्शाते हैं कि प्रतिरूप डेटा कैसे उत्पन्न होता है। सांख्यिकीय मॉडल में कई मापदंड होते हैं जिन्हें संशोधित किया जा सकता है। उदाहरण के लिए, एक सिक्के को बर्नौली वितरण से प्रतिरूप के रूप में दर्शाया जा सकता है, जो दो संभावित परिणामों को मॉडल करता है। बर्नौली वितरण में परिणाम की प्रायिकता के समान एकल मापदंड है। जो अधिकतर स्थितियों में सिर पर उतरने की प्रायिकता है। बायेसियन निष्कर्ष में डेटा के लिए अच्छा मॉडल तैयार करना केंद्रीय है। अधिकतर स्थितियों में, मॉडल केवल वास्तविक प्रक्रिया का निष्कर्ष लगाते हैं, और डेटा को प्रभावित करने वाले कुछ कारकों को ध्यान में नहीं रख सकते हैं।[1] बायेसियन निष्कर्ष में, प्रायिकताएं मॉडल पैरामीटर्स को असाइन की जा सकती हैं। मापदंडों को यादृच्छिक चर के रूप में दर्शाया जा सकता है। बायेसियन निष्कर्ष अधिक प्रमाण प्राप्त या ज्ञात होने के बाद संभावनाओं को अद्यतन करने के लिए बेयस प्रमेय का उपयोग करता है।[1][9]

सांख्यिकीय मॉडलिंग

बायेसियन आँकड़ों का उपयोग करते हुए सांख्यिकीय मॉडल के निर्माण में किसी भी अज्ञात मापदंडों के लिए पूर्व वितरण के विनिर्देश की आवश्यकता की पहचान करने की विशेषता है। वास्तव में, पूर्व वितरण के मापदंडों में स्वयं पूर्व वितरण हो सकते हैं, जिससे बायेसियन पदानुक्रमित मॉडलिंग हो सकती है।[10][11][12] बहु-स्तरीय मॉडलिंग के रूप में भी जाना जाता है। विशेष स्थिति बायेसियन नेटवर्क है।

बायेसियन सांख्यिकीय विश्लेषण करने के लिए, वैन डी शूट एट अल द्वारा सर्वोत्तम प्रथाओं पर चर्चा की जाती है।[13] बायेसियन सांख्यिकीय विश्लेषण के परिणामों की रिपोर्टिंग के लिए, बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश (बर्ग) जॉन के. क्रुश्के द्वारा एक ओपन-एक्सेस लेख में प्रदान किए गए हैं।[14]

प्रयोगों की रचना

प्रयोगों के बेयसियन रचना में 'पूर्व मान्यताओं का प्रभाव' नामक अवधारणा सम्मिलित है। यह दृष्टिकोण अगले प्रयोग के रचना में पहले के प्रयोगों के परिणाम को सम्मिलित करने के लिए अनुक्रमिक विश्लेषण विधियों का उपयोग करता है। यह पूर्व और पश्च वितरण के उपयोग के माध्यम से 'धारणाओं' को अद्यतन करके प्राप्त किया जाता है। यह प्रयोगों के रचना को सभी प्रकार के संसाधनों का अच्छा उपयोग करने की अनुमति देता है। इसका उदाहरण मल्टी-आर्म्ड बैंडिट समस्या है।

बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण

बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण बायेसियन मॉडलिंग की आवश्यकताओं और विशिष्टताओं के लिए अन्वेषणात्मक डेटा विश्लेषण दृष्टिकोण का अनुकूलन या विस्तार है। फारसी डायकोनिस के शब्दों में:[15]

खोजपूर्ण डेटा विश्लेषण संरचना, या डेटा में सरल विवरण प्रकट करना चाहता है। हम संख्याओं या ग्राफ़ को देखते हैं और पैटर्न खोजने का प्रयास करते हैं। हम पृष्ठभूमि की जानकारी, कल्पना, कथित पैटर्न और अन्य डेटा विश्लेषणों के साथ अनुभव द्वारा सुझाए गए लीड का पीछा करते हैं

बायेसियन इंट्रेंस पोस्टीरियर डिस्ट्रीब्यूशन उत्पन्न करता है। जिसमें बायेसियन स्टैटिस्टिक्स में केंद्रीय भूमिका होती है, साथ में अन्य डिस्ट्रीब्यूशन जैसे पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन और प्री प्रेडिक्टिव डिस्ट्रीब्यूशन इन वितरणों का सही विज़ुअलाइज़ेशन, विश्लेषण और व्याख्या उन सवालों के सही उत्तर देने के लिए महत्वपूर्ण है जो निष्कर्ष प्रक्रिया को प्रेरित करते हैं।[16]

बायेसियन मॉडल के साथ काम करते समय संबंधित कार्यों की श्रृंखला होती है। जिसे स्वयं निष्कर्ष के अलावा संबोधित करने की आवश्यकता होती है।

  • निष्कर्ष की गुणवत्ता का निदान, मार्कोव श्रृंखला मोंटे कार्लो विधियों जैसे संख्यात्मक विधियों का उपयोग करते समय इसकी आवश्यकता होती है।
  • मॉडल आलोचना, जिसमें मॉडल मान्यताओं और मॉडल पूर्वानुमानो दोनों का मूल्यांकन सम्मिलित है।
  • मॉडल चयन या मॉडल औसत सहित मॉडलों की तुलना करती है।
  • किसी विशेष दर्शक वर्ग के लिए परिणामों की तैयारी होती है।

ये सभी कार्य बायेसियन मॉडल दृष्टिकोण के अन्वेषणात्मक विश्लेषण का भाग हैं और उनका सफलतापूर्वक प्रदर्शन करना पुनरावृत्त और इंटरैक्टिव मॉडलिंग प्रक्रिया का केंद्र है। इन कार्यों के लिए संख्यात्मक और दृश्य सारांश दोनों की आवश्यकता होती है।[17][18][19]

यह भी देखें

संदर्भ

  1. 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (2013). बायेसियन डेटा विश्लेषण (Third ed.). Chapman and Hall/CRC. ISBN 978-1-4398-4095-5.
  2. 2.0 2.1 McElreath, Richard (2020). Statistical Rethinking : A Bayesian Course with Examples in R and Stan (2nd ed.). Chapman and Hall/CRC. ISBN 978-0-367-13991-9.
  3. Kruschke, John (2014). Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan (2nd ed.). Academic Press. ISBN 978-0-12-405888-0.
  4. McGrayne, Sharon (2012). The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy (First ed.). Chapman and Hall/CRC. ISBN 978-0-3001-8822-6.
  5. Fienberg, Stephen E. (2006). "When Did Bayesian Inference Become "Bayesian"?". Bayesian Analysis. 1 (1): 1–40. doi:10.1214/06-BA101.
  6. 6.0 6.1 Grinstead, Charles M.; Snell, J. Laurie (2006). संभाव्यता का परिचय (2nd ed.). Providence, RI: American Mathematical Society. ISBN 978-0-8218-9414-9.
  7. Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  8. Wakefield, Jon (2013). बायेसियन और फ़्रीक्वेंटिस्ट रिग्रेशन के तरीके. New York, NY: Springer. ISBN 978-1-4419-0924-4.
  9. Congdon, Peter (2014). एप्लाइड बायेसियन मॉडलिंग (2nd ed.). Wiley. ISBN 978-1119951513.
  10. Kruschke, J K; Vanpaemel, W (2015). "Bayesian Estimation in Hierarchical Models". In Busemeyer, J R; Wang, Z; Townsend, J T; Eidels, A (eds.). कम्प्यूटेशनल और गणितीय मनोविज्ञान की ऑक्सफोर्ड हैंडबुक (PDF). Oxford University Press. pp. 279–299.
  11. Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NIPS 2018), Montréal, Canada. arXiv:1810.09433
  12. Lee, Se Yoon; Mallick, Bani (2021). "Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas". Sankhya B. 84: 1–43. doi:10.1007/s13571-020-00245-8.
  13. van de Schoot, Rens; Depaoli, Sarah; King, Ruth; Kramer, Bianca; Märtens, Kaspar; Tadesse, Mahlet G.; Vannucci, Marina; Gelman, Andrew; Veen, Duco; Willemsen, Joukje; Yau, Christopher (January 14, 2021). "बायेसियन सांख्यिकी और मॉडलिंग". Nature Reviews Methods Primers. 1 (1): 1–26. doi:10.1038/s43586-020-00001-2. hdl:1874/415909. S2CID 234108684.
  14. Kruschke, J K (Aug 16, 2021). "बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश". Nature Human Behaviour. 5 (10): 1282–1291. doi:10.1038/s41562-021-01177-7. PMC 8526359. PMID 34400814.
  15. Diaconis, Persi (2011) Theories of Data Analysis: From Magical Thinking Through Classical Statistics. John Wiley & Sons, Ltd 2:e55 doi:10.1002/9781118150702.ch1
  16. Kumar, Ravin; Carroll, Colin; Hartikainen, Ari; Martin, Osvaldo (2019). "ArviZ Python में बायेसियन मॉडल के अन्वेषणात्मक विश्लेषण के लिए एक एकीकृत पुस्तकालय है". Journal of Open Source Software. 4 (33): 1143. Bibcode:2019JOSS....4.1143K. doi:10.21105/joss.01143.
  17. Gabry, Jonah; Simpson, Daniel; Vehtari, Aki; Betancourt, Michael; Gelman, Andrew (2019). "बायेसियन वर्कफ़्लो में विज़ुअलाइज़ेशन". Journal of the Royal Statistical Society, Series A (Statistics in Society). 182 (2): 389–402. arXiv:1709.01449. doi:10.1111/rssa.12378. S2CID 26590874.
  18. Vehtari, Aki; Gelman, Andrew; Simpson, Daniel; Carpenter, Bob; Bürkner, Paul-Christian (2021). "Rank-Normalization, Folding, and Localization: An Improved Rˆ for Assessing Convergence of MCMC (With Discussion)". Bayesian Analysis. 16 (2). arXiv:1903.08008. doi:10.1214/20-BA1221. S2CID 88522683.
  19. Martin, Osvaldo (2018). Bayesian Analysis with Python: Introduction to statistical modeling and probabilistic programming using PyMC3 and ArviZ (in English). Packt Publishing Ltd. ISBN 9781789341652.


अग्रिम पठन


बाहरी संबंध