बायेसियन सांख्यिकी

बायेसियन सांख्यिकी बायेसियन संभाव्यता पर आधारित सांख्यिकी के क्षेत्र में एक सिद्धांत है जहां संभाव्यता एक घटना (संभावना सिद्धांत) में विश्वास की डिग्री व्यक्त करती है। विश्वास की डिग्री घटना के बारे में पूर्व ज्ञान पर आधारित हो सकती है, जैसे कि पिछले प्रयोगों के परिणाम, या घटना के बारे में व्यक्तिगत विश्वासों पर। यह कई अन्य प्रायिकता व्याख्याओं से भिन्न है, जैसे फ़्रीक्वेंटिस्ट प्रायिकता व्याख्या जो संभावना को कई परीक्षणों के बाद किसी घटना की सापेक्ष आवृत्ति के अनुक्रम की सीमा के रूप में देखती है। बायेसियन सांख्यिकीय विधियां नया डेटा प्राप्त करने के बाद संभावनाओं की गणना और अद्यतन करने के लिए बेयस प्रमेय का उपयोग करती हैं। बेयस प्रमेय डेटा के साथ-साथ घटना या घटना से संबंधित स्थितियों के बारे में पूर्व सूचना या मान्यताओं के आधार पर किसी घटना की सशर्त संभावना का वर्णन करता है। उदाहरण के लिए, बायेसियन अनुमान में, बेयस प्रमेय का उपयोग संभाव्यता वितरण या सांख्यिकीय मॉडल के पैरामीटरों का अनुमान लगाने के लिए किया जा सकता है। चूंकि बेयसियन सांख्यिकी संभाव्यता को विश्वास की डिग्री के रूप में मानते हैं, बेयस प्रमेय सीधे एक संभाव्यता वितरण प्रदान कर सकता है जो पैरामीटर या पैरामीटर के सेट को विश्वास को मापता है।

बायेसियन सांख्यिकी का नाम थॉमस बेयस के नाम पर रखा गया है, जिन्होंने 1763 में प्रकाशित डॉक्ट्रिन ऑफ चांस में एक समस्या को हल करने की दिशा में एक निबंध में बेयस प्रमेय का एक विशिष्ट मामला तैयार किया था। लाप्लास ने संभाव्यता की बायेसियन व्याख्या विकसित की। लाप्लास ने कई सांख्यिकीय समस्याओं को हल करने के लिए उन तरीकों का इस्तेमाल किया जिन्हें अब बायेसियन माना जाएगा। कई बायेसियन विधियों को बाद के लेखकों द्वारा विकसित किया गया था, लेकिन 1950 के दशक तक इस तरह के तरीकों का वर्णन करने के लिए आमतौर पर इस शब्द का इस्तेमाल नहीं किया गया था। 20वीं शताब्दी के अधिकांश समय के दौरान, दार्शनिक और व्यावहारिक विचारों के कारण कई सांख्यिकीविदों द्वारा बायेसियन विधियों को प्रतिकूल रूप से देखा गया। कई बायेसियन विधियों को पूरा करने के लिए बहुत अधिक संगणना की आवश्यकता होती है, और शताब्दी के दौरान व्यापक रूप से उपयोग की जाने वाली अधिकांश विधियाँ बारंबारतावादी व्याख्या पर आधारित थीं। हालांकि, मार्कोव चेन मोंटे कार्लो जैसे शक्तिशाली कंप्यूटरों और नए कलन विधि के आगमन के साथ, 21वीं सदी में बायेसियन विधियों का सांख्यिकी में उपयोग बढ़ता हुआ देखा गया है।

बेयस प्रमेय
बेयस प्रमेय का उपयोग बायेसियन विधियों में संभावनाओं को अद्यतन करने के लिए किया जाता है, जो नए डेटा प्राप्त करने के बाद विश्वास की डिग्री हैं। दो घटनाएँ दी $$A$$ और $$B$$, की सशर्त संभावना $$A$$ मान लें कि $$B$$ सत्य इस प्रकार व्यक्त किया गया है:

$$P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}$$ कहाँ $$P(B) \neq 0$$. हालांकि बेयस प्रमेय संभाव्यता सिद्धांत का एक मौलिक परिणाम है, लेकिन बायेसियन सांख्यिकी में इसकी एक विशिष्ट व्याख्या है। उपरोक्त समीकरण में, $$A$$ आम तौर पर एक प्रस्ताव का प्रतिनिधित्व करता है (जैसे बयान कि एक सिक्का समय के पचास प्रतिशत सिर पर पड़ता है) और $$B$$ सबूत, या नए डेटा का प्रतिनिधित्व करता है जिसे ध्यान में रखा जाना है (जैसे कि सिक्का फ़्लिप की श्रृंखला का परिणाम)। $$P(A)$$ की पूर्व संभावना है $$A$$ जो किसी के बारे में विश्वास व्यक्त करता है $$A$$ साक्ष्य पर विचार करने से पहले। पूर्व संभाव्यता पूर्व ज्ञान या सूचना के बारे में भी बता सकती है $$A$$. $$P(B \mid A)$$ संभावना कार्य है, जिसे साक्ष्य की संभावना के रूप में व्याख्या किया जा सकता है $$B$$ मान लें कि $$A$$ क्या सच है। संभावना यह निर्धारित करती है कि साक्ष्य किस हद तक है $$B$$ प्रस्ताव का समर्थन करता है $$A$$. $$P(A \mid B)$$ पश्च संभाव्यता है, प्रस्ताव की संभाव्यता $$A$$ सबूत लेने के बाद $$B$$ खाते में। अनिवार्य रूप से, बेयस प्रमेय किसी के पूर्व विश्वासों को अद्यतन करता है $$P(A)$$ नए सबूतों पर विचार करने के बाद $$B$$.

साक्ष्य की संभावना $$P(B)$$ कुल संभाव्यता के कानून का उपयोग करके गणना की जा सकती है। अगर $$\{A_1, A_2, \dots, A_n\}$$ नमूना स्थान के एक सेट का विभाजन है, जो एक प्रयोग के सभी परिणाम (संभाव्यता) का सेट है, फिर,

$$P(B) = P(B \mid A_1)P(A_1) + P(B \mid A_2)P(A_2) + \dots + P(B \mid A_n)P(A_n) = \sum_i P(B \mid A_i)P(A_i)$$ जब अनंत संख्या में परिणाम होते हैं, तो गणना करने के लिए सभी परिणामों पर अभिन्न  करना आवश्यक होता है $$P(B)$$ कुल संभाव्यता के कानून का उपयोग करना। अक्सर, $$P(B)$$ गणना करना मुश्किल है क्योंकि गणना में रकम या इंटीग्रल शामिल होंगे जो मूल्यांकन के लिए समय लेने वाले होंगे, इसलिए अक्सर केवल पूर्व और संभावना के उत्पाद पर विचार किया जाता है, क्योंकि सबूत एक ही विश्लेषण में नहीं बदलते हैं। पिछला भाग इस उत्पाद के समानुपाती होता है:

$$P(A \mid B) \propto P(B \mid A)P(A)$$ अधिकतम एक पोस्टरियोरी, जो कि पोस्टीरियर का मोड (सांख्यिकी) है और अक्सर गणितीय अनुकूलन विधियों का उपयोग करके बायेसियन आंकड़ों में गणना की जाती है, वही रहता है। के सटीक मान की गणना किए बिना भी पश्च का अनुमान लगाया जा सकता है $$P(B)$$ मार्कोव श्रृंखला मोंटे कार्लो या परिवर्तनशील बायेसियन विधियों जैसे तरीकों के साथ।

बायेसियन विधियों की रूपरेखा
सांख्यिकीय तकनीकों के सामान्य सेट को कई गतिविधियों में विभाजित किया जा सकता है, जिनमें से कई विशेष बायेसियन संस्करण हैं।

बायेसियन अनुमान
बायेसियन अनुमान सांख्यिकीय अनुमान को संदर्भित करता है जहां संभाव्यता का उपयोग करके अनुमानों में अनिश्चितता की मात्रा निर्धारित की जाती है। शास्त्रीय आवृत्तिवादी अनुमान में, मॉडल पैरामीटर और परिकल्पना को निश्चित माना जाता है। प्रायिकतावादी अनुमान में प्रायिकताओं को प्राचलों या परिकल्पनाओं के लिए निर्दिष्ट नहीं किया जाता है। उदाहरण के लिए, बारंबारतावादी अनुमान में किसी घटना को सीधे तौर पर प्रायिकता निर्दिष्ट करने का कोई मतलब नहीं होगा जो केवल एक बार हो सकती है, जैसे कि एक निष्पक्ष सिक्के के अगले फ्लिप का परिणाम। हालांकि, यह कहना समझदारी होगी कि बड़ी संख्या के कानून के प्रमुखों का अनुपात | सिक्का उछालने की संख्या बढ़ने पर आधा हो जाता है। सांख्यिकीय मॉडल सांख्यिकीय मान्यताओं और प्रक्रियाओं का एक सेट निर्दिष्ट करते हैं जो दर्शाते हैं कि नमूना डेटा कैसे उत्पन्न होता है। सांख्यिकीय मॉडल में कई पैरामीटर होते हैं जिन्हें संशोधित किया जा सकता है। उदाहरण के लिए, एक सिक्के को बर्नौली वितरण से नमूने के रूप में दर्शाया जा सकता है, जो दो संभावित परिणामों को मॉडल करता है। बर्नौली वितरण में एक परिणाम की प्रायिकता के बराबर एक एकल पैरामीटर है, जो ज्यादातर मामलों में सिर पर उतरने की संभावना है। बायेसियन अनुमान में डेटा के लिए एक अच्छा मॉडल तैयार करना केंद्रीय है। ज्यादातर मामलों में, मॉडल केवल वास्तविक प्रक्रिया का अनुमान लगाते हैं, और डेटा को प्रभावित करने वाले कुछ कारकों को ध्यान में नहीं रख सकते हैं। बायेसियन अनुमान में, प्रायिकताएं मॉडल पैरामीटर्स को असाइन की जा सकती हैं। मापदंडों को यादृच्छिक चर के रूप में दर्शाया जा सकता है। बायेसियन अनुमान अधिक साक्ष्य प्राप्त या ज्ञात होने के बाद संभावनाओं को अद्यतन करने के लिए बेयस प्रमेय का उपयोग करता है।

सांख्यिकीय मॉडलिंग
बायेसियन आँकड़ों का उपयोग करते हुए सांख्यिकीय मॉडल के निर्माण में किसी भी अज्ञात मापदंडों के लिए पूर्व वितरण के विनिर्देश की आवश्यकता की पहचान करने की विशेषता है। वास्तव में, पूर्व वितरण के मापदंडों में स्वयं पूर्व वितरण हो सकते हैं, जिससे बायेसियन पदानुक्रमित मॉडलिंग हो सकती है, बहु-स्तरीय मॉडलिंग के रूप में भी जाना जाता है। एक विशेष मामला बायेसियन नेटवर्क है।

बायेसियन सांख्यिकीय विश्लेषण करने के लिए, वैन डी शूट एट अल द्वारा सर्वोत्तम प्रथाओं पर चर्चा की जाती है। बायेसियन सांख्यिकीय विश्लेषण के परिणामों की रिपोर्टिंग के लिए, बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश (BARG) जॉन के. क्रुश्के द्वारा एक ओपन-एक्सेस लेख में प्रदान किए गए हैं।

प्रयोगों का डिजाइन
प्रयोगों के बेयसियन डिजाइन में 'पूर्व मान्यताओं का प्रभाव' नामक एक अवधारणा शामिल है। यह दृष्टिकोण अगले प्रयोग के डिजाइन में पहले के प्रयोगों के परिणाम को शामिल करने के लिए अनुक्रमिक विश्लेषण तकनीकों का उपयोग करता है। यह पूर्व और पश्च वितरण के उपयोग के माध्यम से 'विश्वासों' को अद्यतन करके प्राप्त किया जाता है। यह प्रयोगों के डिजाइन को सभी प्रकार के संसाधनों का अच्छा उपयोग करने की अनुमति देता है। इसका एक उदाहरण मल्टी-आर्म्ड बैंडिट समस्या है।

बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण
बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण बायेसियन मॉडलिंग की आवश्यकताओं और विशिष्टताओं के लिए अन्वेषणात्मक डेटा विश्लेषण दृष्टिकोण का एक अनुकूलन या विस्तार है। फारसी डायकोनिस के शब्दों में: "Exploratory data analysis seeks to reveal structure, or simple descriptions in data. We look at numbers or graphs and try to find patterns. We pursue leads suggested by background information, imagination, patterns perceived, and experience with other data analyses"

बायेसियन इंट्रेंस पोस्टीरियर डिस्ट्रीब्यूशन उत्पन्न करता है, जिसमें बायेसियन स्टैटिस्टिक्स में एक केंद्रीय भूमिका होती है, साथ में अन्य डिस्ट्रीब्यूशन जैसे पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन और प्री प्रेडिक्टिव डिस्ट्रीब्यूशन। इन वितरणों का सही विज़ुअलाइज़ेशन, विश्लेषण और व्याख्या उन सवालों के सही उत्तर देने के लिए महत्वपूर्ण है जो अनुमान प्रक्रिया को प्रेरित करते हैं। बायेसियन मॉडल के साथ काम करते समय संबंधित कार्यों की एक श्रृंखला होती है जिसे स्वयं अनुमान के अलावा संबोधित करने की आवश्यकता होती है:


 * अनुमान की गुणवत्ता का निदान, मार्कोव श्रृंखला मोंटे कार्लो तकनीकों जैसे संख्यात्मक तरीकों का उपयोग करते समय इसकी आवश्यकता होती है
 * मॉडल आलोचना, जिसमें मॉडल मान्यताओं और मॉडल भविष्यवाणियों दोनों का मूल्यांकन शामिल है
 * मॉडल चयन या मॉडल औसत सहित मॉडलों की तुलना
 * किसी विशेष दर्शक वर्ग के लिए परिणामों की तैयारी

ये सभी कार्य बायेसियन मॉडल दृष्टिकोण के अन्वेषणात्मक विश्लेषण का हिस्सा हैं और उनका सफलतापूर्वक प्रदर्शन करना पुनरावृत्त और इंटरैक्टिव मॉडलिंग प्रक्रिया का केंद्र है। इन कार्यों के लिए संख्यात्मक और दृश्य सारांश दोनों की आवश्यकता होती है।

यह भी देखें

 * बायेसियन ज्ञानमीमांसा
 * इस लेख में प्रयुक्त गणितीय तर्क संकेतन की सूची के लिए
 * संभाव्यता और सांख्यिकी में अंकन
 * तर्क प्रतीकों की सूची

अग्रिम पठन

 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398

बाहरी संबंध

 * Bayesian statistics David Spiegelhalter, Kenneth Rice Scholarpedia 4(8):5230. 10.4249/scholarpedia.5230
 * Bayesian modeling book and examples available for downloading.
 * Bayesian A/B Testing Calculator Dynamic Yield
 * Bayesian statistics David Spiegelhalter, Kenneth Rice Scholarpedia 4(8):5230. 10.4249/scholarpedia.5230
 * Bayesian modeling book and examples available for downloading.
 * Bayesian A/B Testing Calculator Dynamic Yield
 * Bayesian A/B Testing Calculator Dynamic Yield