बायेसियन सांख्यिकी

बायेसियन सांख्यिकी बायेसियन संभाव्यता पर आधारित सांख्यिकी के क्षेत्र में सिद्धांत है जहां संभाव्यता घटना (प्रायिकता सिद्धांत) में धारणा का परिमाण व्यक्त करती है। धारणा का परिमाण घटना के बारे में पूर्व ज्ञान पर आधारित हो सकती है, जैसे कि पिछले प्रयोगों के परिणाम, या घटना के बारे में व्यक्तिगत धारणाओं पर यह कई अन्य प्रायिकता व्याख्याओं से भिन्न है। जैसे फ़्रीक्वेंटिस्ट प्रायिकता व्याख्या जो प्रायिकता को कई परीक्षणों के बाद किसी घटना की सापेक्ष आवृत्ति के अनुक्रम की सीमा के रूप में देखती है।

बायेसियन सांख्यिकीय विधियां नया डेटा प्राप्त करने के बाद संभावनाओं की गणना और अद्यतन करने के लिए बेयस प्रमेय का उपयोग करती हैं। बेयस प्रमेय डेटा के साथ-साथ घटना या घटना से संबंधित स्थितियों के बारे में पूर्व सूचना या मान्यताओं के आधार पर किसी घटना की सशर्त प्रायिकता का वर्णन करता है। उदाहरण के लिए, बायेसियन निष्कर्ष में, बेयस प्रमेय का उपयोग संभाव्यता वितरण या सांख्यिकीय मॉडल के मापदंडो का निष्कर्ष लगाने के लिए किया जा सकता है। चूंकि बेयसियन सांख्यिकी संभाव्यता को धारणा का परिमाण के रूप में मानते हैं, बेयस प्रमेय सीधे संभाव्यता वितरण प्रदान कर सकता है जो मापदंड या मापदंड के समुच्चय को धारणा को मापता है।

बायेसियन सांख्यिकी का नाम थॉमस बेयस के नाम पर रखा गया है। जिन्होंने 1763 में प्रकाशित डॉक्ट्रिन ऑफ चांस में समस्या को हल करने की दिशा में निबंध में बेयस प्रमेय का विशिष्ट स्थिति तैयार किया था। लाप्लास ने संभाव्यता की बायेसियन व्याख्या विकसित की थी। लाप्लास ने कई सांख्यिकीय समस्याओं को हल करने के लिए उन विधियों का उपयोग किया जिन्हें अब बायेसियन माना जाता है। कई बायेसियन विधियों को बाद के लेखकों द्वारा विकसित किया गया था। किन्तु 1950 के दशक तक इस तरह के विधियों का वर्णन करने के लिए सामान्यतः इस शब्द का उपयोग नहीं किया गया था। 20वीं शताब्दी के अधिकांश समय के पश्चात्, दार्शनिक और व्यावहारिक विचारों के कारण कई सांख्यिकीविदों द्वारा बायेसियन विधियों को प्रतिकूल रूप से देखा गया था। कई बायेसियन विधियों को पूरा करने के लिए बहुत अधिक संगणना की आवश्यकता होती है, और शताब्दी के पश्चात् व्यापक रूप से उपयोग की जाने वाली अधिकांश विधियाँ बारंबारतावादी व्याख्या पर आधारित थीं। चूँकि, मार्कोव चेन मोंटे कार्लो जैसे शक्तिशाली कंप्यूटरों और नए कलन विधि के आगमन के साथ, 21वीं सदी में बायेसियन विधियों का सांख्यिकी में उपयोग बढ़ता हुआ देखा गया है।

बेयस प्रमेय
बेयस प्रमेय का उपयोग बायेसियन विधियों में संभावनाओं को अद्यतन करने के लिए किया जाता है, जो नए डेटा प्राप्त करने के बाद धारणा का परिमाण हैं। दो घटनाओं $$A$$ और $$B$$ को देखते हुए $$A$$ की सशर्त प्रायिकता दी गई है कि $$B$$ सत्य है, इस प्रकार व्यक्त किया गया है।

$$P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B)}$$ जहां $$P(B) \neq 0$$ चूँकि बेयस प्रमेय संभाव्यता सिद्धांत का मौलिक परिणाम है, किन्तु बायेसियन सांख्यिकी में इसकी विशिष्ट व्याख्या है। उपरोक्त समीकरण में, $$A$$ सामान्यतः प्रस्ताव का प्रतिनिधित्व करता है (जैसे कथन है कि एक सिक्का पचास प्रतिशत समय पर सिर पर पड़ता है) और $$B$$ प्रमाण का प्रतिनिधित्व करता है, या नया डेटा जिसे ध्यान में रखा जाना है (जैसे परिणाम सिक्का फ़्लिप की श्रृंखला)। $$P(A)$$ $$A$$ की पूर्व प्रायिकता है जो प्रमाण को ध्यान में रखे जाने से पहले $$A$$ के बारे में किसी के विश्वास को व्यक्त करता है। पूर्व संभाव्यता भी $$A$$. $$P(B \mid A)$$ के बारे में जानकारी की मात्रा निर्धारित कर सकती है, प्रायिकता कार्य है, जिसे प्रमाण $$B$$ की प्रायिकता के रूप में व्याख्या किया जा सकता है कि $$A$$ सच है। प्रायिकता यह निर्धारित करती है कि प्रमाण $$B$$ किस सीमा तक प्रस्ताव का समर्थन करता है $$A$$. $$P(A \mid B)$$ पश्च संभाव्यता है, प्रमाण $$B$$ को ध्यान में रखने के बाद प्रस्ताव $$A$$ की प्रायिकता नए प्रमाण $$B$$ पर विचार करने के बाद अनिवार्य रूप से, बेयस प्रमेय किसी के पूर्व विश्वास $$P(A)$$ को अद्यतन करता है।

प्रमाण की प्रायिकता $$P(B)$$ कुल संभाव्यता के नियम का उपयोग करके गणना की जा सकती है। यदि $$\{A_1, A_2, \dots, A_n\}$$ प्रतिरूप स्थान के एक समुच्चय का विभाजन है, जो एक प्रयोग के सभी परिणाम (संभाव्यता) का समुच्चय है, फिर,

$$P(B) = P(B \mid A_1)P(A_1) + P(B \mid A_2)P(A_2) + \dots + P(B \mid A_n)P(A_n) = \sum_i P(B \mid A_i)P(A_i)$$ जब अनंत संख्या में परिणाम हों तो कुल संभाव्यता के नियम का उपयोग करके $$P(B)$$ की गणना करने के लिए सभी परिणामों को एकीकृत करना आवश्यक है। अधिकांशतः $$P(B)$$ की गणना करना कठिन होता है क्योंकि गणना में रकम या इंटीग्रल सम्मिलित होते हैं जो मूल्यांकन करने के लिए समय लेने वाली होती हैं | इसलिए अधिकांशतः केवल पूर्व और संभावना के उत्पाद पर विचार किया जाता है क्योंकि प्रमाण उसी विश्लेषण में नहीं बदलते हैं। पश्च भाग इस उत्पाद के समानुपाती होता है।

$$P(A \mid B) \propto P(B \mid A)P(A)$$

अधिकतम पोस्टरियोरी, जो कि पोस्टीरियर का मोड (सांख्यिकी) है और अधिकांशतः गणितीय अनुकूलन विधियों का उपयोग करके बायेसियन आँकड़ों में गणना की जाती है, वही रहता है। मार्कोव श्रृंखला मोंटे कार्लो या परिवर्तनशील बायेसियन विधियों जैसे विधियों के साथ $$P(B)$$ के स्पष्ट मान की गणना किए बिना भी पश्च का निष्कर्ष लगाया जा सकता है।

बायेसियन विधियों की रूपरेखा
सांख्यिकीय विधियों के सामान्य समुच्चय को कई गतिविधियों में विभाजित किया जा सकता है। जिनमें से कई विशेष बायेसियन संस्करण हैं।

बायेसियन निष्कर्ष
बायेसियन निष्कर्ष सांख्यिकीय निष्कर्ष को संदर्भित करता है जहां संभाव्यता का उपयोग करके अनुमानों में अनिश्चितता की मात्रा निर्धारित की जाती है। मौलिक आवृत्तिवादी निष्कर्ष में, मॉडल मापदंड और परिकल्पना को निश्चित माना जाता है। प्रायिकतावादी निष्कर्ष में प्रायिकताओं को प्राचलों या परिकल्पनाओं के लिए निर्दिष्ट नहीं किया जाता है। उदाहरण के लिए, बारंबारतावादी निष्कर्ष में किसी घटना को स्पष्ट रूप से प्रायिकता निर्दिष्ट करने का कोई कारण नहीं होगा जो केवल एक बार हो सकती है, जैसे कि निष्पक्ष सिक्के के अगले फ्लिप का परिणाम चूँकि, यह कहना समझदारी होगी कि बड़ी संख्या के नियम के प्रमुखों का अनुपात सिक्का उछालने की संख्या बढ़ने पर आधा हो जाता है।

सांख्यिकीय मॉडल सांख्यिकीय मान्यताओं और प्रक्रियाओं का समुच्चय निर्दिष्ट करते हैं | जो दर्शाते हैं कि प्रतिरूप डेटा कैसे उत्पन्न होता है। सांख्यिकीय मॉडल में कई मापदंड होते हैं जिन्हें संशोधित किया जा सकता है। उदाहरण के लिए, एक सिक्के को बर्नौली वितरण से प्रतिरूप के रूप में दर्शाया जा सकता है, जो दो संभावित परिणामों को मॉडल करता है। बर्नौली वितरण में परिणाम की प्रायिकता के समान एकल मापदंड है। जो अधिकतर स्थितियों में सिर पर उतरने की प्रायिकता है। बायेसियन निष्कर्ष में डेटा के लिए अच्छा मॉडल तैयार करना केंद्रीय है। अधिकतर स्थितियों में, मॉडल केवल वास्तविक प्रक्रिया का निष्कर्ष लगाते हैं, और डेटा को प्रभावित करने वाले कुछ कारकों को ध्यान में नहीं रख सकते हैं। बायेसियन निष्कर्ष में, प्रायिकताएं मॉडल पैरामीटर्स को असाइन की जा सकती हैं। मापदंडों को यादृच्छिक चर के रूप में दर्शाया जा सकता है। बायेसियन निष्कर्ष अधिक प्रमाण प्राप्त या ज्ञात होने के बाद संभावनाओं को अद्यतन करने के लिए बेयस प्रमेय का उपयोग करता है।

सांख्यिकीय मॉडलिंग
बायेसियन आँकड़ों का उपयोग करते हुए सांख्यिकीय मॉडल के निर्माण में किसी भी अज्ञात मापदंडों के लिए पूर्व वितरण के विनिर्देश की आवश्यकता की पहचान करने की विशेषता है। वास्तव में, पूर्व वितरण के मापदंडों में स्वयं पूर्व वितरण हो सकते हैं, जिससे बायेसियन पदानुक्रमित मॉडलिंग हो सकती है। बहु-स्तरीय मॉडलिंग के रूप में भी जाना जाता है। विशेष स्थिति बायेसियन नेटवर्क है।

बायेसियन सांख्यिकीय विश्लेषण करने के लिए, वैन डी शूट एट अल द्वारा सर्वोत्तम प्रथाओं पर चर्चा की जाती है। बायेसियन सांख्यिकीय विश्लेषण के परिणामों की रिपोर्टिंग के लिए, बायेसियन विश्लेषण रिपोर्टिंग दिशानिर्देश (बर्ग) जॉन के. क्रुश्के द्वारा एक ओपन-एक्सेस लेख में प्रदान किए गए हैं।

प्रयोगों की रचना
प्रयोगों के बेयसियन रचना में 'पूर्व मान्यताओं का प्रभाव' नामक अवधारणा सम्मिलित है। यह दृष्टिकोण अगले प्रयोग के रचना में पहले के प्रयोगों के परिणाम को सम्मिलित करने के लिए अनुक्रमिक विश्लेषण विधियों का उपयोग करता है। यह पूर्व और पश्च वितरण के उपयोग के माध्यम से 'धारणाओं' को अद्यतन करके प्राप्त किया जाता है। यह प्रयोगों के रचना को सभी प्रकार के संसाधनों का अच्छा उपयोग करने की अनुमति देता है। इसका उदाहरण मल्टी-आर्म्ड बैंडिट समस्या है।

बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण
बायेसियन मॉडल का अन्वेषणात्मक विश्लेषण बायेसियन मॉडलिंग की आवश्यकताओं और विशिष्टताओं के लिए अन्वेषणात्मक डेटा विश्लेषण दृष्टिकोण का अनुकूलन या विस्तार है। फारसी डायकोनिस के शब्दों में: "खोजपूर्ण डेटा विश्लेषण संरचना, या डेटा में सरल विवरण प्रकट करना चाहता है। हम संख्याओं या ग्राफ़ को देखते हैं और पैटर्न खोजने का प्रयास करते हैं। हम पृष्ठभूमि की जानकारी, कल्पना, कथित पैटर्न और अन्य डेटा विश्लेषणों के साथ अनुभव द्वारा सुझाए गए लीड का पीछा करते हैं"

बायेसियन इंट्रेंस पोस्टीरियर डिस्ट्रीब्यूशन उत्पन्न करता है। जिसमें बायेसियन स्टैटिस्टिक्स में केंद्रीय भूमिका होती है, साथ में अन्य डिस्ट्रीब्यूशन जैसे पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन और प्री प्रेडिक्टिव डिस्ट्रीब्यूशन इन वितरणों का सही विज़ुअलाइज़ेशन, विश्लेषण और व्याख्या उन सवालों के सही उत्तर देने के लिए महत्वपूर्ण है जो निष्कर्ष प्रक्रिया को प्रेरित करते हैं।

बायेसियन मॉडल के साथ काम करते समय संबंधित कार्यों की श्रृंखला होती है। जिसे स्वयं निष्कर्ष के अलावा संबोधित करने की आवश्यकता होती है।


 * निष्कर्ष की गुणवत्ता का निदान, मार्कोव श्रृंखला मोंटे कार्लो विधियों जैसे संख्यात्मक विधियों का उपयोग करते समय इसकी आवश्यकता होती है।
 * मॉडल आलोचना, जिसमें मॉडल मान्यताओं और मॉडल पूर्वानुमानो दोनों का मूल्यांकन सम्मिलित है।
 * मॉडल चयन या मॉडल औसत सहित मॉडलों की तुलना करती है।
 * किसी विशेष दर्शक वर्ग के लिए परिणामों की तैयारी होती है।

ये सभी कार्य बायेसियन मॉडल दृष्टिकोण के अन्वेषणात्मक विश्लेषण का भाग हैं और उनका सफलतापूर्वक प्रदर्शन करना पुनरावृत्त और इंटरैक्टिव मॉडलिंग प्रक्रिया का केंद्र है। इन कार्यों के लिए संख्यात्मक और दृश्य सारांश दोनों की आवश्यकता होती है।

यह भी देखें

 * बायेसियन ज्ञानशास्त्र
 * इस लेख में प्रयुक्त गणितीय तर्क संकेतन की सूची के लिए
 * संभाव्यता और सांख्यिकी में अंकन
 * तर्क प्रतीकों की सूची

अग्रिम पठन

 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398
 * Johnson, Alicia A.; Ott, Miles Q.; Dogucu, Mine. (2022) Bayes Rules! An Introduction to Applied Bayesian Modeling. Chapman and Hall ISBN 9780367255398

बाहरी संबंध

 * Bayesian statistics David Spiegelhalter, Kenneth Rice Scholarpedia 4(8):5230. 10.4249/scholarpedia.5230
 * Bayesian modeling book and examples available for downloading.
 * Bayesian A/B Testing Calculator Dynamic Yield
 * Bayesian statistics David Spiegelhalter, Kenneth Rice Scholarpedia 4(8):5230. 10.4249/scholarpedia.5230
 * Bayesian modeling book and examples available for downloading.
 * Bayesian A/B Testing Calculator Dynamic Yield
 * Bayesian A/B Testing Calculator Dynamic Yield