द्विपद वितरण

From Vigyanwiki

संभाव्यता सिद्धांत और सांख्यिकी में, n और p मापदंडों के साथ द्विपद वितरण n सांख्यिकीय स्वतंत्रता के रूप में प्रयोग किया जाता है तथा (प्रायिकता सिद्धांत) के क्रम में सफलताओं की संख्या का असतत संभाव्यता वितरण है, प्रत्येक हां-नहीं प्रश्न पूछ रहा है, और प्रत्येक अपने स्वयं के बूलियन-मूल्यवान फलन-मूल्यवान परिणाम (संभावना) के साथ: सफलता (संभावना के साथ p) या विफलता (संभाव्यता के साथ) (). एकल सफलता/विफलता प्रयोग को बर्नौली परीक्षण या बर्नौली प्रयोग भी कहा जाता है, और परिणामों के अनुक्रम को बर्नौली प्रक्रिया कहा जाता है; एकल परीक्षण के लिए, अर्थात, n = 1, द्विपद वितरण बर्नौली वितरण है। तथा द्विपद वितरण सांख्यिकीय महत्व के लोकप्रिय द्विपद परीक्षण का आधार है।[1] द्विपद वितरण का उपयोग अधिकांशतः आकार n की जनसंख्या से प्रतिस्थापन के साथ खींचे गए आकार n के नमूने में सफलताओं की संख्या को मॉडल करने के लिए किया जाता है। यदि नमूना प्रतिस्थापन के बिना किया जाता है, तब ड्रॉ स्वतंत्र नहीं होते हैं और इसलिए परिणामी वितरण एक हाइपरज्यामितीय होता है वितरण, द्विपद वितरण नहीं है। चूँकि, n से बहुत बड़े N के लिए, द्विपद वितरण एक अच्छा सन्निकटन बना हुआ है, और व्यापक रूप से उपयोग किया जाता है।

परिभाषाएँ

संभाव्यता द्रव्यमान फलन

सामान्यतः, यदि यादृच्छिक चर X पैरामीटर n ∈ प्राकृतिक संख्या के साथ द्विपद वितरण का अनुसरण करता है और p ∈ [0,1], हम X ~ B(n, p) लिखते हैं। n स्वतंत्र बर्नौली परीक्षणों में बिल्कुल k सफलताएँ प्राप्त करने की प्रायिकता संभाव्यता द्रव्यमान फलन द्वारा दी गई है:

k = 0, 1, 2, ..., n , जहां के लिए

द्विपद गुणांक है, इसलिए इसका नाम द्विपद वितरण है। सूत्र को इस प्रकार समझा जा सकता है: k सफलताएँ प्रायिकता pk के साथ होती हैं और n−k विफलताएँ संभाव्यता के साथ होती हैं . चूँकि, k सफलताएँ n परीक्षणों के मध्य कहीं भी हो सकती हैं, और वहाँ हैं n परीक्षणों के क्रम में k सफलताओं को वितरित करने के विभिन्न विधियों ।

द्विपद वितरण संभाव्यता के लिए संदर्भ सारणी बनाने में, सामान्यतः तालिका को n/2 मानों तक भर दिया जाता है। ऐसा इसलिए है क्योंकि k > n/2 के लिए, प्रायिकता की गणना इसके पूरक के रूप में की जा सकती है

अभिव्यक्ति f(k, n, p) को k के फलन के रूप में देखते हुए, k मान है जो इसे अधिकतम करता है। यह k मान गणना करके पाया जा सकता है

और इसकी तुलना 1 से करें। सदैव पूर्णांक M होता है जो संतुष्ट करता है[2]

f(k, n, p) k < M के लिए मोनोटोन बढ़ रहा है और k > M के लिए मोनोटोन घट रहा है, उस स्थितियोंको छोड़कर जहां (n + 1)p पूर्णांक है। इस स्थितियों में, ऐसे दो मान हैं जिनके लिए f अधिकतम है: (n + 1)p और (n + 1)p − 1। है तथा M सबसे संभावित परिणाम है (अर्थात, सबसे अधिक संभावना है, चूंकि यह अभी भी असंभव हो सकता है कुल मिलाकर) बरनौली परीक्षण और इसे मोड (सांख्यिकी) भी कहा जाता है।

उदाहरण

मान लीजिए कि एक पक्षपाती सिक्का उछालने पर प्रायिकता 0.3 के साथ शीर्ष पर आता है। और 6 बार उछालने पर ठीक 4 सिर देखने की प्रायिकता है

संचयी वितरण फलन

संचयी वितरण फलन के रूप में व्यक्त किया जा सकता है:

जहाँ k के नीचे का तल है, अर्थात फर्श और छत k से कम या उसके सामान्तर फलन करता है।

इसे नियमित रूप से अपूर्ण बीटा फलन के संदर्भ में निम्नानुसार भी प्रदर्शित किया जा सकता है:[3]

जो कि F-वितरण | के संचयी वितरण फलन के समतुल्य हैF-वितरण:[4]

संचयी वितरण फलन के लिए कुछ सवृत-फ़ॉर्म बाउंड या टेल बाउंड दिए गए हैं.

गुण

अपेक्षित मूल्य और विचरण

यदि X ~ B(n, p), अर्थात, X द्विपद रूप से वितरित यादृच्छिक चर है, n प्रयोगों की कुल संख्या है और p प्रत्येक प्रयोग के सफल परिणाम देने की संभावना है, तब X का अपेक्षित मान है:[5]

यह इस तथ्य के साथ-साथ अपेक्षित मूल्य की रैखिकता का अनुसरण करता है कि X n का योग है तथा समान बर्नौली यादृच्छिक चर, प्रत्येक अपेक्षित मूल्य p के साथ है| दूसरे शब्दों में, यदि पैरामीटर के p साथ समान (और स्वतंत्र) बर्नौली यादृच्छिक चर हैं , तब और

भिन्नता है:

यह इसी तरह इस तथ्य से अनुसरण करता है कि स्वतंत्र यादृच्छिक चर के योग का विचरण भिन्नताओं का योग है।

उच्च क्षण

पहले 6 केंद्रीय क्षण, के रूप में परिभाषित , द्वारा दिया गया है

गैर-केंद्रीय क्षण संतुष्ट करते हैं

और सामान्यतः[6][7]

कहाँ दूसरी तरह की स्टर्लिंग संख्याएँ हैं, और है वें अवरोही और आरोही क्रम गुणित .एक साधारण बंधन [8] प्वासों वितरण या उच्चतर क्षणों के माध्यम से द्विपद आघूर्णों को बाउंड करके अनुसरण करता है:

इससे पता चलता है कि यदि , तब से अधिक से अधिक स्थिर कारक दूर है

मोड

सामान्यतः द्विपद B(n,-p) वितरण का बहुलक (सांख्यिकी) सामान्तर होता है , जहाँ फर्श फलन है। चूँकि, जब (n + 1)p पूर्णांक होता है और p न तो 0 होता है और न ही 1, तो वितरण के दो विधियों होते हैं: (n + 1)p और (n + 1)p − 1। जब p 0 के सामान्तर होता है या 1 होता है , तो मोड क्रमशः 0 और n होगा। इन स्थितियों को संक्षेप में निम्नानुसार किया जा सकता है:

प्रमाण: चलो

के लिए केवल के साथ शून्येतर मान है . के लिए हम देखतें है और के लिए . इससे सिद्ध होता है कि बहुलक 0 है और के लिए .

होने देना . हम देखतें है

.

इससे इस प्रकार है

तब कब जब पूर्णांक है, तब और विधा है। उस स्थितियों में , सिर्फ तभी विधा है।[9]


मध्य

सामान्यतः, द्विपद वितरण के लिए माध्यिका ज्ञात करने के लिए कोई एकल सूत्र नहीं होता है, और यह गैर-अद्वितीय भी हो सकता है। चूँकि, अनेक विशेष परिणाम स्थापित किए गए हैं:

  • यदि np पूर्णांक है, तब माध्य, माध्यिका और बहुलक संपाती हैं और np के सामान्तर हैं।[10][11]
  • किसी भी माध्यिका m को अंतराल ⌊np⌋ ≤ m ≤ ⌈np⌉ के अंदर होना चाहिए।[12]
  • माध्यिका m माध्य से बहुत दूर नहीं हो सकता: |mnp| ≤ min{ ln 2, max{p, 1 − p} }.[13]
  • माध्य अद्वितीय है और m = राउंडिंग (np) के सामान्तर है जब |m − np| ≤ मिनट {p, 1 − p} (स्थितियोंको छोड़कर जब p =1/2 और n विषम है)।[12]
  • जब p परिमेय संख्या है (p = 1/2 और n विषम को छोड़कर) तब माध्य अद्वितीय होता है।[14]
  • जब p = 1/2 और n विषम हो, तब अंतराल में कोई भी संख्या m 1/2(n − 1) ≤ m ≤1/2(n + 1) द्विपद वितरण की माध्यिका है। यदि p = 1/2 और n सम है, तब m = n/2 अद्वितीय माध्यिका है।

ल बाउंड्स

knp के लिए, संचयी वितरण फलन की निचली पूंछ के लिए होता है जिससे ऊपरी सीमाएं प्राप्त की जा सकती हैं , संभावना है कि अधिक से अधिक k सफलताएँ हैं। चूँकि , इन सीमाओं को k ≥ np के संचयी वितरण फलन की ऊपरी पूंछ के लिए सीमाओं के रूप में भी देखा जा सकता है।

हॉफडिंग की असमानता से सरल सीमा प्राप्त होती है

जो चूंकि ज्यादा टाइट नहीं है। विशेष रूप से, p = 1 के लिए, हमारे पास वह F(k;n,p) = 0 (स्थिर k के लिए, n के साथ k < n) है, किन्तु होफ़डिंग की सीमा धनात्मक स्थिरांक का मूल्यांकन करती है।

चेर्नॉफ़ बाउंड से शार्प बाउंड प्राप्त किया जा सकता है:[15]

जहां D (a|| p) कुल्बैक-लीब्लर डाइवर्जेंस है। a -सिक्का और p-सिक्का (अर्थात बर्नौली (a) और बर्नौली (p) वितरण के मध्य) के मध्य सापेक्ष एन्ट्रॉपी (या कुल्बैक-लीब्लर डाइवर्जेंस) है:

असम्बद्ध रूप से, यह सीमा यथोचित तंग है; देखना [15]जानकारी के लिए।

कोई निचली सीमा भी प्राप्त कर सकता है , विरोधी एकाग्रता सीमा के रूप में जाना जाता है। स्टर्लिंग के सूत्र के साथ द्विपद गुणांक का अनुमान लगाकर यह दिखाया जा सकता है[16]

जिसका तात्पर्य सरल किन्तुशिथिल बाध्यता से है

p = 1/2 और k ≥ 3n/8 के लिए भी n के लिए, भाजक को स्थिर बनाना संभव है:[17]


सांख्यिकीय निष्कर्ष

मापदंडों का अनुमान

जब n ज्ञात हो, तब सफलताओं के अनुपात का उपयोग करके पैरामीटर p का अनुमान लगाया जा सकता है:

यह अनुमानक अधिकतम संभावना अनुमानक और क्षणों की विधि (सांख्यिकी) का उपयोग करके पाया जाता है। यह अनुमानक अनुमानक का पूर्वाग्रह है और समान रूप से न्यूनतम-विचरण निष्पक्ष अनुमानक के साथ, लेहमैन-शेफ़े प्रमेय का उपयोग करके सिद्ध किया गया है, क्योंकि यह न्यूनतम पर्याप्त और पूर्णता (सांख्यिकी) आँकड़ा (अर्थात: x) पर आधारित है। यह संभाव्यता और माध्य चुकता त्रुटि दोनों में संगत अनुमानक भी है।

p के लिए सवृत रूप बेयस अनुमानक भी उपस्थित है जब बीटा वितरण को संयुग्मित पूर्व पूर्व वितरण के रूप में उपयोग किया जाता है। सामान्य का उपयोग करते समय पूर्व के रूप में, बेयस अनुमानक या पोस्टीरियर माध्य अनुमानक है:

बायस आकलनकर्ता स्पर्शोन्मुख दक्षता (बायस) है और जैसे ही नमूना आकार अनंत (n → ∞) तक पहुंचता है, यह अधिकतम संभावना अनुमान समाधान तक पहुंचता है। बेयस अनुमानक अनुमानक का पूर्वाग्रह है (कितना पूर्ववर्तियों पर निर्भर करता है), बेयस अनुमानक या स्वीफलनता और संभाव्यता में लगातार अनुमानक।

गैर-सूचनात्मक पूर्व के रूप में मानक वर्दी वितरण का उपयोग करने के विशेष स्थितियों के लिए, , पश्च माध्य अनुमानक बन जाता है:

(एक बेयस अनुमानक या पश्च मोड को केवल मानक अनुमानक तक ले जाना चाहिए।) इस पद्धति को उत्तराधिकार का नियम कहा जाता है, जिसे 18 वीं शताब्दी में पियरे-साइमन लाप्लास द्वारा प्रस्तुत किया गया था।

बहुत दुर्लभ घटनाओं और छोटे n के साथ p का आकलन करते समय (उदाहरण के लिए: यदि x = 0), तब मानक अनुमानक का उपयोग करने की ओर जाता है जो कभी-कभी अवास्तविक और अवांछनीय होता है। ऐसे स्थितियों में विभिन्न वैकल्पिक आकलनकर्ता हैं।[18] बेयस अनुमानक का उपयोग करने का विधि है, जिससे:

एक अन्य विधि तीन के नियम (सांख्यिकी) का उपयोग करके प्राप्त विश्वास अंतराल की ऊपरी सीमा का उपयोग करना है:


विश्वास अंतराल

यहां तक ​​कि n के अधिक बड़े मूल्यों के लिए, माध्य का वास्तविक वितरण महत्वपूर्ण रूप से असामान्य है।[19] इस समस्या के कारण कॉन्फिडेंस इंटरवल का अनुमान लगाने के लिए अनेक विधियों प्रस्तावित किए गए हैं।

नीचे दिए गए कॉन्फ़िडेंस इंटरवल के समीकरणों में, वेरिएबल्स के निम्नलिखित अर्थ हैं:

  • n1, n में से सफलताओं की संख्या है, परीक्षणों की कुल संख्या
  • सफलताओं का अनुपात है
  • लक्ष्य त्रुटि दर के अनुरूप मानक सामान्य वितरण (अर्थात, प्रोबिट) का परिमाण है . उदाहरण के लिए, 95% विश्वास स्तर के लिए त्रुटि = 0.05, इसलिए = 0.975 और  = 1.96.

वाल्ड विधि

0.5/n का निरंतरता सुधार जोड़ा जा सकता है।


अग्रेस्ती-कूल विधि

[20]

यहाँ p का अनुमान संशोधित किया गया है

यह विधि और के लिए यह विधि अच्छा काम करता है. [21] के लिए यहां देखें .[22] के लिए नीचे दी गई विल्सन (स्कोर) विधि का उपयोग करें।

आर्कसीन विधि

[23]


विल्सन (स्कोर) विधि

नीचे दिए गए सूत्र में अंकन पिछले सूत्रों से दो तरह से भिन्न है:[24]

  • सबसे पहले, zx नीचे दिए गए सूत्र में इसकी थोड़ी अलग व्याख्या है: इसका सामान्य अर्थ '(1 − x)-th क्वांटाइल' के लिए शॉर्टहैंड होने के अतिरिक्त 'मानक सामान्य वितरण का xवां क्वांटाइल' है।
  • दूसरे, यह सूत्र दो सीमाओं को परिभाषित करने के लिए प्लस-माइनस का उपयोग नहीं करता है। इसके बजाय, कोई निचली सीमा पाने के लिए उपयोग कर सकता है या ऊपरी सीमा पाने के लिए। उपयोग करें उदाहरण के लिए: 95% कॉन्फिडेंस लेवल के लिए एरर = 0.05, इसलिए उपयोग करने पर व्यक्ति को निचली सीमा मिलती है, और का उपयोग करके ऊपरी सीमा प्राप्त होती है .
[25]


तुलना

तथाकथित स्पष्ट (द्विपद अनुपात विश्वास अंतराल या क्लॉपर-पियर्सन अंतराल | क्लॉपर-पियर्सन) विधि सबसे रूढ़िवादी है।[19] (स्पष्ट का मतलब पूरी तरह से स्पष्ट नहीं है; किंतु, यह इंगित करता है कि अनुमान सही मूल्य से कम रूढ़िवादी नहीं होंगे।)

वाल्ड विधि, चूंकि सामान्यतः पाठ्यपुस्तकों में अनुशंसित है, सबसे पक्षपाती है।

संबंधित वितरण

द्विपदों का योग

यदि X ~ B(n, p) और Y ~ B(m, p) समान प्रायिकता p वाले स्वतंत्र द्विपद चर हैं, तब X + Y फिर से द्विपद चर है; इसका वितरण Z=X+Y ~ B(n+m, p) है:[26]

एक द्विपद वितरित यादृच्छिक चर X ~ B(n, p) को n बर्नौली वितरित यादृच्छिक चर के योग के रूप में माना जा सकता है। तब दो द्विपद वितरित यादृच्छिक चर X ~ B(n, p) और Y ~ B(m, p) का योग n + m बर्नौली वितरित यादृच्छिक चर के योग के सामान्तर है, जिसका अर्थ है Z=X+Y ~ B( n + m, p)। यह अतिरिक्त नियम का उपयोग करके भी सीधे सिद्ध किया जा सकता है।

चूँकि, यदि X और Y में समान प्रायिकता p नहीं है, तब योग का विचरण द्विपद योग विचरण असमानता के रूप में वितरित किया जाएगा

पोइसन द्विपद वितरण

द्विपद वितरण प्वासों द्विपद वितरण का विशेष स्तिथियाँ है, जो n स्वतंत्र गैर-समरूप बर्नौली परीक्षणों के योग B(pi). का वितरण है [27]

दो द्विपद बंटनों का अनुपात

यह परिणाम पहली बार 1978 में काट्ज़ और सह-लेखकों द्वारा प्राप्त किया गया था।[28]

चलो x~ ~ b(n, p1) और y~ b(m,p2) स्वतंत्र रहें। चलो टी = (x/n)/(y/m)।

फिर लॉग (T) लगभग सामान्य रूप से औसत लॉग (p1/p2) और विचरण ((1/p1) − 1)/n + ((1/p2) − 1)/मी. के साथ वितरित किया जाता है

सशर्त द्विपद

यदि X ~ B(n, p) और Y | X ~ B(X, q) (Y का सशर्त वितरण, दिया गया X), तब Y वितरण Y ~ B(n, pq) के साथ सरल द्विपद यादृच्छिक चर है।

उदाहरण के लिए, n गेंदों को एक टोकरी UX में फेंकने और उन गेंदों को लेने की कल्पना करें जो हिट होती हैं और उन्हें दूसरी टोकरी UY में फेंक देती हैं। यदि p, UX से टकराने की संभावना है तब X ~ B(n, p) UX से टकराने वाली गेंदों की संख्या है। यदि q, UY से टकराने की संभावना है तो UY से टकराने वाली गेंदों की संख्या Y ~ B(X, q) है और इसलिए Y ~ B(n, pq) है।

[Proof]

तब से और , कुल संभाव्यता के कानून द्वारा,

तब से उपरोक्त समीकरण के रूप में व्यक्त किया जा सकता है

फैक्टरिंग और उन सभी शर्तों को खींच रहा है जिन पर निर्भर नहीं है योग से बाहर अब पैदावार

प्रतिस्थापित करने के बाद उपरोक्त अभिव्यक्ति में, हम प्राप्त करते हैं

ध्यान दें कि योग (कोष्ठक में) ऊपर के बराबर है द्विपद प्रमेय द्वारा। अंत में उपज में इसे प्रतिस्थापित करना

और इस तरह जैसी इच्छा थी।


बरनौली वितरण

बर्नौली वितरण द्विपद वितरण का विशेष स्तिथियाँ है, जहां n = 1. सांकेतिक रूप से, X ~ B(1, p) का वही अर्थ है जो X ~ बरनौली(p) का है। इसके विपरीत, कोई भी द्विपद वितरण , B(n, p), n स्वतंत्र बर्नौली परीक्षणों के योग का वितरण है, बरनौली(p), प्रत्येक की समान प्रायिकता p है।[29]


सामान्य सन्निकटन

n = 6 और p = 0.5 के लिए द्विपद संभाव्यता द्रव्यमान फलन और सामान्य संभावना घनत्व फलन सन्निकटन

यदि n अधिक बड़ा है, तब वितरण का तिरछा बहुत बड़ा नहीं है। इस स्थितियों में सामान्य वितरण द्वारा B(n, p) के लिए उचित सन्निकटन दिया जाता है

और उपयुक्त निरंतरता सुधार का उपयोग करके इस मूलभूत सन्निकटन को सरल विधियों के द्वारा से सुधारा जा सकता है। मूलभूत सन्निकटन सामान्यतः n बढ़ने (कम से कम 20) के रूप में उत्तम होता है और उत्तम होता है जब p 0 या 1 के करीब नहीं होता है। अंगूठे के विभिन्न नियमों का उपयोग यह तय करने के लिए किया जा सकता है कि n अधिक बड़ा है, और p 0 या k चरम से अधिक दूर है:

  • एक नियम[30] यह है कि n > 5 के लिए सामान्य सन्निकटन पर्याप्त है यदि तिरछापन का पूर्ण मान सख्ती से 0.3 से कम है; वह है, यदि

इसे बेरी-एस्सेन प्रमेय का उपयोग करके स्पष्ट बनाया जा सकता है।

  • एक शक्तिशाली नियम बताता है कि सामान्य सन्निकटन तभी उचित है जब इसके माध्य के 3 मानक विचलन के अंदर सब कुछ संभावित मूल्यों की सीमा के अंदर हो; वह है, केवल यदि
यह 3-मानक-विचलन नियम निम्नलिखित शर्तों के समतुल्य है, जो उपरोक्त पहले नियम को भी प्रयुक्त करता है।
[Proof]

नियम अनुरोध करने के लिए पूरी तरह से समकक्ष है

पैदावार के आसपास चलती शर्तें:

तब से , हम वर्ग शक्ति लागू कर सकते हैं और संबंधित कारकों से विभाजित कर सकते हैं और , वांछित शर्तें प्राप्त करने के लिए:

ध्यान दें कि ये शर्तें स्वचालित रूप से इसका अर्थ लगाती हैं . दूसरी ओर, वर्गमूल को फिर से लागू करें और 3 से विभाजित करें,

पहले वाले से असमानताओं के दूसरे सेट को घटाना:

और इसलिए, वांछित पहला नियम संतुष्ट है,

  • एक और सामान्यतः उपयोग किया जाने वाला नियम यह है कि दोनों मान और 5 से अधिक या उसके सामान्तर होना चाहिए। चूँकि, विशिष्ट संख्या स्रोत से स्रोत में भिन्न होती है, और यह इस बात पर निर्भर करता है कि कोई सन्निकटन कितना अच्छा चाहता है। विशेष रूप से, यदि कोई 5 के अतिरिक्त 9 का उपयोग करता है, तो नियम का तात्पर्य पिछले पैराग्राफ में बताए गए परिणामों से है।
[Proof]

मान लें कि दोनों मान और 9 से अधिक हैं। चूंकि , हमारे पास वह आसानी से है

अब हमें केवल संबंधित कारकों द्वारा विभाजित करना है और , 3-मानक-विचलन नियम के वैकल्पिक रूप को निकालने के लिए:

निरंतरता सुधार प्रयुक्त करने का उदाहरण निम्नलिखित है। मान लीजिए कि द्विपद यादृच्छिक चर X के लिए Pr(X ≤ 8) की गणना करना चाहता है। यदि Y का वितरण सामान्य सन्निकटन द्वारा दिया गया है, तब Pr(X ≤ 8) Pr(Y ≤ 8.5) द्वारा अनुमानित है। 0.5 का जोड़ निरंतरता सुधार है; असंशोधित सामान्य सन्निकटन अधिक स्पष्ट परिणाम देता है।

यह सन्निकटन, डी मोइवर-लाप्लास प्रमेय के रूप में जाना जाता है, हाथ से गणना करते समय विशाल समय बचाने वाला होता है (बड़े n के साथ स्पष्ट गणना बहुत कठिन होती है); ऐतिहासिक रूप से, यह सामान्य वितरण का पहला प्रयोग था, जिसे 1738 में अब्राहम डी मोइवरे की पुस्तक संभावना का सिद्धांत में प्रस्तुत किया गया था। आजकल, इसे केंद्रीय सीमा प्रमेय के परिणाम के रूप में देखा जा सकता है क्योंकि B(n, p) का योग है n स्वतंत्र, समान रूप से वितरित बरनौली वितरण पैरामीटर p के साथ है । यह तथ्य सामान्य परीक्षण आंकड़ों में x/n, नमूना अनुपात और p के अनुमानक का उपयोग करके p के मूल्य के लिए परिकल्पना परीक्षण, अनुपात z-परीक्षण का आधार है।[31]

उदाहरण के लिए, मान लीजिए कि बड़ी जनसंख्या से बेतरतीब ढंग से n लोगों का नमूना लेता है और उनसे पूछता है कि क्या वे निश्चित कथन से सहमत हैं। सहमत होने वाले लोगों का अनुपात निश्चित रूप से नमूने पर निर्भर करेगा। यदि n लोगों के समूहों को बार-बार और सही मायने में बेतरतीब ढंग से नमूना लिया गया था, तब अनुपात जनसंख्या में समझौते के वास्तविक अनुपात p के सामान्तर और मानक विचलन के साथ लगभग सामान्य वितरण का पालन करेगा।


पोइसन सन्निकटन

द्विपद वितरण प्वासों वितरण की ओर अभिसरण करता है क्योंकि परीक्षणों की संख्या अनंत तक जाती है जबकि उत्पाद np सीमित सीमा तक अभिसरण करता है। इसलिए, पैरामीटर λ = np के साथ प्वासों वितरण को द्विपद वितरण के सन्निकटन के रूप में उपयोग किया जा सकता है यदि n पर्याप्त रूप से बड़ा है और p पर्याप्त रूप से छोटा है। अंगूठे के दो नियमों के अनुसार, यह सन्निकटन अच्छा है यदि n ≥ 20 और p ≤ 0.05, या यदि n ≥ 100 और np ≤ 10[32]

पॉइसन सन्निकटन की सटीकता के संबंध में, नोवाक, [33]अध्याय देखें। 4, और उसमें संदर्भ।

वितरण सीमित करना

  • पोइसन सीमा प्रमेय: चूंकि n ∞ तक पहुंचता है , उत्पाद np को स्थिर रखा जाता है और p 0 तक पहुंचता है,, द्विपद (n, p) वितरण अपेक्षित मान λ = np के साथ पॉइसन वितरण तक पहुंचता है।[32]
  • डी मोइवर-लाप्लास प्रमेय: जैसा कि n ∞ तक पहुंचता है जबकि p स्थिर रहता है, इसका वितरण
अपेक्षित मान 0 और विचरण 1 के साथ सामान्य वितरण तक पहुंचता है। इस परिणाम को कभी-कभी यह कहते हुए शिथिल रूप से कहा जाता है कि X का वितरण अपेक्षित मान 0 और विचरण 1 के साथ स्पर्शोन्मुख सामान्यता है। यह परिणाम केंद्रीय सीमा प्रमेय का विशिष्ट स्तिथियाँ है।

बीटा वितरण

द्विपद वितरण और बीटा वितरण दोहराए गए बर्नौली परीक्षणों के मॉडल के अलग-अलग विचार हैं। द्विपद वितरण का संभाव्यता द्रव्यमान फलन है द्विपद वितरण n स्वतंत्र घटनाओं को देखते हुए सफलताओं का PMF है, जिनमें से प्रत्येक में सफलता की संभावना p है। गणितीय रूप से, कब α = k + 1 और β = nk + 1, बीटा वितरण और द्विपद वितरण n + 1 के कारक से संबंधित हैं|

बीटा वितरण भी बायेसियन अनुमान में द्विपद वितरण के लिए पूर्व वितरण का परिवार प्रदान करते हैं:[34] :

एक समान पूर्व को देखते हुए, k देखी गई सफलताओं के साथ n स्वतंत्र घटनाओं को देखते हुए सफलता की संभावना p के लिए पश्च वितरण एक बीटा वितरण है।[35]

यादृच्छिक संख्या पीढ़ी

यादृच्छिक संख्या पीढ़ी के विधियों जहां सीमांत वितरण द्विपद वितरण है, अच्छी तरह से स्थापित हैं।[36][37] एक द्विपद वितरण से यादृच्छिक भिन्न नमूने उत्पन्न करने का विधि व्युत्क्रम एल्गोरिथम का उपयोग करना है। ऐसा करने के लिए, किसी को संभावना की गणना करनी चाहिए कि 0 से n तक सभी मान k के लिए Pr(X = k) है।(इन संभावनाओं को पूरे नमूना स्थान को सम्मिलित करने के लिए मूल्य के करीब होना चाहिए।) फिर 0 और 1 के मध्य समान रूप से नमूने उत्पन्न करने के लिए छद्म यादृच्छिक संख्या जनरेटर का उपयोग करके, परिकलित नमूनों को असतत संख्याओं में परिवर्तित कर सकते हैं। संभावनाओं की गणना पहले चरण में की जाती है।

इतिहास

यह वितरण जैकब बर्नौली द्वारा प्राप्त किया गया था। उन्होंने उस स्थितियोंपर विचार किया जहां p = r/(r + s) जहां p सफलता की संभावना है तथा r और s धनात्मक पूर्णांक हैं। ब्लेज़ पास्कल ने पहले उस स्थितियोंपर विचार किया था जहां p = 1/2 होता है |

यह भी देखें

संदर्भ

  1. Westland, J. Christopher (2020). Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer. p. 53. ISBN 978-3-030-49091-1.
  2. Feller, W. (1968). An Introduction to Probability Theory and Its Applications (Third ed.). New York: Wiley. p. 151 (theorem in section VI.3).
  3. Wadsworth, G. P. (1960). Introduction to Probability and Random Variables. New York: McGraw-Hill. p. 52.
  4. Jowett, G. H. (1963). "The Relationship Between the Binomial and F Distributions". Journal of the Royal Statistical Society, Series D. 13 (1): 55–57. doi:10.2307/2986663. JSTOR 2986663.
  5. See Proof Wiki
  6. Knoblauch, Andreas (2008), "Closed-Form Expressions for the Moments of the Binomial Probability Distribution", SIAM Journal on Applied Mathematics, 69 (1): 197–204, doi:10.1137/070700024, JSTOR 40233780
  7. Nguyen, Duy (2021), "A probabilistic approach to the moments of binomial random variables and application", The American Statistician, 75 (1): 101–103, doi:10.1080/00031305.2019.1679257, S2CID 209923008
  8. D. Ahle, Thomas (2022), "Sharp and Simple Bounds for the raw Moments of the Binomial and Poisson Distributions", Statistics & Probability Letters, 182: 109306, arXiv:2103.17027, doi:10.1016/j.spl.2021.109306
  9. See also Nicolas, André (January 7, 2019). "Finding mode in Binomial distribution". Stack Exchange.
  10. Neumann, P. (1966). "Über den Median der Binomial- and Poissonverteilung". Wissenschaftliche Zeitschrift der Technischen Universität Dresden (in Deutsch). 19: 29–33.
  11. Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", The Mathematical Gazette 94, 331-332.
  12. 12.0 12.1 Kaas, R.; Buhrman, J.M. (1980). "Mean, Median and Mode in Binomial Distributions". Statistica Neerlandica. 34 (1): 13–18. doi:10.1111/j.1467-9574.1980.tb00681.x.
  13. Hamza, K. (1995). "The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions". Statistics & Probability Letters. 23: 21–25. doi:10.1016/0167-7152(94)00090-U.
  14. Nowakowski, Sz. (2021). "Uniqueness of a Median of a Binomial Distribution with Rational Probability". Advances in Mathematics: Scientific Journal. 10 (4): 1951–1958. arXiv:2004.03280. doi:10.37418/amsj.10.4.9. ISSN 1857-8365. S2CID 215238991.
  15. 15.0 15.1 Arratia, R.; Gordon, L. (1989). "Tutorial on large deviations for the binomial distribution". Bulletin of Mathematical Biology. 51 (1): 125–131. doi:10.1007/BF02458840. PMID 2706397. S2CID 189884382.
  16. Robert B. Ash (1990). Information Theory. Dover Publications. p. 115. ISBN 9780486665214.
  17. Matoušek, J.; Vondrak, J. "The Probabilistic Method" (PDF). lecture notes. Archived (PDF) from the original on 2022-10-09.
  18. Razzaghi, Mehdi (2002). "On the estimation of binomial success probability with zero occurrence in sample". Journal of Modern Applied Statistical Methods. 1 (2): 326–332. doi:10.22237/jmasm/1036110000.
  19. 19.0 19.1 Brown, Lawrence D.; Cai, T. Tony; DasGupta, Anirban (2001), "Interval Estimation for a Binomial Proportion", Statistical Science, 16 (2): 101–133, CiteSeerX 10.1.1.323.7752, doi:10.1214/ss/1009213286, retrieved 2015-01-05
  20. Agresti, Alan; Coull, Brent A. (May 1998), "Approximate is better than 'exact' for interval estimation of binomial proportions" (PDF), The American Statistician, 52 (2): 119–126, doi:10.2307/2685469, JSTOR 2685469, retrieved 2015-01-05
  21. Gulotta, Joseph. "Agresti-Coull Interval Method". pellucid.atlassian.net. Retrieved 18 May 2021.
  22. "Confidence intervals". itl.nist.gov. Retrieved 18 May 2021.
  23. Pires, M. A. (2002). "Confidence intervals for a binomial proportion: comparison of methods and software evaluation" (PDF). In Klinke, S.; Ahrend, P.; Richter, L. (eds.). Proceedings of the Conference CompStat 2002. Short Communications and Posters. Archived (PDF) from the original on 2022-10-09.
  24. Wilson, Edwin B. (June 1927), "Probable inference, the law of succession, and statistical inference" (PDF), Journal of the American Statistical Association, 22 (158): 209–212, doi:10.2307/2276774, JSTOR 2276774, archived from the original (PDF) on 2015-01-13, retrieved 2015-01-05
  25. "Confidence intervals". Engineering Statistics Handbook. NIST/Sematech. 2012. Retrieved 2017-07-23.
  26. Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P.; Meester, L.E. (2005). A Modern Introduction of Probability and Statistics (1 ed.). Springer-Verlag London. ISBN 978-1-84628-168-6.
  27. Wang, Y. H. (1993). "On the number of successes in independent trials" (PDF). Statistica Sinica. 3 (2): 295–312. Archived from the original (PDF) on 2016-03-03.
  28. Katz, D.; et al. (1978). "Obtaining confidence intervals for the risk ratio in cohort studies". Biometrics. 34 (3): 469–474. doi:10.2307/2530610. JSTOR 2530610.
  29. Taboga, Marco. "Lectures on Probability Theory and Mathematical Statistics". statlect.com. Retrieved 18 December 2017.
  30. Box, Hunter and Hunter (1978). Statistics for experimenters. Wiley. p. 130. ISBN 9780471093152.
  31. NIST/SEMATECH, "7.2.4. Does the proportion of defectives meet requirements?" e-Handbook of Statistical Methods.
  32. 32.0 32.1 NIST/SEMATECH, "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods.
  33. Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746.
  34. MacKay, David (2003). Information Theory, Inference and Learning Algorithms. Cambridge University Press; First Edition. ISBN 978-0521642989.
  35. "Beta distribution".
  36. Devroye, Luc (1986) Non-Uniform Random Variate Generation, New York: Springer-Verlag. (See especially Chapter X, Discrete Univariate Distributions)
  37. Kachitvichyanukul, V.; Schmeiser, B. W. (1988). "Binomial random variate generation". Communications of the ACM. 31 (2): 216–222. doi:10.1145/42372.42381. S2CID 18698828.
  38. Mandelbrot, B. B., Fisher, A. J., & Calvet, L. E. (1997). A multifractal model of asset returns. 3.2 The Binomial Measure is the Simplest Example of a Multifractal


अग्रिम पठन


बाहरी संबंध