पॉइसन वितरण: Difference between revisions

From Vigyanwiki
No edit summary
m (Abhishekkshukla moved page पॉसों वितरण to पॉइसन वितरण without leaving a redirect)
 
(8 intermediate revisions by 5 users not shown)
Line 3: Line 3:
संभाव्यता सिद्धांत और आंकड़ों में, '''पॉइसन वितरण''' असतत संभाव्यता वितरण है जो समय या सम्मिस्ट के निश्चित अंतराल में होने वाली घटनाओं की दी गई संख्या की संभावना को व्यक्त करता है यदि ये घटनाएं ज्ञात निरंतर औसत दर के साथ और स्वतंत्र रूप से समय से घटित होती हैं। अंतिम घटना{{r|Haight1967}} इसका नाम फ्रांसीसी गणितज्ञ शिमोन डेनिस पॉइसन ({{IPAc-en|'|p|w|ɑː|s|ɒ|n}}; {{IPA-fr|pwasɔ̃}}) के नाम पर रखा गया है। पॉइसन वितरण का उपयोग अन्य निर्दिष्ट अंतराल प्रकारों जैसे दूरी, क्षेत्र या आयतन में घटनाओं की संख्या के लिए भी किया जा सकता है। यह असतत-स्थिर वितरण के लिए महत्वपूर्ण भूमिका निभाता है।
संभाव्यता सिद्धांत और आंकड़ों में, '''पॉइसन वितरण''' असतत संभाव्यता वितरण है जो समय या सम्मिस्ट के निश्चित अंतराल में होने वाली घटनाओं की दी गई संख्या की संभावना को व्यक्त करता है यदि ये घटनाएं ज्ञात निरंतर औसत दर के साथ और स्वतंत्र रूप से समय से घटित होती हैं। अंतिम घटना{{r|Haight1967}} इसका नाम फ्रांसीसी गणितज्ञ शिमोन डेनिस पॉइसन ({{IPAc-en|'|p|w|ɑː|s|ɒ|n}}; {{IPA-fr|pwasɔ̃}}) के नाम पर रखा गया है। पॉइसन वितरण का उपयोग अन्य निर्दिष्ट अंतराल प्रकारों जैसे दूरी, क्षेत्र या आयतन में घटनाओं की संख्या के लिए भी किया जा सकता है। यह असतत-स्थिर वितरण के लिए महत्वपूर्ण भूमिका निभाता है।


उदाहरण के लिए, कॉल सेंटर को प्रतिदिन 24 घंटे प्रति घंटे औसतन 180 कॉल प्राप्त होती हैं। कॉल स्वतंत्र हैं; प्राप्त करने से अगला कब आएगा इसकी संभावना नहीं बदलती है। किसी भी मिनट के समय प्राप्त कॉलों की संख्या में माध्य 3 के साथ पॉइसन संभाव्यता वितरण होता है: सबसे अधिक संभावित संख्याएं 2 और 3 हैं किंतु 1 और 4 भी संभावित हैं और इसके शून्य के समान होने की बहुत कम संभावना है और बहुत कम संभावना है यह 10 हो सकता है.
उदाहरण के लिए, कॉल सेंटर को प्रतिदिन 24 घंटे प्रति घंटे औसतन 180 कॉल प्राप्त होती हैं। कॉल स्वतंत्र हैं; प्राप्त करने से अगला कब आएगा इसकी संभावना नहीं बदलती है। किसी भी मिनट के समय प्राप्त कॉलों की संख्या में माध्य 3 के साथ पॉइसन संभाव्यता वितरण होता है: सबसे अधिक संभावित संख्याएं 2 और 3 हैं किंतु 1 और 4 भी संभावित हैं और इसके शून्य के समान होने की बहुत कुछ संभावना है और बहुत कुछ संभावना है यह 10 हो सकता है.


एक अन्य उदाहरण परिभाषित अवलोकन अवधि के समय रेडियोधर्मी स्रोत से होने वाली क्षय घटनाओं की संख्या होती है।
एक अन्य उदाहरण परिभाषित अवलोकन अवधि के समय रेडियोधर्मी स्रोत से होने वाली क्षय घटनाओं की संख्या होती है।
Line 23: Line 23:
* {{math|!}} भाज्य फलन है.
* {{math|!}} भाज्य फलन है.


सकारात्मक वास्तविक संख्या {{mvar|λ}} {{mvar|X}} के अपेक्षित मान और इसके विचरण के समान है।<ref>For the proof, see:
धनात्मक वास्तविक संख्या {{mvar|λ}} {{mvar|X}} के अपेक्षित मान और इसके विचरण के समान है।<ref>For the proof, see:
[[proofwiki:Expectation of Poisson Distribution|Proof wiki: expectation]] and [[proofwiki:Variance of Poisson Distribution|Proof wiki: variance]]</ref>
[[proofwiki:Expectation of Poisson Distribution|Proof wiki: expectation]] and [[proofwiki:Variance of Poisson Distribution|Proof wiki: variance]]</ref>
:<math>\lambda = \operatorname{E}(X) = \operatorname{Var}(X).</math>
:<math>\lambda = \operatorname{E}(X) = \operatorname{Var}(X).</math>
Line 43: Line 43:
*{{mvar|k}} किसी अंतराल में किसी घटना के घटित होने की संख्या है और {{mvar|k}} मान 0, 1, 2,.. ले सकता है।
*{{mvar|k}} किसी अंतराल में किसी घटना के घटित होने की संख्या है और {{mvar|k}} मान 0, 1, 2,.. ले सकता है।
* एक घटना के घटित होने से दूसरी घटना घटित होने की संभावना प्रभावित नहीं होती हैं। अर्थात् घटनाएँ स्वतंत्र रूप से घटित होती हैं।
* एक घटना के घटित होने से दूसरी घटना घटित होने की संभावना प्रभावित नहीं होती हैं। अर्थात् घटनाएँ स्वतंत्र रूप से घटित होती हैं।
* घटनाएँ घटित होने की औसत दर किसी भी घटना से स्वतंत्र होती है। सरलता के लिए, इसे सामान्यतः स्थिर माना जाता है, किंतु व्यवहार में समय के साथ इसमें बदलाव हो सकता है।
* घटनाएँ घटित होने की औसत दर किसी भी घटना से स्वतंत्र होती है। सरलता के लिए, इसे सामान्यतः स्थिर माना जाता है, किंतु व्यवहार में समय के साथ इसमें परिवर्तन हो सकता है।
* दो घटनाएँ बिल्कुल ही क्षण में घटित नहीं हो सकतीं हैं| इसके अतिरिक्त , प्रत्येक बहुत छोटे उप-अंतराल पर, या तब बिल्कुल घटना घटती है, या कोई घटना नहीं घटती है।
* दो घटनाएँ बिल्कुल ही क्षण में घटित नहीं हो सकतीं हैं| इसके अतिरिक्त , प्रत्येक बहुत छोटे उप-अंतराल पर, या तब बिल्कुल घटना घटती है, या कोई घटना नहीं घटती है।


Line 131: Line 131:
=== उदाहरण जो पॉइसन मान्यताओं का उल्लंघन करते हैं ===
=== उदाहरण जो पॉइसन मान्यताओं का उल्लंघन करते हैं ===


प्रति मिनट [[छात्र केंद्र]] पर पहुंचने वाले छात्रों की संख्या संभवतः पॉइसन वितरण का पालन नहीं करेगी, चूँकि इसकी दर स्थिर नहीं होती है और (कक्षा समय के समय कम दर, कक्षा समय के मध्य उच्च दर) और व्यक्तिगत छात्रों का आगमन स्वतंत्र नहीं होता है| और (छात्र समूहों में आते हैं)। इस प्रकार गैर-निरंतर आगमन दर को [[मिश्रित पॉइसन वितरण]] के रूप में और व्यक्तिगत छात्रों के अतिरिक्त समूहों के आगमन को मिश्रित पॉइसन प्रक्रिया के रूप में तैयार किया जा सकता है।
प्रति मिनट [[छात्र केंद्र]] पर पहुंचने वाले छात्रों की संख्या संभवतः पॉइसन वितरण का पालन नहीं करेगी, चूँकि इसकी दर स्थिर नहीं होती है और (कक्षा समय के समय कुछ दर, कक्षा समय के मध्य उच्च दर) और व्यक्तिगत छात्रों का आगमन स्वतंत्र नहीं होता है| और (छात्र समूहों में आते हैं)। इस प्रकार गैर-निरंतर आगमन दर को [[मिश्रित पॉइसन वितरण]] के रूप में और व्यक्तिगत छात्रों के अतिरिक्त समूहों के आगमन को मिश्रित पॉइसन प्रक्रिया के रूप में तैयार किया जा सकता है।


किसी देश में प्रति वर्ष 5 तीव्रता वाले भूकंपों की संख्या पॉइसन वितरण के अनुरूप नहीं हो सकती है, यदि बड़ा भूकंप समान तीव्रता के झटकों की संभावना को बढ़ा देता है।
किसी देश में प्रति वर्ष 5 तीव्रता वाले भूकंपों की संख्या पॉइसन वितरण के अनुरूप नहीं हो सकती है, यदि बड़ा भूकंप समान तीव्रता के झटकों की संभावना को बढ़ा देता है।


ऐसे उदाहरण जिनमें कम से कम घटना की गारंटी होती है, और यह पॉइसन वितरित नहीं होती हैं; किंतु इसे शून्य-ट्रंकेटेड पॉइसन वितरण का उपयोग करके मॉडल को तैयार किया जा सकता है।
ऐसे उदाहरण जिनमें कुछ से कुछ घटना की गारंटी होती है, और यह पॉइसन वितरित नहीं होती हैं; किंतु इसे शून्य-ट्रंकेटेड पॉइसन वितरण का उपयोग करके मॉडल को तैयार किया जा सकता है।


इस प्रकार ऐसे वितरणों की गणना करें जिनमें शून्य घटनाओं वाले अंतरालों की संख्या पॉइसन मॉडल द्वारा अनुमानित की तुलना में अधिक होती है,और शून्य-'''फुलाए''' गए मॉडल का उपयोग करके मॉडलिंग की जा सकती है।
इस प्रकार ऐसे वितरणों की गणना करें जिनमें शून्य घटनाओं वाले अंतरालों की संख्या पॉइसन मॉडल द्वारा अनुमानित की तुलना में अधिक होती है,और शून्य-'''फुलाए''' गए मॉडल का उपयोग करके मॉडलिंग की जा सकती है।
Line 143: Line 143:
* भिन्नता का गुणांक <math display="inline"> \lambda^{-1/2},</math>होता है जबकि [[फैलाव का सूचकांक]] 1 है।{{r|Johnson2005|p=163}}
* भिन्नता का गुणांक <math display="inline"> \lambda^{-1/2},</math>होता है जबकि [[फैलाव का सूचकांक]] 1 है।{{r|Johnson2005|p=163}}
* माध्य के सापेक्ष माध्य निरपेक्ष विचलन होता है| {{r|Johnson2005|p=163}} <math display="block">\operatorname{E}[\ |X-\lambda|\ ]= \frac{2 \lambda^{\lfloor\lambda\rfloor + 1} e^{-\lambda}}{\lfloor\lambda\rfloor!}.</math>
* माध्य के सापेक्ष माध्य निरपेक्ष विचलन होता है| {{r|Johnson2005|p=163}} <math display="block">\operatorname{E}[\ |X-\lambda|\ ]= \frac{2 \lambda^{\lfloor\lambda\rfloor + 1} e^{-\lambda}}{\lfloor\lambda\rfloor!}.</math>
* गैर-पूर्णांक {{mvar|λ}} के साथ पॉइसन-वितरित यादृच्छिक चर का [[मोड (सांख्यिकी)]] <math>\lfloor \lambda \rfloor,</math> के समान होता है जो {{mvar|λ}} इससे कम या इसके समान का सबसे बड़ा पूर्णांक है . इसे [[फर्श समारोह|फर्श फलन]] ({{mvar|λ}}) के रूप में भी लिखा जाता है और जब {{mvar|λ}} धनात्मक पूर्णांक होता है, तब मोड {{mvar|λ}} बहुलक हैं और {{mvar|λ}} − 1 बहुलक होता हैं|
* गैर-पूर्णांक {{mvar|λ}} के साथ पॉइसन-वितरित यादृच्छिक चर का [[मोड (सांख्यिकी)]] <math>\lfloor \lambda \rfloor,</math> के समान होता है जो {{mvar|λ}} इससे कुछ या इसके समान का सबसे बड़ा पूर्णांक है . इसे [[फर्श समारोह|फर्श फलन]] ({{mvar|λ}}) के रूप में भी लिखा जाता है और जब {{mvar|λ}} धनात्मक पूर्णांक होता है, तब मोड {{mvar|λ}} बहुलक हैं और {{mvar|λ}} − 1 बहुलक होता हैं|
* पॉइसन वितरण के सभी संचयक अपेक्षित मूल्य {{mvar|λ}} के समान हैं| और वह {{mvar|n}} पॉइसन वितरण का {{mvar|n}}वां [[तथ्यात्मक क्षण]] {{mvar|λ}}{{sup| {{mvar|n}} }} होता है|
* पॉइसन वितरण के सभी संचयक अपेक्षित मूल्य {{mvar|λ}} के समान हैं| और वह {{mvar|n}} पॉइसन वितरण का {{mvar|n}}वां [[तथ्यात्मक क्षण]] {{mvar|λ}}{{sup| {{mvar|n}} }} होता है|
* [[पॉइसन प्रक्रिया]] का अपेक्षित मूल्य कभी-कभी तीव्रता और एक्सपोज़र के उत्पाद में विघटित हो जाता है| और इस प्रकार (या सामान्यतः समय या सम्मिस्ट पर तीव्रता फलन के अभिन्न अंग के रूप में व्यक्त किया जाता है, जिसे कभी-कभी एक्सपोज़र के रूप में वर्णित किया जाता है)।{{r|Helske2017}}
* [[पॉइसन प्रक्रिया]] का अपेक्षित मूल्य कभी-कभी तीव्रता और एक्सपोज़र के उत्पाद में विघटित हो जाता है| और इस प्रकार (या सामान्यतः समय या सम्मिस्ट पर तीव्रता फलन के अभिन्न अंग के रूप में व्यक्त किया जाता है, जिसे कभी-कभी एक्सपोज़र के रूप में वर्णित किया जाता है)।{{r|Helske2017}}
Line 166: Line 166:
* पॉइसन यादृच्छिक चर की अंतिम संभावनाओं के लिए सीमाएं <math> X \sim \operatorname{Pois}(\lambda)</math> [[चेर्नॉफ़ बाध्य]] तर्क का उपयोग करके प्राप्त किया जा सकता है।  
* पॉइसन यादृच्छिक चर की अंतिम संभावनाओं के लिए सीमाएं <math> X \sim \operatorname{Pois}(\lambda)</math> [[चेर्नॉफ़ बाध्य]] तर्क का उपयोग करके प्राप्त किया जा सकता है।  
*पॉइसन यादृच्छिक चर <math> X \sim \operatorname{Pois}(\lambda)</math> की अंतिम संभावनाओं की सीमाएं <math> X \sim \operatorname{Pois}(\lambda)</math> तर्क का उपयोग करके प्राप्त की जा सकती हैं।[{{r|Mitzenmacher2005|p=97-98}}<math display="block">P(X \geq x) \leq \frac{(e \lambda)^x e^{-\lambda}}{x^x}, \text{ for } x > \lambda,</math> <math display="block">P(X \leq x) \leq \frac{(e \lambda)^x e^{-\lambda} }{x^x}, \text{ for } x < \lambda.</math>
*पॉइसन यादृच्छिक चर <math> X \sim \operatorname{Pois}(\lambda)</math> की अंतिम संभावनाओं की सीमाएं <math> X \sim \operatorname{Pois}(\lambda)</math> तर्क का उपयोग करके प्राप्त की जा सकती हैं।[{{r|Mitzenmacher2005|p=97-98}}<math display="block">P(X \geq x) \leq \frac{(e \lambda)^x e^{-\lambda}}{x^x}, \text{ for } x > \lambda,</math> <math display="block">P(X \leq x) \leq \frac{(e \lambda)^x e^{-\lambda} }{x^x}, \text{ for } x < \lambda.</math>
* अपर टेल की संभावना को निम्नानुसार (कम से कम दो के कारक द्वारा) कड़ा किया जा सकता है|{{r|Short2013}} <math display="block">P(X \geq x) \leq \frac{e^{-\operatorname{D}_{\text{KL}}(x\mid\lambda)}}{\max{(2, \sqrt{4\pi\operatorname{D}_{\text{KL}}(x\mid\lambda)}})}, \text{ for } x > \lambda,</math> जहाँ <math>\operatorname{D}_{\text{KL}}(x\mid\lambda)</math> निर्देशित कुल्बैक-लीब्लर विचलन है। जैसा कि ऊपर वर्णित हुआ है|
* अपर टेल की संभावना को निम्नानुसार (कुछ से कुछ दो के कारक द्वारा) कड़ा किया जा सकता है|{{r|Short2013}} <math display="block">P(X \geq x) \leq \frac{e^{-\operatorname{D}_{\text{KL}}(x\mid\lambda)}}{\max{(2, \sqrt{4\pi\operatorname{D}_{\text{KL}}(x\mid\lambda)}})}, \text{ for } x > \lambda,</math> जहाँ <math>\operatorname{D}_{\text{KL}}(x\mid\lambda)</math> निर्देशित कुल्बैक-लीब्लर विचलन है। जैसा कि ऊपर वर्णित हुआ है|
* असमानताएं जो पॉइसन यादृच्छिक चर <math> X \sim \operatorname{Pois}(\lambda)</math> के वितरण फलन को [[मानक सामान्य वितरण]] फलन <math> \Phi(x) </math> से संबंधित करती हैं वे इस प्रकार होते हैं| {{r|Short2013}} <math display="block"> \Phi\left(\operatorname{sign}(k-\lambda)\sqrt{2\operatorname{D}_{\text{KL}}(k\mid\lambda)}\right) < P(X \leq k) < \Phi\left(\operatorname{sign}(k-\lambda+1)\sqrt{2\operatorname{D}_{\text{KL}}(k+1\mid\lambda)}\right), \text{ for } k > 0,</math> जहाँ <math>\operatorname{D}_{\text{KL}}(k\mid\lambda)</math> यह फिर से निर्देशित कुल्बैक-लीब्लर विचलन होता है।
* असमानताएं जो पॉइसन यादृच्छिक चर <math> X \sim \operatorname{Pois}(\lambda)</math> के वितरण फलन को [[मानक सामान्य वितरण]] फलन <math> \Phi(x) </math> से संबंधित करती हैं वे इस प्रकार होते हैं| {{r|Short2013}} <math display="block"> \Phi\left(\operatorname{sign}(k-\lambda)\sqrt{2\operatorname{D}_{\text{KL}}(k\mid\lambda)}\right) < P(X \leq k) < \Phi\left(\operatorname{sign}(k-\lambda+1)\sqrt{2\operatorname{D}_{\text{KL}}(k+1\mid\lambda)}\right), \text{ for } k > 0,</math> जहाँ <math>\operatorname{D}_{\text{KL}}(k\mid\lambda)</math> यह फिर से निर्देशित कुल्बैक-लीब्लर विचलन होता है।


Line 186: Line 186:


=== अनंत समय-चरणों के साथ द्विपद वितरण के रूप में ===
=== अनंत समय-चरणों के साथ द्विपद वितरण के रूप में ===
पॉइसन वितरण को द्विपद वितरण के लिए सीमित स्थितियों के रूप में प्राप्त किया जा सकता है चूँकि परीक्षणों की संख्या अनंत हो जाती है और सफलताओं की अपेक्षित मूल्य संख्या निश्चित रहती है| - नीचे दुर्लभ घटनाओं का नियम देखें। इसलिए, इसका उपयोग द्विपद वितरण के सन्निकटन के रूप में किया जा सकता है यदि {{mvar|n}} पर्याप्त रूप से बड़ा होता है और p पर्याप्त रूप से छोटा होता है। यदि n कम से कम 20 है और p 0.05 से छोटा या उसके समान है, तब पॉइसन वितरण द्विपद वितरण का अच्छा सन्निकटन होता है, और यदि {{mvar|n}} ≥ 100 और {{mvar|n p}} ≤ 10 है तब यहाँ उत्कृष्ट सन्निकटन होता है।{{r|NIST2006}} <math display="block">F_\mathrm{Binomial}(k;n, p) \approx F_\mathrm{Poisson}(k;\lambda=np)</math>
पॉइसन वितरण को द्विपद वितरण के लिए सीमित स्थितियों के रूप में प्राप्त किया जा सकता है चूँकि परीक्षणों की संख्या अनंत हो जाती है और सफलताओं की अपेक्षित मूल्य संख्या निश्चित रहती है| - नीचे दुर्लभ घटनाओं का नियम देखें। इसलिए, इसका उपयोग द्विपद वितरण के सन्निकटन के रूप में किया जा सकता है यदि {{mvar|n}} पर्याप्त रूप से बड़ा होता है और p पर्याप्त रूप से छोटा होता है। यदि n कुछ से कुछ 20 है और p 0.05 से छोटा या उसके समान है, तब पॉइसन वितरण द्विपद वितरण का अच्छा सन्निकटन होता है, और यदि {{mvar|n}} ≥ 100 और {{mvar|n p}} ≤ 10 है तब यहाँ उत्कृष्ट सन्निकटन होता है।{{r|NIST2006}} <math display="block">F_\mathrm{Binomial}(k;n, p) \approx F_\mathrm{Poisson}(k;\lambda=np)</math>
===सामान्य===
===सामान्य===
* यदि <math>X_1 \sim \mathrm{Pois}(\lambda_1)\,</math> और <math>X_2 \sim \mathrm{Pois}(\lambda_2)\,</math> स्वतंत्र होता हैं, फिर अंतर <math> Y = X_1 - X_2</math> [[स्केलम वितरण]] का अनुसरण करता है।
* यदि <math>X_1 \sim \mathrm{Pois}(\lambda_1)\,</math> और <math>X_2 \sim \mathrm{Pois}(\lambda_2)\,</math> स्वतंत्र होता हैं, फिर अंतर <math> Y = X_1 - X_2</math> [[स्केलम वितरण]] का अनुसरण करता है।
Line 234: Line 234:
\end{cases}</math>
\end{cases}</math>
जहाँ  <math display="block">\nu = \frac{1}{2\pi\alpha t}\sqrt{4\lambda \alpha^2 - ( t - \alpha (1+\lambda))^2} \, dt</math> और इसका समर्थन है <math>[\alpha (1-\sqrt{\lambda})^2,\alpha (1+\sqrt{\lambda})^2].</math>
जहाँ  <math display="block">\nu = \frac{1}{2\pi\alpha t}\sqrt{4\lambda \alpha^2 - ( t - \alpha (1+\lambda))^2} \, dt</math> और इसका समर्थन है <math>[\alpha (1-\sqrt{\lambda})^2,\alpha (1+\sqrt{\lambda})^2].</math>
'''यह नियम मार्चेंको-पास्टूर नियम के रूप में [[यादृच्छिक मैट्रिक्स|यादृच्छिक आव्युह]] सिद्धांत में भी उत्पन्न होता है। इसके निःशुल्क क्यूमुलेंट<math>\kappa_n=\lambda\alpha^n.</math> के समान होते हैं'''
यह नियम मार्चेंको-पास्टूर नियम के रूप में [[यादृच्छिक मैट्रिक्स|यादृच्छिक आव्युह]] सिद्धांत में भी उत्पन्न होता है। इसके निःशुल्क क्यूमुलेंट<math>\kappa_n=\lambda\alpha^n.</math> के समान होते हैं
====इस नियम के कुछ परिवर्तन====
===='''इस नियम के कुछ परिवर्तन'''====
हम निःशुल्क पॉइसन नियम के कुछ महत्वपूर्ण परिवर्तनों के मूल्य देते हैं; गणना उदाहरण के लिए पाई जा सकती है A नीका और R स्पीचर द्वारा लिखित पुस्तक लेक्चर्स ऑन द कॉम्बिनेटरिक्स ऑफ फ्री प्रोबेबिलिटी में <ref>[http://rolandspeicher.com/literature/nica-speicher/ Lectures on the Combinatorics of Free Probability] by A. Nica and R. Speicher, pp. 203–204, Cambridge Univ. Press 2006</ref>  
हम निःशुल्क पॉइसन नियम के कुछ महत्वपूर्ण परिवर्तनों के मूल्य देते हैं; गणना उदाहरण के लिए पाई जा सकती है A नीका और R स्पीचर द्वारा लिखित पुस्तक लेक्चर्स ऑन द कॉम्बिनेटरिक्स ऑफ फ्री प्रोबेबिलिटी में <ref>[http://rolandspeicher.com/literature/nica-speicher/ Lectures on the Combinatorics of Free Probability] by A. Nica and R. Speicher, pp. 203–204, Cambridge Univ. Press 2006</ref>  


Line 267: Line 267:
{{nobr| {{math|''i'' {{=}} 1, ..., ''n''}},}}के लिए {{mvar|n}} मापे गए मानों <math>k_i \in \{0,1,\dots\},</math> के प्रतिरूप को देखते हुए, हम पॉइसन संख्या के पैरामीटर {{mvar|λ}} के मूल्य का अनुमान लगाना चाहते हैं, जहां से प्रतिरूप लिया गया था। अधिकतम संभावना अनुमान है| <ref>{{cite web |last=Paszek |first=Ewa |title=Maximum likelihood estimation – examples |website=cnx.org |url = http://cnx.org/content/m13500/latest/?collection=col10343/latest}}</ref>
{{nobr| {{math|''i'' {{=}} 1, ..., ''n''}},}}के लिए {{mvar|n}} मापे गए मानों <math>k_i \in \{0,1,\dots\},</math> के प्रतिरूप को देखते हुए, हम पॉइसन संख्या के पैरामीटर {{mvar|λ}} के मूल्य का अनुमान लगाना चाहते हैं, जहां से प्रतिरूप लिया गया था। अधिकतम संभावना अनुमान है| <ref>{{cite web |last=Paszek |first=Ewa |title=Maximum likelihood estimation – examples |website=cnx.org |url = http://cnx.org/content/m13500/latest/?collection=col10343/latest}}</ref>
:<math>\widehat{\lambda}_\mathrm{MLE}=\frac{1}{n}\sum_{i=1}^n k_i\ .</math>
:<math>\widehat{\lambda}_\mathrm{MLE}=\frac{1}{n}\sum_{i=1}^n k_i\ .</math>
चूँकि प्रत्येक अवलोकन में अपेक्षा λ होती है, इसलिए प्रतिरूप का कारण भी होता है। इसलिए, अधिकतम संभावना अनुमान {{mvar|λ}} का निष्पक्ष अनुमानक भी है। यह कुशल अनुमानक भी है चूँकि इसका विचरण क्रैमर-राव निचली सीमा (सीआरएलबी) को प्राप्त करता है<ref>{{Cite book |last=Van Trees |first=Harry L. |url=https://www.worldcat.org/oclc/851161356 |title=पता लगाने का अनुमान और मॉड्यूलेशन सिद्धांत।|date=2013|others=Kristine L. Bell, Zhi Tian |isbn=978-1-299-66515-6|edition=Second |location=Hoboken, N.J. |oclc=851161356}}</ref>। इसलिए यह [[न्यूनतम-विचरण निष्पक्ष अनुमानक]] है। यह भी सिद्ध किया जा सकता है कि योग (और इसलिए प्रतिरूप का कारण है चूँकि यह योग का एक-से-एक फलन है) {{mvar|λ}} के लिए पूर्ण और पर्याप्त आँकड़ा है।
चूँकि प्रत्येक अवलोकन में अपेक्षा {{mvar|λ                                                                                                       }} होती है, इसलिए प्रतिरूप का कारण भी होता है। इसलिए, अधिकतम संभावना अनुमान {{mvar|λ                                                                                                       }} का निष्पक्ष अनुमानक भी है। यह कुशल अनुमानक भी है चूँकि इसका विचरण क्रैमर-राव निचली सीमा (सीआरएलबी) को प्राप्त करता है<ref>{{Cite book |last=Van Trees |first=Harry L. |url=https://www.worldcat.org/oclc/851161356 |title=पता लगाने का अनुमान और मॉड्यूलेशन सिद्धांत।|date=2013|others=Kristine L. Bell, Zhi Tian |isbn=978-1-299-66515-6|edition=Second |location=Hoboken, N.J. |oclc=851161356}}</ref>। इसलिए यह [[न्यूनतम-विचरण निष्पक्ष अनुमानक]] है। यह भी सिद्ध किया जा सकता है कि योग (और इसलिए प्रतिरूप का कारण है चूँकि यह योग का एक-से-एक फलन है) {{mvar|λ}} के लिए पूर्ण और पर्याप्त आँकड़ा है।


पर्याप्तता सिद्ध करने के लिए हम गुणनखंडन प्रमेय '''पर्याप्त आँकड़े''' का उपयोग कर सकते हैं। प्रतिरूप के लिए संयुक्त पॉइसन वितरण की संभाव्यता द्रव्यमान फलन को दो भागों में विभाजित करने पर विचार करें: जो पूरी तरह से प्रतिरूप <math>\mathbf{x}</math> पर निर्भर करता है (जिसे <math>h(\mathbf{x})</math> कहा जाता है)) और जो पैरामीटर <math>\lambda</math> और प्रतिरूप <math>\mathbf{x}</math> पर निर्भर करता है सिर्फ फलन <math>T(\mathbf{x}).</math> के माध्यम से <math>T(\mathbf{x}).</math> तब <math>\lambda.</math> के लिए पर्याप्त आँकड़ा है  
पर्याप्तता सिद्ध करने के लिए हम गुणनखंडन प्रमेय '''पर्याप्त आँकड़े''' का उपयोग कर सकते हैं। प्रतिरूप के लिए संयुक्त पॉइसन वितरण की संभाव्यता द्रव्यमान फलन को दो भागों में विभाजित करने पर विचार करें: जो पूरी तरह से प्रतिरूप <math>\mathbf{x}</math> पर निर्भर करता है (जिसे <math>h(\mathbf{x})</math> कहा जाता है)) और जो पैरामीटर <math>\lambda</math> और प्रतिरूप <math>\mathbf{x}</math> पर निर्भर करता है सिर्फ फलन <math>T(\mathbf{x}).</math> के माध्यम से <math>T(\mathbf{x}).</math> तब <math>\lambda.</math> के लिए पर्याप्त आँकड़ा है  
Line 274: Line 274:
पहला पद, <math>h(\mathbf{x},</math> सिर्फ <math>\mathbf{x}.</math> पर निर्भर करता है दूसरा पद,<math>g(T(\mathbf{x})|\lambda),</math> सिर्फ <math display="inline">T(\mathbf{x})=\sum_{i=1}^n x_i.</math>के माध्यम से प्रतिरूप पर निर्भर करता है, इस प्रकार <math>T(\mathbf{x})</math>पर्याप्त है।
पहला पद, <math>h(\mathbf{x},</math> सिर्फ <math>\mathbf{x}.</math> पर निर्भर करता है दूसरा पद,<math>g(T(\mathbf{x})|\lambda),</math> सिर्फ <math display="inline">T(\mathbf{x})=\sum_{i=1}^n x_i.</math>के माध्यम से प्रतिरूप पर निर्भर करता है, इस प्रकार <math>T(\mathbf{x})</math>पर्याप्त है।


पैरामीटर {{mvar|λ}} को खोजने के लिए जो पॉइसन संख्या के लिए संभाव्यता फलन को अधिकतम करता है, हम संभावना फलन के लघुगणक का उपयोग कर सकते हैं:
पैरामीटर {{mvar|λ                                                                                                       }} को खोजने के लिए जो पॉइसन संख्या के लिए संभाव्यता फलन को अधिकतम करता है, हम संभावना फलन के लघुगणक का उपयोग कर सकते हैं:


: <math> \begin{align}
: <math> \begin{align}
Line 293: Line 293:


: <math>\frac{\partial^2 \ell}{\partial \lambda^2} = - \frac{n^2}{\sum_{i=1}^n k_i} </math>
: <math>\frac{\partial^2 \ell}{\partial \lambda^2} = - \frac{n^2}{\sum_{i=1}^n k_i} </math>
जो k<sub>i</sub> के औसत के व्युत्क्रम {{mvar|n}} गुना का ऋणात्मक है औसत धनात्मक होने पर यह अभिव्यक्ति नकारात्मक होती है। यदि यह संतुष्ट है, तब स्थिर बिंदु संभाव्यता फलन को अधिकतम करता है।  
जो k<sub>i</sub> के औसत के व्युत्क्रम {{mvar|n}} गुना का ऋणात्मक है औसत धनात्मक होने पर यह अभिव्यक्ति ऋणात्मक होती है। यदि यह संतुष्ट है, तब स्थिर बिंदु संभाव्यता फलन को अधिकतम करता है।  


[[पूर्णता (सांख्यिकी)]] के लिए, वितरण के परिवार को पूर्ण कहा जाता है यदि और सिर्फ यदि<math> E(g(T)) = 0</math> का तात्पर्य सभी <math>\lambda.</math> के लिए <math>P_\lambda(g(T) = 0) = 1</math> हो। यदि व्यक्ति <math>X_i</math> आईआईडी <math>\mathrm{Po}(\lambda),</math> हैं तब <math display="inline">T(\mathbf{x})=\sum_{i=1}^n X_i\sim \mathrm{Po}(n\lambda).</math> जिस वितरण की हम जांच करना चाहते हैं उसे जानने से, यह देखना सरल है कि आँकड़ा पूरा हो गया है।
[[पूर्णता (सांख्यिकी)]] के लिए, वितरण के परिवार को पूर्ण कहा जाता है यदि और सिर्फ यदि<math> E(g(T)) = 0</math> का तात्पर्य सभी <math>\lambda.</math> के लिए <math>P_\lambda(g(T) = 0) = 1</math> हो। यदि व्यक्ति <math>X_i</math> आईआईडी <math>\mathrm{Po}(\lambda),</math> हैं तब <math display="inline">T(\mathbf{x})=\sum_{i=1}^n X_i\sim \mathrm{Po}(n\lambda).</math> जिस वितरण की हम जांच करना चाहते हैं उसे जानने से, यह देखना सरल है कि आँकड़ा पूरा हो गया है।
Line 307: Line 307:


:<math>F^{-1}(\alpha/2; k,1) \le \mu \le F^{-1}(1-\alpha/2; k+1,1),</math>
:<math>F^{-1}(\alpha/2; k,1) \le \mu \le F^{-1}(1-\alpha/2; k+1,1),</math>
जहां <math>\chi^{2}(p;n)</math> स्वतंत्रता की n डिग्री के साथ ची-वर्ग वितरण का क्वांटाइल फलन (निचले टेल क्षेत्र ''p'' के अनुरूप) है और <math>F^{-1}(p;n,1)</math> आकार पैरामीटर {{mvar|n}} और स्केल पैरामीटर 1 के साथ गामा वितरण का क्वांटाइल फलन है।{{r|Johnson2005|p=176-178|Garwood1936}} यह अंतराल इस अर्थ में '[[सटीक आँकड़े|स्पष्ट आँकड़े]]' है कि [[कवरेज संभावना]] कभी भी नाम मात्र {{math|1 – ''α''}} से कम नहीं होती है।
जहां <math>\chi^{2}(p;n)</math> स्वतंत्रता की n डिग्री के साथ ची-वर्ग वितरण का क्वांटाइल फलन (निचले टेल क्षेत्र ''p'' के अनुरूप) है और <math>F^{-1}(p;n,1)</math> आकार पैरामीटर {{mvar|n}} और स्केल पैरामीटर 1 के साथ गामा वितरण का क्वांटाइल फलन है।{{r|Johnson2005|p=176-178|Garwood1936}} यह अंतराल इस अर्थ में '[[सटीक आँकड़े|स्पष्ट आँकड़े]]' है कि [[कवरेज संभावना]] कभी भी नाम मात्र {{math|1 – ''α''}} से कुछ नहीं होती है।


जब गामा वितरण की मात्राएँ उपलब्ध नहीं होती हैं, तब इस स्पष्ट अंतराल का स्पष्ट अनुमान प्रस्तावित किया गया है| यह (विल्सन-हिल्फ़र्टी परिवर्तन के आधार पर)होता हैं |{{r|Breslow1987}}
जब गामा वितरण की मात्राएँ उपलब्ध नहीं होती हैं, तब इस स्पष्ट अंतराल का स्पष्ट अनुमान प्रस्तावित किया गया है| यह (विल्सन-हिल्फ़र्टी परिवर्तन के आधार पर)होता हैं |{{r|Breslow1987}}
Line 316: Line 316:
जहां <math>z_{\alpha/2}</math> अपर टेल क्षेत्र {{math|α / 2}} के साथ [[मानक सामान्य विचलन]] को दर्शाता है।
जहां <math>z_{\alpha/2}</math> अपर टेल क्षेत्र {{math|α / 2}} के साथ [[मानक सामान्य विचलन]] को दर्शाता है।


उपरोक्त के समान संदर्भ में इन फ़ार्मुलों के अनुप्रयोग के लिए (माध्य {{mvar|λ}} के साथ पॉइसन वितरण से लिए गए प्रत्येक {{mvar|n}} मापित मानों {{mvar|k}}<sub>''i''</sub> प्रतिरूप दिया गया है),का समुच्चय होता हैं |