सामान्य वितरण
Probability density function | |||
Cumulative distribution function | |||
Notation | |||
---|---|---|---|
Parameters |
= mean (location) = variance (squared scale) | ||
Support | |||
Failed to parse (Conversion error. Server ("cli") reported: "SyntaxError: Expected "-", "[", "\\", "\\begin", "\\begin{", "]", "^", "_", "{", "}", [ \t\n\r], [%$], [().], [,:;?!'], [/|], [0-9], [><~], [\-+*=], or [a-zA-Z] but "ई" found.in 1:44"): {\displaystyle \frac{1}{\sigma\sqrt{2\pi}} ई^{-\frac{1}{2}\बाएं(\frac{x - \mu}{\sigma}\right)^2}} |
Part of a series on statistics |
Probability theory |
---|
स्टटिस्टिक्स में, एक सामान्य वितरण या गॉसियन डिस्ट्रीब्यूशन एक वास्तविक-मूल्यवान रैंडम चर के लिए निरंतर प्रायिकता वितरण का एक प्रकार है और जबकि वास्तविक-मूल्यवान रैंडम चर इसके प्रायिकता घनत्व फलन का सामान्य प्रकार है
पैरामीटर वितरण का औसत माध्य अपेक्षित मूल्य है और इसकी माध्यिका और मोड सांख्यिकी पद्धति है, जबकि पैरामीटर इसका मानक विचलन है और इस प्रकार वितरण का विचरण के रूप में है, गाऊसी वितरण के साथ एक रैंडम चर को सामान्य वितरण कहा जाता है और इसे सामान्य विचलन भी कहा जाता है।
सामान्य वितरण आंकड़ों में महत्वपूर्ण होते हैं और अधिकांशतः प्राकृतिक विज्ञान और सामाजिक विज्ञान में वास्तविक-मूल्य वाले रैंडम चर का प्रतिनिधित्व करने के लिए उपयोग किए जाते हैं जिनके वितरण ज्ञात नहीं होते हैं।[1][2] और इस प्रकार उनका महत्व आंशिक रूप से केंद्रीय सीमा प्रमेय के कारण होता है। इसमें कहा गया है कि, कुछ शर्तों के अनुसार परिमित माध्य और विचरण के साथ एक रैंडम चर के कई नमूनों टिप्पणियों का औसत स्वयं एक रैंडम चर है, जिसका वितरण अभिसरण नमूने की संख्या बढ़ने पर सामान्य वितरण में होता है। इसलिए, भौतिक मात्राएँ जो कई स्वतंत्र प्रक्रियाओं का योग होने की आशंका की जाती हैं, जैसे माप त्रुटियां, अधिकांशतः ऐसे वितरण होते हैं जो लगभग सामान्य रूप में होते है।[3]
इसके अतिरिक्त, गॉसियन वितरण में कुछ अद्वितीय गुण हैं जो विश्लेषणात्मक अध्ययनों में मूल्यवान हैं। उदाहरण के लिए, सामान्य विचलन के निश्चित संग्रह का कोई भी रैखिक संयोजन एक सामान्य विचलन है। इस प्रकार कई परिणाम और विधियाँ, जैसे कि अनिश्चितता का प्रसार और कम से कम वर्ग पैरामीटर फिटिंग विश्लेषणात्मक रूप से स्पष्ट रूप से प्राप्त की जा सकती हैं जब प्रासंगिक चर सामान्य रूप से वितरित किए जाते हैं।
एक सामान्य वितरण को कभी-कभी अनौपचारिक रूप से बेल कर्व कहा जाता है।[4] चूंकि, कई अन्य डिस्ट्रीब्यूशन बेल के आकार के होते हैं, जैसे कॉची छात्र का t-डिस्ट्रीब्यूशन और लॉजिस्टिक वितरण इत्यादि के रूप में होते है। अन्य नामों के लिए नेमिंग देखते हैं।
मल्टवेरीेंएट सामान्य वितरण में सदिश के लिए और आव्यूह सामान्य वितरण में मेट्रिसेस के लिए यूनीवेरिएट प्रायिकता वितरण सामान्यीकृत किया जाता है।
परिभाषाएँ
मानक सामान्य डिस्ट्रीब्यूशन
सामान्य वितरण का सबसे सरल स्थिति मानक सामान्य वितरण या इकाई सामान्य वितरण के रूप में जाना जाता है। यह एक विशेष स्थिति है जब u = 0 और और इसे इस प्रायिकता घनत्व फ़ंक्शन (या घनत्व) द्वारा वर्णित किया गया है
चर z का माध्य 0 है और विचरण और मानक विचलन घनत्व 1 है इसका शीर्ष पर है और मोड़ बिंदु और .के रूप में है
यद्यपि उपरोक्त घनत्व को सामान्यतः सामान्य मानक के रूप में जाना जाता है, कुछ लेखकों ने उस शब्द का उपयोग सामान्य वितरण के अन्य संस्करणों का वर्णन करने के लिए किया है। उदाहरण के लिए, कार्ल फ्रेडरिक गॉस ने एक बार मानक को सामान्य के रूप में परिभाषित किया था
जिसमें 1/2 का विचरण होता है और स्टीफन स्टिगलर[5] एक बार मानक सामान्य के रूप में परिभाषित किया गया है
जिसका एक सरल कार्यात्मक रूप और एक विचरण है
सामान्य सामान्य डिस्ट्रीब्यूशन
प्रत्येक सामान्य वितरण मानक सामान्य वितरण का एक संस्करण है, जिसका डोमेन एक कारक मानक विचलन द्वारा बढ़ाया गया है और फिर द्वारा औसत मूल्य का अनुवाद किया गया है:
प्रायिकता घनत्व द्वारा स्केल किया जाना चाहिए जिससे की समाकलन 1 के रूप में होता है।
यदि एक मानक सामान्य विचलन के रूप में है, तो अपेक्षित मूल्य के साथ एक सामान्य वितरण होता है और मानक विचलन . के बराबर है और मानक सामान्य वितरण के एक कारक द्वारा विस्तारित किया जा सकता है और इस प्रकार द्वारा स्थानांतरित किया जाता है, एक भिन्न सामान्य वितरण प्राप्त करने के लिए द्वारा स्थानांतरित किया जा सकता है, जिसे कहा जाता है. इसके विपरीत यदि मापदंडों के साथ एक सामान्य विचलन और के रूप में है फिर यह वितरण को फिर से बढ़ाया जा सकता है और सूत्र के माध्यम से स्थानांतरित किया जा सकता है इसे मानक सामान्य वितरण में बदलने के लिए इस चर को का मानकीकृत रूप भी कहा जाता है.
अंकन
मानक गाऊसी बंटन का प्रायिकता घनत्व (मानक सामान्य डिस्ट्रीब्यूशन , शून्य माध्य और इकाई प्रसरण के साथ) को अधिकांशतः ग्रीक अक्षर से निरूपित किया जाता है (फाई (पत्र))।[6] ग्रीक अक्षर फी का वैकल्पिक रूप, , भी अधिकांशतः प्रयोग किया जाता है।
सामान्य वितरण को अधिकांशतः कहा जाता है या .[7] इस प्रकार जब एक रैंडम चर सामान्य रूप से माध्य के साथ वितरित किया जाता है और मानक विचलन , कोई लिख सकता है
वैकल्पिक मानकीकरण
कुछ लेखक परिशुद्धता (सांख्यिकी) का उपयोग करने की वकालत करते हैं विचलन के बजाय वितरण की चौड़ाई को परिभाषित करने वाले पैरामीटर के रूप में या भिन्नता . परिशुद्धता को सामान्यतः विचरण के व्युत्क्रम के रूप में परिभाषित किया जाता है, .[8] वितरण का सूत्र तब बन जाता है
इस विकल्प का संख्यात्मक संगणना में लाभ होने का दावा किया जाता है शून्य के बहुत करीब है, और कुछ संदर्भों में सूत्रों को सरल करता है, जैसे मल्टवेरीेंएट सामान्य वितरण वाले चर के बायेसियन आंकड़ों में।
वैकल्पिक रूप से, मानक विचलन का व्युत्क्रम परिशुद्धता के रूप में परिभाषित किया जा सकता है, जिस स्थिति में सामान्य वितरण की अभिव्यक्ति बन जाती है
स्टिग्लर के अनुसार, यह सूत्रीकरण बहुत सरल और याद रखने में आसान सूत्र और वितरण की मात्राओं के लिए सरल अनुमानित सूत्रों के कारण लाभप्रद है।
सामान्य बंटन प्राकृतिक प्राचलों के साथ एक चरघातांकी परिवार बनाते हैं और , और प्राकृतिक आँकड़े x और x2</उप>। सामान्य वितरण के लिए दोहरी अपेक्षा पैरामीटर हैं η1 = μ और η2 = μ2 + σ2.
संचयी वितरण कार्य
मानक सामान्य बंटन का संचयी बंटन फलन (CDF), सामान्यतः बड़े ग्रीक अक्षर से दर्शाया जाता है (फाई (अक्षर)), अभिन्न है
संबंधित त्रुटि समारोह एक रैंडम चर की संभावना देता है, माध्य 0 के सामान्य वितरण के साथ और भिन्नता 1/2 सीमा में गिरती है . वह है:
इन समाकलों को प्रारंभिक कार्यों के संदर्भ में व्यक्त नहीं किया जा सकता है, और अधिकांशतः इन्हें विशेष कार्य कहा जाता है। चूंकि , कई संख्यात्मक सन्निकटन ज्ञात हैं; अधिक के लिए सामान्य सीडीएफ और सामान्य क्वांटाइल फ़ंक्शन के लिए #Numerical सन्निकटन देखें।
दो कार्य बारीकी से संबंधित हैं, अर्थात्
घनत्व के साथ सामान्य सामान्य वितरण के लिए , अर्थ और विचलन , संचयी बंटन फलन है
मानक सामान्य सीडीएफ का पूरक, , अधिकांशतः क्यू समारोह कहा जाता है, खासकर इंजीनियरिंग ग्रंथों में।[9][10] यह प्रायिकता देता है कि एक मानक सामान्य रैंडम चर का मान अधिक हो जाएगा : . की अन्य परिभाषाएँ -फ़ंक्शन, जिनमें से सभी सरल रूपांतरण हैं , का भी कभी-कभी उपयोग किया जाता है।[11] मानक सामान्य सीडीएफ के एक समारोह का ग्राफ बिंदु (0,1/2) के चारों ओर 2 गुना घूर्णी समरूपता है; वह है, . इसका प्रतिपक्षी (अनिश्चितकालीन अभिन्न) निम्नानुसार व्यक्त किया जा सकता है:
मानक सामान्य वितरण के सीडीएफ को एक श्रृंखला में भागों द्वारा एकीकरण द्वारा विस्तारित किया जा सकता है:
कहाँ डबल फैक्टोरियल को दर्शाता है।
बड़े एक्स के लिए सीडीएफ का एक स्पर्शोन्मुख विस्तार भी भागों द्वारा एकीकरण का उपयोग करके प्राप्त किया जा सकता है। अधिक जानकारी के लिए, एरर फंक्शन#एसिम्प्टोटिक विस्तार देखें।[12] टेलर श्रृंखला सन्निकटन का उपयोग करके मानक सामान्य वितरण सीडीएफ के लिए एक त्वरित सन्निकटन पाया जा सकता है:
मानक विचलन और कवरेज
एक सामान्य वितरण से निकाले गए लगभग 68% मान एक मानक विचलन σ माध्य से दूर होते हैं; लगभग 95% मूल्य दो मानक विचलन के भीतर हैं; और लगभग 99.7% तीन मानक विचलन के भीतर हैं।[4]इस तथ्य को 68–95–99.7 नियम|68-95-99.7 (अनुभवजन्य) नियम या 3-सिग्मा नियम के रूप में जाना जाता है।
अधिक सटीक रूप से, एक सामान्य विचलन के बीच की सीमा में होने की संभावना और द्वारा दिया गया है
12 महत्वपूर्ण अंकों के लिए, मान के लिए हैं:[citation needed]
OEIS | ||||||
---|---|---|---|---|---|---|
1 | 0.682689492137 | 0.317310507863 |
|
OEIS: A178647 | ||
2 | 0.954499736104 | 0.045500263896 |
|
OEIS: A110894 | ||
3 | 0.997300203937 | 0.002699796063 |
|
OEIS: A270712 | ||
4 | 0.999936657516 | 0.000063342484 |
| |||
5 | 0.999999426697 | 0.000000573303 |
| |||
6 | 0.999999998027 | 0.000000001973 |
|
बड़े के लिए , कोई सन्निकटन का उपयोग कर सकता है .
क्वांटाइल फंक्शन
किसी वितरण का मात्रात्मक फलन संचयी बंटन फलन का व्युत्क्रम होता है। मानक सामान्य वितरण के मात्रात्मक समारोह को प्रोबिट फ़ंक्शन कहा जाता है, और इसे व्युत्क्रम त्रुटि फ़ंक्शन के संदर्भ में व्यक्त किया जा सकता है:
औसत के साथ एक सामान्य रैंडम चर के लिए और विचरण , क्वांटाइल फ़ंक्शन है
क्वांटाइल मानक सामान्य वितरण का सामान्य रूप से निरूपित किया जाता है . इन मूल्यों का उपयोग परिकल्पना परीक्षण, विश्वास अंतराल के निर्माण और क्यू-क्यू भूखंडों में किया जाता है। एक सामान्य रैंडम चर अधिक हो जाएगा संभावना के साथ , और अंतराल के बाहर होता है संभावना के साथ . विशेष रूप से, मात्रा 1.96 है; इसलिए एक सामान्य रैंडम चर अंतराल के बाहर होता है केवल 5% स्थितियो में।
निम्न तालिका मात्रा देता है ऐसा है कि के दायरे में रहेगा एक निर्दिष्ट संभावना के साथ . ये मान नमूना माध्य और नमूना सहप्रसरण # नमूना माध्य और सामान्य (या विषम रूप से सामान्य) वितरण वाले अन्य सांख्यिकीय अनुमानकों के लिए सहिष्णुता अंतराल निर्धारित करने के लिए उपयोगी हैं।[citation needed] ध्यान दें कि निम्न तालिका दिखाती है , नहीं जैसा कि ऊपर परिभाषित किया गया है।
0.80 | 1.281551565545 | 0.999 | 3.290526731492 | |
0.90 | 1.644853626951 | 0.9999 | 3.890591886413 | |
0.95 | 1.959963984540 | 0.99999 | 4.417173413469 | |
0.98 | 2.326347874041 | 0.999999 | 4.891638475699 | |
0.99 | 2.575829303549 | 0.9999999 | 5.326723886384 | |
0.995 | 2.807033768344 | 0.99999999 | 5.730728868236 | |
0.998 | 3.090232306168 | 0.999999999 | 6.109410204869 |
छोटे के लिए , क्वांटाइल फ़ंक्शन में उपयोगी स्पर्शोन्मुख विस्तार है
[13]
गुण
सामान्य बंटन ही एकमात्र ऐसा बंटन है जिसके पहले दो से परे (अर्थात् माध्य और प्रसरण के अतिरिक्त ) संचयी शून्य होते हैं। यह निर्दिष्ट माध्य और विचरण के लिए अधिकतम एन्ट्रापी प्रायिकता वितरण के साथ निरंतर वितरण भी है।[14][15] गीरी ने दिखाया है, यह मानते हुए कि माध्य और विचरण परिमित हैं, कि सामान्य वितरण ही एकमात्र वितरण है जहां स्वतंत्र ड्रा के सेट से गणना की गई माध्य और विचरण एक दूसरे से स्वतंत्र हैं।[16][17] सामान्य वितरण अण्डाकार वितरण का एक उपवर्ग है। सामान्य वितरण अपने माध्य के बारे में सममित वितरण है, और संपूर्ण वास्तविक रेखा पर गैर-शून्य है। जैसे कि यह उन चरों के लिए उपयुक्त मॉडल नहीं हो सकता है जो स्वाभाविक रूप से सकारात्मक या दृढ़ता से विषम हैं, जैसे किसी व्यक्ति का वजन या शेयर (वित्त) की कीमत। ऐसे चरों को अन्य डिस्ट्रीब्यूशन ों द्वारा बेहतर वर्णित किया जा सकता है, जैसे लॉग-सामान्य वितरण या पारेटो डिस्ट्रीब्यूशन ।
सामान्य वितरण का मान व्यावहारिक रूप से शून्य होता है जब मान माध्य से कुछ मानक विचलनों से अधिक दूर स्थित है (उदाहरण के लिए, तीन मानक विचलनों का प्रसार कुल वितरण के 0.27% को छोड़कर सभी को कवर करता है)। इसलिए, यह एक उपयुक्त मॉडल नहीं हो सकता है जब कोई ग़ैर के एक महत्वपूर्ण अंश की अपेक्षा करता है - मान जो कई मानक विचलन को माध्य से दूर करते हैं - और कम से कम वर्ग और अन्य सांख्यिकीय अनुमान विधियां जो सामान्य रूप से वितरित चर के लिए इष्टतम हैं, लागू होने पर अधिकांशतः अत्यधिक अविश्वसनीय हो जाती हैं। ऐसे डेटा के लिए। उन स्थितियो में, एक अधिक भारी-पूंछ वाले वितरण को माना जाना चाहिए और उचित मजबूत सांख्यिकी विधियों को लागू किया जाना चाहिए।
गॉसियन वितरण स्थिर वितरण के परिवार से संबंधित है जो स्वतंत्र और समान रूप से वितरित रैंडम चर के योगों के आकर्षण हैं | स्वतंत्र, समान रूप से वितरित वितरण चाहे माध्य या विचरण परिमित हो या नहीं। गॉसियन को छोड़कर जो एक सीमित स्थिति है, सभी स्थिर डिस्ट्रीब्यूशन ों में भारी पूंछ और अनंत विचरण होता है। यह उन कुछ डिस्ट्रीब्यूशन ों में से एक है जो स्थिर हैं और जिनमें प्रायिकता घनत्व कार्य हैं जिन्हें विश्लेषणात्मक रूप से व्यक्त किया जा सकता है, अन्य कॉची वितरण और लेवी वितरण हैं।
समरूपता और डेरिवेटिव
घनत्व के साथ सामान्य वितरण (अर्थ और मानक विचलन ) के निम्नलिखित गुण हैं:
- यह बिंदु के चारों ओर सममित है जो एक ही समय में बहुलक (सांख्यिकी), माध्यिका और वितरण का माध्य है।[18]
- यह अनिमॉडल है: इसका पहला यौगिक के लिए सकारात्मक है के लिए नकारात्मक और शून्य केवल पर
- वक्र और द से घिरा क्षेत्र -अक्ष एकता है (अर्थात एक के बराबर)।
- इसकी पहली व्युत्पत्ति है
- इसके घनत्व में दो विभक्ति बिंदु होते हैं (जहाँ दूसरा व्युत्पन्न होता है शून्य है और चिह्न बदलता है), मतलब से एक मानक विचलन दूर स्थित है, अर्थात् पर और [18]* इसका घनत्व लघुगणकीय रूप से अवतल कार्य है | लॉग-अवतल।[18]* इसका घनत्व असीम रूप से भिन्न कार्य है, वास्तव में ऑर्डर 2 का सुपरस्मूथ है।[19]
इसके अतिरिक्त , घनत्व मानक सामान्य वितरण का (अर्थात और ) में निम्नलिखित गुण भी हैं:
- इसकी पहली व्युत्पत्ति है
- इसका दूसरा व्युत्पन्न है
- अधिक सामान्यतः, इसकी nवें व्युत्पन्न है कहाँ है n(संभाव्य) हर्मिट बहुपद।[20]
- संभावना है कि एक सामान्य रूप से वितरित चर ज्ञात के साथ और एक विशेष सेट में है, इस तथ्य का उपयोग करके गणना की जा सकती है कि भिन्न एक मानक सामान्य वितरण है।
क्षण
एक चर का सादा और निरपेक्ष क्षण (गणित)। के अपेक्षित मूल्य हैं और , क्रमश। यदि अपेक्षित मूल्य का शून्य है, इन मापदंडों को केंद्रीय क्षण कहा जाता है; अन्यथा, इन मापदंडों को गैर-केंद्रीय क्षण कहा जाता है। सामान्यतः हम केवल पूर्णांक क्रम वाले क्षणों में रुचि रखते हैं .
यदि एक सामान्य वितरण है, गैर-केंद्रीय क्षण मौजूद हैं और किसी के लिए परिमित हैं जिसका वास्तविक भाग −1 से बड़ा है। किसी भी गैर-ऋणात्मक पूर्णांक के लिए , सादे केंद्रीय क्षण हैं:[21]
यहाँ दोहरे क्रमगुणन को दर्शाता है, अर्थात सभी संख्याओं का गुणनफल से 1 तक जिसमें समान समानता है केंद्रीय निरपेक्ष क्षण सभी समान आदेशों के लिए सादे क्षणों के साथ मेल खाते हैं, लेकिन विषम आदेशों के लिए अशून्य हैं। किसी भी गैर-ऋणात्मक पूर्णांक के लिए
अंतिम सूत्र किसी भी गैर-पूर्णांक के लिए भी मान्य है जब मतलब सादे और निरपेक्ष क्षणों को संगम हाइपरज्यामितीय कार्यों के संदर्भ में व्यक्त किया जा सकता है और [citation needed]
ये भाव मान्य रहते हैं भले ही पूर्णांक नहीं है। हर्मिट बहुपद# ऋणात्मक प्रसरण भी देखें।
Order | Non-central moment | Central moment |
---|---|---|
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 |
की अपेक्षा इस घटना पर सशर्त अन्तराल में होता है द्वारा दिया गया है
कहाँ और क्रमशः घनत्व और संचयी वितरण समारोह हैं . के लिए इसे व्युत्क्रम मिल्स अनुपात के रूप में जाना जाता है। ध्यान दें कि ऊपर, घनत्व का व्युत्क्रम मिल्स अनुपात में मानक सामान्य घनत्व के बजाय प्रयोग किया जाता है, इसलिए यहां हमारे पास है के बजाय .
फूरियर रूपांतरण और विशिष्ट कार्य
एक सामान्य घनत्व का फूरियर रूपांतरण मतलब के साथ और मानक विचलन है[22]
कहाँ काल्पनिक इकाई है। यदि माध्य , पहला कारक 1 है, और फूरियर ट्रांसफॉर्म एक स्थिर कारक के अतिरिक्त आवृत्ति डोमेन पर एक सामान्य घनत्व है, मतलब 0 और मानक विचलन के साथ . विशेष रूप से, मानक सामान्य वितरण एक फूरियर रूपांतरण है#फूरियर रूपांतरण के ईजेनफंक्शंस।
प्रायिकता सिद्धांत में, एक वास्तविक-मूल्यवान रैंडम चर के प्रायिकता वितरण का फूरियर रूपांतरण विशेषता कार्य (संभावना सिद्धांत) से निकटता से जुड़ा हुआ है उस चर का, जिसे के अपेक्षित मूल्य के रूप में परिभाषित किया गया है , वास्तविक चर के एक समारोह के रूप में (फूरियर रूपांतरण की आवृत्ति पैरामीटर)। इस परिभाषा को विश्लेषणात्मक रूप से एक जटिल-मूल्य चर तक बढ़ाया जा सकता है .[23] दोनों के बीच संबंध है:
पल और संचयी जनरेटिंग फ़ंक्शन
एक वास्तविक रैंडम चर का क्षण उत्पन्न करने वाला कार्य का अपेक्षित मूल्य है , वास्तविक पैरामीटर के एक समारोह के रूप में . घनत्व के साथ सामान्य वितरण के लिए , अर्थ और विचलन , क्षण उत्पन्न करने वाला कार्य मौजूद है और इसके बराबर है
संचयी उत्पादन समारोह पल जनरेटिंग फ़ंक्शन का लघुगणक है, अर्थात्
चूँकि यह एक द्विघात बहुपद है , केवल पहले दो संचयी अशून्य हैं, अर्थात् माध्य और भिन्नता.
स्टीन ऑपरेटर और वर्ग
स्टीन की विधि के भीतर स्टीन ऑपरेटर और एक रैंडम चर का वर्ग हैं और सभी बिल्कुल निरंतर कार्यों का वर्ग .
शून्य-विचरण सीमा
सीमा में (गणित) जब शून्य हो जाता है, प्रायिकता घनत्व अंततः शून्य हो जाता है , लेकिन यदि बिना सीमा के बढ़ता है , जबकि इसका समाकल 1 के बराबर रहता है। इसलिए, सामान्य बंटन को साधारण फलन (गणित) के रूप में परिभाषित नहीं किया जा सकता जब .
चूंकि , सामान्य वितरण को एक सामान्यीकृत फ़ंक्शन के रूप में शून्य विचरण के साथ परिभाषित किया जा सकता है; विशेष रूप से, Dirac delta function|Dirac's delta function के रूप में माध्यम से अनुवादित , वह है इसका सीडीएफ तब अर्थ द्वारा अनुवादित हैवीसाइड स्टेप फंक्शन है , अर्थात्
अधिकतम एन्ट्रापी
एक निर्दिष्ट माध्य के साथ वास्तविक पर सभी प्रायिकता डिस्ट्रीब्यूशन ों में से और विचरण, सामान्य वितरण अधिकतम एंट्रॉपी प्रायिकता वितरण वाला एक है।[24] यदि प्रायिकता घनत्व समारोह के साथ एक सतत रैंडम चर है , फिर की एन्ट्रापी परिभाषित किया जाता है[25][26][27]
कहाँ कभी भी शून्य समझा जाता है . इस कार्यात्मकता को अधिकतम किया जा सकता है, इस बाधा के अधीन कि वितरण उचित रूप से सामान्य है और भिन्नता कैलकुस का उपयोग करके एक निर्दिष्ट भिन्नता है। दो लग्रेंज गुणक वाले एक समारोह को परिभाषित किया गया है:
कहाँ अभी के लिए, माध्य के साथ कुछ घनत्व फलन के रूप में माना जाता है और मानक विचलन .
अधिकतम एन्ट्रापी पर, एक छोटा बदलाव के बारे में भिन्नता उत्पन्न करेगा के बारे में जो 0 के बराबर है:
चूंकि यह किसी भी छोटे के लिए होना चाहिए , कोष्ठक में शब्द शून्य होना चाहिए और के लिए हल करना चाहिए पैदावार:
हल करने के लिए विवश समीकरणों का उपयोग करना और सामान्य वितरण का घनत्व देता है:
एक सामान्य वितरण की एन्ट्रॉपी बराबर होती है
अन्य गुण
- If the characteristic function of some random variable is of the form , where is a polynomial, then the Marcinkiewicz theorem (named after Józef Marcinkiewicz) asserts that can be at most a quadratic polynomial, and therefore is a normal random variable.[28] The consequence of this result is that the normal distribution is the only distribution with a finite number (two) of non-zero cumulants.
- If and are jointly normal and uncorrelated, then they are independent. The requirement that and should be jointly normal is essential; without it the property does not hold.[29][30][proof] For non-normal random variables uncorrelatedness does not imply independence.
- The Kullback–Leibler divergence of one normal distribution from another is given by:[31]
The Hellinger distance between the same distributions is equal to Failed to parse (Conversion error. Server ("cli") reported: "SyntaxError: Expected "-", "[", "\\", "\\begin", "\\begin{", "]", "^", "_", "{", "}", [ \t\n\r], [%$], [().], [,:;?!'], [/|], [0-9], [><~], [\-+*=], or [a-zA-Z] but "ई" found.in 3:1"): {\displaystyle H^2(X_1,X_2) = 1 - \sqrt{\frac{2\sigma_1\sigma_2}{\sigma_1^2+\sigma_2^2}} ई^{-\frac{1}{4}\frac{(\mu_1-\mu_2)^2}{\sigma_1^2+\sigma_2^2}} </ गणित> |4= एक सामान्य वितरण के लिए [[फिशर सूचना मैट्रिक्स]] w.r.t. गणित> \ mu</ गणित> और गणित>\sigma^2} विकर्ण है और रूप लेता है गणित प्रदर्शन = ब्लॉक>
\mathcal I (\mu, \sigma^2) = \begin{pmatrix} \frac{1}{\sigma^2} & 0 \\ 0 & \frac{1}{2\sigma^4} \end{ pmatrix}
</ गणित> - एक सामान्य बंटन के माध्य से पहले का संयुग्मी एक अन्य सामान्य बंटन है।[32] विशेष रूप से, अगर आईआईडी हैं और पूर्व है , फिर के अनुमानक के लिए पश्च वितरण होगा
- सामान्य वितरण का परिवार न केवल एक घातीय परिवार (ईएफ) बनाता है, बल्कि वास्तव में द्विघात विचरण समारोह (NEF-QVF) के साथ एक प्राकृतिक घातीय परिवार (एनईएफ) बनाता है। सामान्य वितरण के कई गुण एनईएफ-क्यूवीएफ वितरण, एनईएफ वितरण, या ईएफ वितरण के गुणों को आम तौर पर सामान्यीकृत करते हैं। एनईएफ-क्यूवीएफ वितरण में 6 परिवार शामिल हैं, जिनमें पोइसन, गामा, द्विपद और नकारात्मक द्विपद वितरण शामिल हैं, जबकि संभाव्यता और आंकड़ों में अध्ययन किए गए कई आम परिवार एनईएफ या ईएफ हैं।
- सूचना ज्यामिति में, सामान्य वितरण का परिवार निरंतर वक्रता के साथ एक सांख्यिकीय कई गुना बनाता है . (±1)-कनेक्शन के संबंध में एक ही परिवार कई गुना फ्लैट है और .[33]
संबंधित डिस्ट्रीब्यूशन
केंद्रीय सीमा प्रमेय
केंद्रीय सीमा प्रमेय कहता है कि कुछ (काफी सामान्य) स्थितियों के अनुसार , कई रैंडम चरों के योग का लगभग सामान्य वितरण होता है । अधिक विशेष रूप से, कहाँ स्वतंत्र और समान रूप से समान डिस्ट्रीब्यूशन , शून्य माध्य और विचरण के साथ समान रूप से वितरित रैंडम चर हैं और उनकी है मतलब द्वारा बढ़ाया गया
फिर ऐसे बढ़ जाती है, की संभावना वितरण शून्य माध्य और विचरण के साथ सामान्य वितरण की ओर प्रवृत्त होता है .
प्रमेय को चरों तक बढ़ाया जा सकता है जो स्वतंत्र नहीं हैं और/या समान रूप से वितरित नहीं हैं यदि कुछ बाधाओं को निर्भरता की डिग्री और वितरण के क्षणों पर रखा जाता है।
कई परीक्षण आँकड़े, स्कोर (सांख्यिकी), और अनुमानक अभ्यास में सामना करते हैं, उनमें कुछ रैंडम चर के योग होते हैं, और इससे भी अधिक अनुमानकों को प्रभाव समारोह (सांख्यिकी) के उपयोग के माध्यम से रैंडम चर के योग के रूप में दर्शाया जा सकता है। केंद्रीय सीमा प्रमेय का अर्थ है कि उन सांख्यिकीय मापदंडों में असमान रूप से सामान्य वितरण होंगे।
केंद्रीय सीमा प्रमेय का अर्थ यह भी है कि कुछ डिस्ट्रीब्यूशन ों को सामान्य वितरण द्वारा अनुमानित किया जा सकता है, उदाहरण के लिए:
- द्विपद वितरण माध्य के साथ डी मोइवर-लाप्लास प्रमेय है और विचरण बड़े के लिए और के लिए 0 या 1 के बहुत करीब नहीं।
- पैरामीटर के साथ प्वासों वितरण औसत के साथ लगभग सामान्य है और विचरण , के बड़े मूल्यों के लिए .[34]
- ची-वर्ग वितरण औसत के साथ लगभग सामान्य है और विचरण , बड़े के लिए .
- छात्र का टी-वितरण माध्य 0 और प्रसरण 1 के साथ लगभग सामान्य है जब बड़ी है।
क्या ये सन्निकटन पर्याप्त रूप से सटीक हैं, यह उस उद्देश्य पर निर्भर करता है जिसके लिए उनकी आवश्यकता है, और सामान्य वितरण के अभिसरण की दर। सामान्यतः ऐसा होता है कि इस तरह के अनुमान वितरण के अंत में कम सटीक होते हैं।
केंद्रीय सीमा प्रमेय में सन्निकटन त्रुटि के लिए एक सामान्य ऊपरी सीमा बेरी-एसेन प्रमेय द्वारा दी गई है, सन्निकटन में सुधार एडगेवर्थ विस्तार द्वारा दिया गया है।
इस प्रमेय का उपयोग गॉसियन शोर के रूप में कई समान शोर स्रोतों के योग को सही ठहराने के लिए भी किया जा सकता है। एडब्ल्यूजीएन देखें।
सामान्य चर के संचालन और कार्य
प्रायिकता घनत्व समारोह, संचयी वितरण समारोह, और एक या एक से अधिक स्वतंत्र या सहसंबद्ध सामान्य चर के किसी भी समारोह के व्युत्क्रम संचयी वितरण समारोह की गणना रे-ट्रेसिंग की संख्यात्मक विधि से की जा सकती है।[35] (मैटलैब कोड)। निम्नलिखित अनुभागों में हम कुछ विशेष स्थितियो को देखते हैं।
एकल सामान्य चर पर संचालन
यदि माध्य के साथ सामान्य रूप से वितरित किया जाता है और विचरण , तब
- , किसी भी वास्तविक संख्या के लिए और , भी सामान्य रूप से माध्य के साथ वितरित किया जाता है और मानक विचलन . अर्थात्, रैखिक परिवर्तनों के अनुसार सामान्य वितरण का परिवार बंद है।
- का घातांक वितरित किया जाता है लॉग-सामान्य वितरण | लॉग-सामान्य रूप से: eX ~ ln(N (μ, σ2)).
- का पूर्ण मूल्य सामान्य वितरण को मोड़ दिया है: |X| ~ Nf (μ, σ2). यदि इसे अर्ध-सामान्य वितरण के रूप में जाना जाता है।
- सामान्यीकृत अवशिष्टों का निरपेक्ष मान, |X - μ|/σ, में स्वतंत्रता की एक डिग्री के साथ ची वितरण है: .
- X/σ के वर्ग में स्वतंत्रता की एक डिग्री के साथ गैर-केन्द्रीय ची-वर्ग वितरण है: . यदि , बंटन को केवल काई-वर्ग बंटन|ची-वर्ग कहा जाता है।
- एक सामान्य चर की लॉग संभावना बस इसकी प्रायिकता घनत्व समारोह का लघुगणक है: चूंकि यह एक मानक सामान्य चर का एक स्केल्ड और स्थानांतरित वर्ग है, इसे स्केल्ड और शिफ्ट किए गए ची-स्क्वायर वितरण | ची-स्क्वेर्ड चर के रूप में वितरित किया जाता है।
- वेरिएबल एक्स का वितरण एक अंतराल [ए, बी] तक सीमित है जिसे छोटा सामान्य वितरण कहा जाता है।
- (एक्स - μ)−2 का लेवी वितरण स्थान 0 और स्केल σ के साथ है-2</सुप>.
दो स्वतंत्र सामान्य चर पर संचालन
- यदि और साधन के साथ दो स्वतंत्रता ( प्रायिकता सिद्धांत) सामान्य रैंडम चर हैं , और मानक विचलन , , फिर उनका योग भी सामान्य रूप से वितरित किया जाएगा,सामान्य रूप से वितरित रैंडम चर का योग|[सबूत] माध्य के साथ और विचरण .
- विशेष रूप से, यदि और शून्य माध्य और विचरण के साथ स्वतंत्र सामान्य विचलन हैं , तब और शून्य माध्य और विचरण के साथ स्वतंत्र और सामान्य रूप से वितरित भी हैं . यह ध्रुवीकरण की पहचान का एक विशेष स्थिति है।[36]
- यदि , माध्य के साथ दो स्वतंत्र सामान्य विचलन हैं और विचलन , और , मनमाना वास्तविक संख्याएं हैं, फिर चर भी सामान्य रूप से माध्य के साथ वितरित किया जाता है और विचलन . यह इस प्रकार है कि सामान्य वितरण स्थिर वितरण है (घातांक के साथ ).
दो स्वतंत्र मानक सामान्य चर पर संचालन
यदि और माध्य 0 और प्रसरण 1 के साथ दो स्वतंत्र मानक सामान्य रैंडम चर हैं
- उनका योग और अंतर सामान्य रूप से माध्य शून्य और विचरण दो के साथ वितरित किया जाता है: .
- उनका उत्पाद उत्पाद वितरण # स्वतंत्र केंद्रीय-सामान्य वितरण का अनुसरण करता है[37] घनत्व समारोह के साथ कहाँ मैकडोनाल्ड समारोह है। यह वितरण शून्य के आसपास सममित है, पर असीम है , और विशेषता कार्य (संभावना सिद्धांत) है .
- उनका अनुपात मानक कॉची वितरण का अनुसरण करता है: .
- उनका यूक्लिडियन मानदंड रेले वितरण है।
कई स्वतंत्र सामान्य चर पर संचालन
- स्वतंत्र सामान्य विचलन का कोई भी रैखिक संयोजन एक सामान्य विचलन है।
- यदि स्वतंत्र मानक सामान्य रैंडम चर हैं, तो उनके वर्गों के योग में ची-वर्ग वितरण है स्वतंत्रता की कोटियां
- यदि साधन के साथ सामान्य रूप से वितरित रैंडम चर स्वतंत्र हैं और प्रसरण , तो उनका नमूना माध्य नमूना मानक विचलन से स्वतंत्र है,[38] जिसे बसु के प्रमेय या कोचरन के प्रमेय का उपयोग करके प्रदर्शित किया जा सकता है।[39] इन दो मात्राओं के अनुपात में छात्र का टी-वितरण होता है स्वतंत्रता की कोटियां:
- यदि , स्वतंत्र मानक सामान्य रैंडम चर हैं, तो वर्गों के सामान्यीकृत योगों का अनुपात होता है F-distribution साथ (n, m) स्वतंत्रता की कोटियां:[40]
एकाधिक सहसंबद्ध सामान्य चर पर संचालन
- सामान्य सदिश का द्विघात रूप, यानी द्विघात फलन एकाधिक स्वतंत्र या सहसंबद्ध सामान्य चर का, एक सामान्यीकृत ची-स्क्वायर वितरण है। सामान्यीकृत ची-स्क्वायर चर।
घनत्व समारोह पर संचालन
विभाजित सामान्य वितरण को विभिन्न सामान्य डिस्ट्रीब्यूशन ों के घनत्व कार्यों के स्केल किए गए वर्गों में शामिल होने और एक में एकीकृत करने के लिए घनत्व को कम करने के संदर्भ में सबसे सीधे परिभाषित किया गया है। छोटा किया गया सामान्य वितरण एकल घनत्व फ़ंक्शन के एक खंड को फिर से स्केल करने का परिणाम है।
अनंत विभाज्यता और क्रैमर की प्रमेय
किसी भी सकारात्मक पूर्णांक के लिए , माध्य के साथ कोई भी सामान्य वितरण और विचरण के योग का वितरण है स्वतंत्र सामान्य विचलन, प्रत्येक माध्य के साथ और विचरण . इस संपत्ति को अनंत विभाज्यता ( प्रायिकता ) कहा जाता है।[41] इसके विपरीत यदि और स्वतंत्र रैंडम चर और उनकी राशि हैं एक सामान्य वितरण है, फिर दोनों और सामान्य विचलन होना चाहिए।[42] इस परिणाम को क्रैमर के अपघटन प्रमेय के रूप में जाना जाता है, और यह कहने के बराबर है कि दो डिस्ट्रीब्यूशन ों का कनवल्शन सामान्य है यदि और केवल यदि दोनों सामान्य हैं। क्रैमर के प्रमेय का तात्पर्य है कि स्वतंत्र गैर-गाऊसी चरों के एक रैखिक संयोजन का कभी भी बिल्कुल सामान्य वितरण नहीं होता है , चूंकि यह मनमाने ढंग से निकटता से संपर्क कर सकता है।[28]
बर्नस्टीन की प्रमेय
बर्नस्टीन के प्रमेय में कहा गया है कि यदि और स्वतंत्र हैं और और स्वतंत्र भी हैं, तो X और Y दोनों का सामान्य बंटन अनिवार्य रूप से होना चाहिए।[43][44] अधिक सामान्यतः, यदि स्वतंत्र रैंडम चर हैं, फिर दो भिन्न रैखिक संयोजन और स्वतंत्र होता है यदि और केवल यदि सभी सामान्य हैं और , कहाँ के विचरण को दर्शाता है .[43]
एक्सटेंशन
सामान्य वितरण की धारणा, प्रायिकता सिद्धांत में सबसे महत्वपूर्ण डिस्ट्रीब्यूशन ों में से एक होने के नाते, यूनीवेरिएट (जो कि एक आयामी है) स्थितियो े (केस 1) के मानक ढांचे से बहुत आगे तक बढ़ा दी गई है। इन सभी विस्तारों को सामान्य या गाऊसी कानून भी कहा जाता है, इसलिए नामों में एक निश्चित अस्पष्टता मौजूद है।
- मल्टवेरीेंएट सामान्य वितरण के-आयामी यूक्लिडियन अंतरिक्ष में गॉसियन कानून का वर्णन करता है। एक सदिश X ∈ Rk बहुभिन्नरूपी-सामान्य रूप से वितरित है यदि इसके घटकों का कोई रैखिक संयोजन है Σk
j=1aj Xj एक (अविभाजित) सामान्य वितरण है। X का प्रसरण एक k×k सममित सकारात्मक-निश्चित आव्यूह V है। मल्टवेरीेंएट सामान्य वितरण अण्डाकार वितरण का एक विशेष स्थिति है। जैसे, k = 2 स्थितियो े में इसका आइसो-घनत्व लोकी दीर्घवृत्त हैं और मनमाने k के स्थितियो े में दीर्घवृत्त हैं। - संशोधित गाऊसी वितरण सामान्य वितरण का एक संशोधित संस्करण है जिसमें सभी नकारात्मक तत्व 0 पर रीसेट हो जाते हैं
- जटिल सामान्य वितरण जटिल सामान्य सदिश से संबंधित है। एक जटिल वेक्टर X ∈ Ck सामान्य कहा जाता है यदि इसके वास्तविक और काल्पनिक दोनों घटक संयुक्त रूप से 2k-आयामी मल्टवेरीेंएट सामान्य वितरण रखते हैं। X की प्रसरण-सहप्रसरण संरचना को दो आव्यूहों द्वारा वर्णित किया गया है: प्रसरण आव्यूह Γ, और संबंध आव्यूह C।
- आव्यूह सामान्य वितरण सामान्य रूप से वितरित आव्यूह के स्थितियो े का वर्णन करता है।
- गॉसियन प्रक्रियाएं सामान्य रूप से वितरित स्टोकेस्टिक प्रक्रियाएं हैं। इन्हें कुछ अनंत-आयामी हिल्बर्ट अंतरिक्ष H के तत्वों के रूप में देखा जा सकता है, और इस प्रकार स्थितियो े के लिए मल्टवेरीेंएट सामान्य सदिश के अनुरूप हैं k = ∞. एक रैंडम तत्व h ∈ H किसी भी स्थिरांक के लिए सामान्य कहा जाता है a ∈ H स्केलर उत्पाद (a, h) एक (अविभाजित) सामान्य वितरण है। ऐसे गॉसियन रैंडम तत्व की विचरण संरचना को रैखिक सहप्रसरण के संदर्भ में वर्णित किया जा सकता है operator K: H → H. कई गाऊसी प्रक्रियाएँ अपने स्वयं के नाम रखने के लिए काफी लोकप्रिय हुईं:
- वीनर प्रक्रिया,
- ब्राउनियन पुल,
- ऑर्स्टीन-उहलेनबेक प्रक्रिया।
- गॉसियन क्यू-वितरण एक सार गणितीय निर्माण है जो सामान्य वितरण के क्यू-एनालॉग का प्रतिनिधित्व करता है।
- क्ष-गाऊसी गॉसियन वितरण का एक एनालॉग है, इस अर्थ में कि यह सॉलिस एंट्रॉपी को अधिकतम करता है, और एक प्रकार का सॉलिस वितरण है। ध्यान दें कि यह वितरण उपरोक्त गॉसियन q-वितरण से भिन्न है।
- कनियादकिस गॉसियन वितरण | कनियादकिस κ-गाऊसी वितरण गॉसियन वितरण का एक सामान्यीकरण है जो कनियादकिस डिस्ट्रीब्यूशन ों में से एक होने के नाते, कनियादकिस आंकड़ों से उत्पन्न होता है।
एक रैंडम चर X में एक वितरण होने पर दो-टुकड़ा सामान्य वितरण होता है
जहां μ माध्य है और σ1 और पी2 क्रमशः माध्य के बाएँ और दाएँ वितरण के मानक विचलन हैं।
इस वितरण का माध्य, विचरण और तीसरा केंद्रीय क्षण निर्धारित किया गया है[45]
जहाँ E(X), V(X) और T(X) क्रमशः माध्य, विचरण और तीसरा केंद्रीय क्षण हैं।
गॉसियन कानून के मुख्य व्यावहारिक उपयोगों में से एक व्यवहार में आने वाले कई अलग-भिन्न रैंडम चरों के अनुभवजन्य डिस्ट्रीब्यूशन ों को मॉडल करना है। ऐसे स्थितियो े में एक संभावित विस्तार वितरण का एक समृद्ध परिवार होता है , जिसमें दो से अधिक पैरामीटर होंगे और इसलिए अनुभवजन्य वितरण को अधिक सटीक रूप से फिट करने में सक्षम होंगे। ऐसे एक्सटेंशन के उदाहरण हैं:
- पियर्सन बंटन — प्रायिकता बंटन का एक चार-पैरामीटर परिवार जो विभिन्न तिरछापन और कर्टोसिस मूल्यों को शामिल करने के लिए सामान्य कानून का विस्तार करता है।
- सामान्यीकृत सामान्य डिस्ट्रीब्यूशन , जिसे घातीय शक्ति वितरण के रूप में भी जाना जाता है, मोटे या पतले स्पर्शोन्मुख व्यवहार के साथ वितरण पूंछ की अनुमति देता है।
सांख्यिकीय निष्कर्ष
मापदंडों का अनुमान
अधिकांशतः ऐसा होता है कि हम सामान्य वितरण के मापदंडों को नहीं जानते हैं, बल्कि इसके बजाय उन्हें अनुमान सिद्धांत करना चाहते हैं। यानी सैंपल लेना एक सामान्य से जनसंख्या हम मापदंडों के अनुमानित मूल्यों को सीखना चाहेंगे और . इस समस्या का मानक दृष्टिकोण अधिकतम संभावना विधि है, जिसके लिए लॉग-लाइबिलिटी फ़ंक्शन को अधिकतम करने की आवश्यकता होती है:
के संबंध में डेरिवेटिव लेना और और पहले क्रम की स्थिति के परिणामी सिस्टम को हल करने से अधिकतम संभावना अनुमान प्राप्त होता है:
नमूना मतलब
अनुमानक <गणित शैली= लंबवत-संरेखण:-.3em >\textstyle\hat\mu</math> को नमूना माध्य कहा जाता है, क्योंकि यह सभी अवलोकनों का अंकगणितीय माध्य है। आँकड़ा <गणित शैली = लंबवत-संरेखण: 0 >\textstyle\overline{x}</math> पूर्ण आँकड़ा है और इसके लिए पर्याप्त आँकड़ा है गणित>\mu</math>, और इसलिए लेहमन-शेफ़े प्रमेय द्वारा, <गणित शैली= लंबवत-संरेखण:-.3em>\textstyle\hat\mu</math> समान रूप से न्यूनतम प्रसरण निष्पक्ष (UMVU) अनुमानक है .[46] परिमित नमूनों में यह सामान्य रूप से वितरित किया जाता है:
इस अनुमानक का प्रसरण व्युत्क्रम फिशर सूचना आव्यूह <गणित शैली = लंबवत-संरेखण: 0>\textstyle\mathcal{I}^{-1}</math> के μμ-तत्व के बराबर है। इसका तात्पर्य है कि अनुमानक कुशल अनुमानक | परिमित-नमूना कुशल है। व्यावहारिक महत्व का तथ्य यह है कि <गणित शैली= लंबवत-संरेखण:-.3em >\textstyle\hat\mu</math> की मानक त्रुटि (सांख्यिकी) <गणित शैली= लंबवत-संरेखण:-.3em के समानुपातिक है >\textstyle1/\sqrt{n}</math>, यानी, यदि कोई मानक त्रुटि को 10 के गुणक से घटाना चाहता है, तो उसे नमूने में अंकों की संख्या 100 के गुणक से बढ़ानी होगी। यह तथ्य है जनमत सर्वेक्षणों के लिए नमूना आकार और मोंटे कार्लो सिमुलेशन में परीक्षणों की संख्या निर्धारित करने में व्यापक रूप से उपयोग किया जाता है।
स्पर्शोन्मुख सिद्धांत (सांख्यिकी) के दृष्टिकोण से, <गणित शैली = लंबवत-संरेखण: - 3em>\textstyle\hat\mu</math> सुसंगत अनुमानक है, अर्थात, यह प्रायिकता में अभिसरण है जैसा . अनुमानक भी स्पर्शोन्मुख सामान्यता है, जो इस तथ्य का एक सरल परिणाम है कि यह परिमित नमूनों में सामान्य है:
नमूना विचरण
अनुमानक <गणित शैली= लंबवत-संरेखण:0 >\textstyle\hat\sigma^2</math> को नमूना प्रसरण कहा जाता है, क्योंकि यह नमूने का प्रसरण है ( गणित>(x_1, \ldots, x_n)</गणित>)। व्यवहार में, <गणित शैली = लंबवत-संरेखण: 0>\textstyle\hat\sigma^2</math> के बजाय अधिकांशतः एक अन्य अनुमानक का उपयोग किया जाता है। यह अन्य अनुमानक निरूपित है , और इसे नमूना विचरण भी कहा जाता है, जो शब्दावली में एक निश्चित अस्पष्टता का प्रतिनिधित्व करता है; इसका वर्गमूल नमूना मानक विचलन कहा जाता है। अनुमानक <गणित शैली= लंबवत-संरेखण:0 >\textstyle\hat\sigma^2</math> से भिन्न है (n − 1) भाजक में n के बजाय (तथाकथित बेसेल का सुधार):
बीच में अंतर और <गणित शैली= लंबवत-संरेखण:0 >\textstyle\hat\sigma^2</math> बड़े n के लिए नगण्य रूप से छोटा हो जाता है'एस। चूंकि परिमित नमूनों में, के उपयोग के पीछे की प्रेरणा यह है कि यह अंतर्निहित पैरामीटर का निष्पक्ष अनुमानक है , जबकि <गणित शैली= लंबवत-संरेखण:0 >\textstyle\hat\sigma^2</math> पक्षपातपूर्ण है। इसके अतिरिक्त , लेहमन-शेफ़े प्रमेय द्वारा अनुमानक गणित> एस ^ 2 </ गणित> समान रूप से न्यूनतम भिन्नता निष्पक्ष है (न्यूनतम-भिन्नता निष्पक्ष अनुमानक),[46]जो इसे सभी निष्पक्ष लोगों के बीच सबसे अच्छा अनुमानक बनाता है। चूंकि यह दिखाया जा सकता है कि पक्षपाती अनुमानक <गणित शैली = लंबवत-संरेखण: 0>\textstyle\hat\sigma^2</math> से बेहतर है गणित> एस ^ 2 </ गणित> औसत चुकता त्रुटि (एमएसई) मानदंड के संदर्भ में। परिमित नमूनों में दोनों गणित>s^2</math> और <गणित शैली= लंबवत-संरेखण:0 >\textstyle\hat\sigma^2</math> के साथ स्केल किया हुआ ची-वर्ग वितरण है (n − 1) स्वतंत्रता की कोटियां:
इन भावों में से पहला दर्शाता है कि का विचरण के बराबर है , जो उलटा फ़िशर सूचना आव्यूह <गणित शैली = लंबवत-संरेखण: 0>\textstyle\mathcal{I}^{-1}</math> के σσ-तत्व से थोड़ा अधिक है। इस प्रकार, के लिए एक कुशल आकलनकर्ता नहीं है , और इसके अतिरिक्त , चूंकि UMVU है, हम यह निष्कर्ष निकाल सकते हैं कि परिमित-नमूना कुशल अनुमानक के लिए मौजूद नहीं होना।
स्पर्शोन्मुख सिद्धांत को लागू करना, दोनों अनुमानक और <गणित शैली= लंबवत-संरेखण:0 >\textstyle\hat\sigma^2</math> संगत हैं, अर्थात वे प्रायिकता में अभिसरण करते हैं गणित>\sigma^2</math> नमूना आकार के रूप में गणित>n\rightarrow\infty</math>. दो अनुमानक भी दोनों स्पर्शोन्मुख रूप से सामान्य हैं:
विशेष रूप से, दोनों अनुमानक विषम रूप से कुशल हैं .
विश्वास अंतराल
कोचरन के प्रमेय के अनुसार, सामान्य बंटन के लिए नमूने का मतलब <गणित शैली= लंबवत-संरेखण:-.3em >\textstyle\hat\mu</math> और नमूना प्रसरण s2 स्वतंत्रता ( प्रायिकता सिद्धांत) हैं, जिसका अर्थ है कि उनके संयुक्त वितरण पर विचार करने से कोई लाभ नहीं हो सकता है। एक विलोम प्रमेय भी है: यदि एक नमूने में नमूना माध्य और नमूना विचरण स्वतंत्र हैं, तो नमूना सामान्य वितरण से आया होता है । तथाकथित टी-सांख्यिकी के निर्माण के लिए <गणित शैली = ऊर्ध्वाधर-संरेखण: -3em>\textstyle\hat\mu</math> और s के बीच की स्वतंत्रता को नियोजित किया जा सकता है:
- गणित>
t = \frac{\hat\mu-\mu}{s/\sqrt{n}} = \frac{\overline{x}-\mu}{\sqrt{\frac{1}{n(n-1) )}\sum(x_i-\overline{x})^2}} \sim t_{n-1} </ गणित>
इस मात्रा t में छात्र का t-बंटन है (n − 1) स्वतंत्रता की डिग्री, और यह एक सहायक आँकड़ा है (मापदंडों के मूल्य से स्वतंत्र)। इस t-सांख्यिकी के वितरण को बदलने से हमें μ के लिए विश्वास अंतराल का निर्माण करने की अनुमति मिलेगी;[47] इसी तरह, χ को उल्टा करना2 आँकड़ों का डिस्ट्रीब्यूशन 2 हमें σ के लिए कॉन्फ़िडेंस इंटरवल देगा2:[48]
जहां टीk,pऔर χ 2
k,p t- और χ के pth मात्राएँ हैं2-वितरण क्रमशः। ये कॉन्फिडेंस इंटरवल आत्मविश्वास स्तर के होते हैं 1 − α, जिसका अर्थ है कि सच्चे मान μ और σ2 प्रायिकता (या सार्थकता स्तर) α के साथ इन अंतरालों के बाहर आते हैं। व्यवहार में लोग सामान्यतः लेते हैं α = 5%, जिसके परिणामस्वरूप 95% विश्वास अंतराल होता है।
अनुमानित सूत्र और s के असिम्प्टोटिक वितरण से प्राप्त किए जा सकते हैं।2:
अनुमानित सूत्र n के बड़े मानों के लिए मान्य हो जाते हैं, और मानक सामान्य क्वांटाइल्स z के बाद से मैन्युअल गणना के लिए अधिक सुविधाजनक होते हैंα/2 एन पर निर्भर न हों। विशेष रूप से, का सबसे लोकप्रिय मूल्य α = 5%, का परिणाम |z0.025| = 1.96.
सामान्यता परीक्षण
सामान्यता परीक्षण इस संभावना का आकलन करते हैं कि दिए गए डेटा सेट {x1, ..., एक्सn} सामान्य वितरण से आता है। आम तौर पर अशक्त परिकल्पना एच0 यह है कि प्रेक्षण सामान्य रूप से अनिर्दिष्ट माध्य μ और विचरण σ के साथ वितरित किए जाते हैं2, बनाम वैकल्पिक Haकि वितरण मनमाना है। इस समस्या के लिए कई परीक्षण (40 से अधिक) तैयार किए गए हैं। उनमें से अधिक प्रमुख नीचे उल्लिखित हैं:
'नैदानिक प्लॉट' अधिक सहज रूप से आकर्षक लेकिन एक ही समय में व्यक्तिपरक होते हैं, क्योंकि वे अशक्त परिकल्पना को स्वीकार या अस्वीकार करने के लिए अनौपचारिक मानवीय निर्णय पर भरोसा करते हैं।
- क्यू-क्यू प्लॉट, जिसे सामान्य प्रायिकता प्लॉट या रैंकिट प्लॉट के रूप में भी जाना जाता है - मानक सामान्य वितरण से संबंधित मात्राओं के अपेक्षित मूल्यों के विरुद्ध डेटा सेट से क्रमबद्ध मूल्यों का एक प्लॉट है। यही है, यह फॉर्म के बिंदु का एक प्लॉट है (Φ-1(पृk), एक्स(k)), जहां प्लॉटिंग पॉइंट पीkपी के बराबर हैंk= (k − α)/(n + 1 − 2α) और α एक समायोजन स्थिरांक है, जो 0 और 1 के बीच कुछ भी हो सकता है। यदि शून्य परिकल्पना सत्य है, तो प्लॉट किए गए बिंदुओं को लगभग एक सीधी रेखा पर स्थित होना चाहिए।
- पी-पी प्लॉट - क्यू-क्यू प्लॉट के समान, लेकिन बहुत कम बार उपयोग किया जाता है। इस पद्धति में बिंदुओं की साजिश रचने के होते हैं (Φ(z(k)), पीk), कहाँ . सामान्य रूप से वितरित डेटा के लिए यह प्लॉट (0, 0) और (1, 1) के बीच 45° रेखा पर स्थित होना चाहिए।
अच्छाई के योग्य परीक्षण:
क्षण-आधारित परीक्षण:
- डी'ऑगस्टिनो का के-स्क्वेर्ड परीक्षण
- जर्क-बेरा परीक्षण
- शापिरो-विल्क परीक्षण: यह इस तथ्य पर आधारित है कि क्यू-क्यू प्लॉट में रेखा का ढलान σ है। परीक्षण नमूना विचरण के मान के साथ उस ढलान के कम से कम वर्गों के अनुमान की तुलना करता है, और यदि ये दो मात्राएँ महत्वपूर्ण रूप से भिन्न हैं, तो अशक्त परिकल्पना को अस्वीकार कर देता है।
अनुभवजन्य वितरण समारोह के आधार पर परीक्षण:
- एंडरसन-डार्लिंग परीक्षण
- लिलिफ़ोर्स परीक्षण (कोल्मोगोरोव-स्मिर्नोव परीक्षण का एक रूपांतर)
सामान्य वितरण का बायेसियन विश्लेषण
सामान्य रूप से वितरित डेटा का बायेसियन विश्लेषण कई अलग-भिन्न संभावनाओं से जटिल है जिन पर विचार किया जा सकता है:
- या तो माध्य, या प्रसरण, या दोनों में से किसी को भी निश्चित मात्रा नहीं माना जा सकता है।
- जब भिन्नता अज्ञात होती है, तो विश्लेषण सीधे भिन्नता के संदर्भ में, या परिशुद्धता (सांख्यिकी), भिन्नता के पारस्परिक के संदर्भ में किया जा सकता है। सूत्रों को सटीकता के रूप में व्यक्त करने का कारण यह है कि अधिकांश स्थितियो का विश्लेषण सरल है।
- दोनों अविभाज्य और मल्टवेरीेंएट सामान्य वितरण स्थितियो पर विचार करने की आवश्यकता है।
- अज्ञात चर पर या तो संयुग्म पूर्व या अनुचित पूर्व वितरण रखा जा सकता है।
- बायेसियन रैखिक प्रतिगमन में स्थितियो का एक अतिरिक्त सेट होता है, जहां मूल मॉडल में डेटा को सामान्य रूप से वितरित माना जाता है, और सामान्य पुजारियों को प्रतिगमन गुणांक पर रखा जाता है। परिणामी विश्लेषण स्वतंत्र रूप से वितरित डेटा के मूल स्थितियो के समान है।
गैर-रैखिक-प्रतिगमन स्थितियो के सूत्रों को संयुग्मित पूर्व लेख में संक्षेपित किया गया है।
दो द्विघातों का योग
अदिश रूप
निम्नलिखित सहायक सूत्र पश्च वितरण अद्यतन समीकरणों को सरल बनाने के लिए उपयोगी है, जो अन्यथा काफी कठिन हो जाते हैं।
यह समीकरण वर्गों का विस्तार करके, x में पदों को समूहित करके, और वर्ग को पूरा करके x में दो द्विघातों के योग को फिर से लिखता है। कुछ शर्तों से जुड़े जटिल निरंतर कारकों के बारे में निम्नलिखित पर ध्यान दें:
- कारण y और z के भारित औसत का रूप है।
- इससे पता चलता है कि इस कारक को एक ऐसी स्थिति के परिणामस्वरूप माना जा सकता है जहां मात्राओं के गुणक व्युत्क्रम a और b सीधे जुड़ते हैं, इसलिए a और b को संयोजित करने के लिए, परिणाम को फिर से प्राप्त करना, जोड़ना और पुनः प्राप्त करना आवश्यक है। मूल इकाइयाँ। यह ठीक उसी तरह का ऑपरेशन है जो अनुकूल माध्य द्वारा किया जाता है, इसलिए यह आश्चर्यजनक नहीं है a और b का आधा हार्मोनिक माध्य है।
सदिश रूप
दो वेक्टर चतुष्कोणों के योग के लिए एक समान सूत्र लिखा जा सकता है: यदि x, y, z लंबाई k के सदिश हैं, और A और B सममित आव्यूह हैं, आकार के व्युत्क्रमणीय आव्यूह , तब
कहाँ
ध्यान दें कि रूप x′ A x को द्विघात रूप कहा जाता है और यह एक अदिश (गणित) है:
दूसरे शब्दों में, यह x से तत्वों के जोड़े के उत्पादों के सभी संभावित संयोजनों को जोड़ता है, प्रत्येक के लिए एक भिन्न गुणांक के साथ। इसके अतिरिक्त , चूंकि , केवल योग ए के किसी भी ऑफ-डायगोनल तत्वों के लिए मायने रखता है, और यह मानने में व्यापकता का कोई नुकसान नहीं है कि ए सममित आव्यूह है। इसके अतिरिक्त , यदि ए सममित है, तो फॉर्म
माध्य से भिन्नताओं का योग
एक अन्य उपयोगी सूत्र इस प्रकार है:
ज्ञात विचरण के साथ
i.i.d के एक सेट के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है ज्ञात विचरण σ के साथ2, संयुग्म पूर्व वितरण भी सामान्य रूप से वितरित किया जाता है।
प्रसरण को परिशुद्धता (सांख्यिकी) के रूप में फिर से लिखकर, अर्थात τ = 1/σ का उपयोग करके इसे अधिक आसानी से दिखाया जा सकता है2</उप>। तो यदि और हम निम्नानुसार आगे बढ़ते हैं।
सबसे पहले, संभावना कार्य है (उपरोक्त सूत्र का उपयोग माध्य से मतभेदों के योग के लिए):
फिर, हम निम्नानुसार आगे बढ़ते हैं:
उपरोक्त व्युत्पत्ति में, हमने दो द्विघातों के योग के लिए उपरोक्त सूत्र का उपयोग किया और μ को शामिल न करने वाले सभी स्थिर कारकों को हटा दिया। परिणाम औसत के साथ सामान्य वितरण का कर्नेल (सांख्यिकी) है और सटीकता , अर्थात।
इसे पूर्व मापदंडों के संदर्भ में पश्च मापदंडों के लिए बायेसियन अद्यतन समीकरणों के एक सेट के रूप में लिखा जा सकता है:
यानी nτ की कुल सटीकता के साथ n डेटा बिंदुओं को संयोजित करने के लिए (या समकक्ष, n/σ का कुल प्रसरण2) और मानों का माध्य , डेटा की कुल सटीकता को पूर्व कुल परिशुद्धता में जोड़कर एक नई कुल सटीकता प्राप्त करें, और एक सटीक-भारित औसत के माध्यम से एक नया मतलब बनाएं, यानी डेटा का भारित औसत और पूर्व माध्य, प्रत्येक द्वारा भारित संबंधित कुल परिशुद्धता। यह तार्किक समझ में आता है यदि सटीकता को टिप्पणियों की निश्चितता के संकेत के रूप में माना जाता है: पश्च माध्य के वितरण में, प्रत्येक इनपुट घटक को इसकी निश्चितता से भारित किया जाता है, और इस वितरण की निश्चितता व्यक्तिगत निश्चितताओं का योग है . (इसके अंतर्ज्ञान के लिए, अभिव्यक्ति की तुलना करें (या नहीं है) इसके भागों के योग से अधिक है। इसके अतिरिक्त , विचार करें कि पश्च का ज्ञान पूर्व और संभावना के ज्ञान के संयोजन से आता है, इसलिए यह समझ में आता है कि हम इसके किसी भी घटक की तुलना में इसके बारे में अधिक निश्चित हैं।)
उपरोक्त सूत्र से पता चलता है कि सटीकता के संदर्भ में सामान्य वितरण के लिए संयुग्मित पुरोहितों का बायेसियन विश्लेषण करना अधिक सुविधाजनक क्यों है। पश्च परिशुद्धता केवल पूर्व और संभावना की सटीकता का योग है, और पश्च माध्य की गणना एक सटीक-भारित औसत के माध्यम से की जाती है, जैसा कि ऊपर वर्णित है। समान सूत्रों को विचरण के रूप में लिखा जा सकता है, सभी पूर्वसूचकों का आदान-प्रदान करके, अधिक कुरूप सूत्रों का उत्पादन किया जा सकता है
ज्ञात माध्य के साथ
i.i.d के एक सेट के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है ज्ञात माध्य μ के साथ, विचरण से पहले के संयुग्म में एक व्युत्क्रम गामा वितरण या एक स्केल्ड व्युत्क्रम ची-वर्ग वितरण होता है। अलग-भिन्न पैरामीटर होने के अतिरिक्त दोनों समान हैं। यद्यपि प्रतिलोम गामा का अधिक सामान्य रूप से उपयोग किया जाता है, हम सुविधा के लिए स्केल्ड व्युत्क्रम ची-वर्ग का उपयोग करते हैं। σ के लिए पूर्व2 इस प्रकार है:
ऊपर से संभावना कार्य, विचरण के संदर्भ में लिखा गया है:
कहाँ
तब:
ऊपर भी एक स्केल्ड इनवर्स ची-स्क्वेर्ड डिस्ट्रीब्यूशन है जहाँ
या समकक्ष
व्युत्क्रम गामा वितरण के संदर्भ में पुनर्मूल्यांकन, परिणाम है:
अज्ञात माध्य और अज्ञात विचरण के साथ
i.i.d के एक सेट के लिए सामान्य रूप से वितरित डेटा बिंदु X का आकार n है जहां प्रत्येक व्यक्तिगत बिंदु x अनुसरण करता है अज्ञात माध्य μ और अज्ञात विचरण σ के साथ2, एक संयुक्त (बहुभिन्नरूपी) संयुग्म पूर्व को माध्य और विचरण पर रखा गया है, जिसमें सामान्य-उलटा-गामा वितरण शामिल है। तार्किक रूप से, यह निम्नानुसार उत्पन्न होता है:
- अज्ञात माध्य लेकिन ज्ञात विचरण वाले स्थितियो े के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं के माध्य और डेटा बिंदुओं के कुल विचरण से युक्त डेटा से पर्याप्त आँकड़े शामिल होते हैं, जिन्हें ज्ञात से बदले में गणना की जाती है डेटा बिंदुओं की संख्या से विचरण विभाजित।
- अज्ञात विचरण लेकिन ज्ञात माध्य वाले स्थितियो े के विश्लेषण से, हम देखते हैं कि अद्यतन समीकरणों में डेटा बिंदुओं की संख्या और चुकता विचलन के योग वाले डेटा पर पर्याप्त आँकड़े शामिल हैं।
- ध्यान रखें कि जब आगे के डेटा को हैंडल किया जाता है तो पश्च अद्यतन मान पूर्व वितरण के रूप में कार्य करता है। इस प्रकार, हमें तार्किक रूप से अपने पूर्ववर्तियों के बारे में पर्याप्त आंकड़ों के संदर्भ में सोचना चाहिए, जितना संभव हो उतना समान शब्दार्थों को ध्यान में रखते हुए।
- उस स्थितियो े को संभालने के लिए जहां माध्य और विचरण दोनों अज्ञात हैं, हम माध्य और विचरण पर स्वतंत्र प्राथमिकताएं रख सकते हैं, औसत माध्य के निश्चित अनुमानों के साथ, कुल विचरण, पूर्व में विचरण की गणना करने के लिए उपयोग किए जाने वाले डेटा बिंदुओं की संख्या, और चुकता का योग विचलन। चूंकि ध्यान दें कि वास्तव में, माध्य का कुल विचरण अज्ञात विचरण पर निर्भर करता है, और चुकता विचलन का योग जो विचरण में जाता है (प्रकट होता है) अज्ञात माध्य पर निर्भर करता है। व्यवहार में, बाद की निर्भरता अपेक्षाकृत महत्वहीन है: वास्तविक माध्य को स्थानांतरित करने से उत्पन्न अंक एक समान राशि से बदल जाते हैं, और औसतन चुकता विचलन समान रहेगा। चूंकि , माध्य के कुल विचरण के साथ ऐसा नहीं है: जैसे ही अज्ञात विचरण बढ़ता है, माध्य का कुल विचरण आनुपातिक रूप से बढ़ जाएगा, और हम इस निर्भरता को पकड़ना चाहेंगे।
- इससे पता चलता है कि हम अज्ञात विचरण पर माध्य से पहले एक सशर्त बनाते हैं, जिसमें एक हाइपरपैरामीटर पूर्व से जुड़े छद्म-अवलोकन के माध्य को निर्दिष्ट करता है, और एक अन्य पैरामीटर छद्म-टिप्पणियों की संख्या को निर्दिष्ट करता है। यह संख्या भिन्नता पर स्केलिंग पैरामीटर के रूप में कार्य करती है, जिससे वास्तविक भिन्नता पैरामीटर के सापेक्ष माध्य के समग्र भिन्नता को नियंत्रित करना संभव हो जाता है। विचरण के पूर्व में भी दो हाइपरपरमेटर्स होते हैं, एक पूर्व से जुड़े छद्म-अवलोकनों के वर्ग विचलन के योग को निर्दिष्ट करता है, और दूसरा एक बार फिर से छद्म-टिप्पणियों की संख्या को निर्दिष्ट करता है। ध्यान दें कि प्रत्येक पूर्व में छद्म-अवलोकन की संख्या निर्दिष्ट करने वाला एक हाइपरपैरामीटर होता है, और प्रत्येक स्थितियो े में यह उस पूर्व के सापेक्ष भिन्नता को नियंत्रित करता है। इन्हें दो अलग-भिन्न हाइपरपैरामीटर के रूप में दिया जाता है जिससे की दो पुरोहितों के प्रसरण (अर्थात् विश्वास) को अलग-भिन्न नियंत्रित किया जा सके।
- यह तुरंत सामान्य-उलटा-गामा वितरण की ओर ले जाता है, जो अभी-अभी परिभाषित दो डिस्ट्रीब्यूशन ों का उत्पाद है, जिसमें संयुग्मित पुजारियों का उपयोग किया जाता है (विचरण पर एक उलटा गामा डिस्ट्रीब्यूशन , और माध्य पर एक सामान्य डिस्ट्रीब्यूशन , विचरण पर सशर्त) और उन्हीं चार मापदंडों के साथ अभी-अभी परिभाषित किया गया है।
प्राथमिकताओं को सामान्य रूप से निम्नानुसार परिभाषित किया गया है:
अद्यतन समीकरण प्राप्त किए जा सकते हैं, और निम्नानुसार देखें:
छद्म प्रेक्षणों की संबंधित संख्या वास्तविक प्रेक्षणों की संख्या को उनके साथ जोड़ती है। नया माध्य हाइपरपैरामीटर एक बार फिर भारित औसत है, इस बार अवलोकनों की सापेक्ष संख्या द्वारा भारित किया गया है। अंत में, के लिए अद्यतन ज्ञात माध्य के स्थितियो े के समान है, लेकिन इस स्थितियो े में चुकता विचलन का योग सही माध्य के बजाय देखे गए डेटा माध्य के संबंध में लिया जाता है, और परिणामस्वरूप एक नई अंतःक्रिया शब्द को देखभाल करने के लिए जोड़ा जाना चाहिए पूर्व और डेटा माध्य के बीच विचलन से उपजी अतिरिक्त त्रुटि स्रोत।
The prior distributions are
- Failed to parse (Conversion error. Server ("cli") reported: "SyntaxError: Illegal TeX function Found \begin{align}in 1:16"): {\displaystyle \begin{align} p(\mu\mid\sigma^2; \mu_0, n_0) &\sim \mathcal{N}(\mu_0,\sigma^2/n_0) = \frac{1}{\sqrt{2\pi\frac{\sigma^2}{n_0}}} \exp\बाएं(-\frac{n_0}{2\sigma^2}(\mu-\mu_0)^2\दाएं) \\ &\propto (\sigma^2)^{-1/2} \exp\बाएं(-\frac{n_0}{2\sigma^2}(\mu-\mu_0)^2\दाएं) \\ p(\sigma^2; \nu_0,\sigma_0^2) &\sim I\chi^2(\nu_0,\sigma_0^2) = IG(\nu_0/2, \nu_0\sigma_0^2/2) \ \ &= \frac{(\sigma_0^2\nu_0/2)^{\nu_0/2}}{\Gamma(\nu_0/2)}~\frac{\exp\left[ \frac{-\nu_0 \sigma_0 ^2}{2 \sigma^2}\right]}{(\sigma^2)^{1+\nu_0/2}} \\ &\propto {(\sigma^2)^{-(1+\nu_0/2)}} \exp\बाएं[ \frac{-\nu_0 \sigma_0^2}{2 \sigma^2}\right]. \end{संरेखित करें}}
इसलिए, संयुक्त पूर्व है
गणित>\शुरू {संरेखित करें} p(\mu,\sigma^2; \mu_0, n_0, \nu_0,\sigma_0^2) &= p(\mu\mid\sigma^2; \mu_0, n_0)\,p(\sigma^2; \nu_0,\sigma_0^2) \\ &\propto (\sigma^2)^{-(\nu_0+3)/2} \exp\बाएं[-\frac 1 {2\sigma^2}\बाएं (\nu_0\sigma_0^2 + n_0(\ mu-\mu_0)^2\दाएं)\दाएं]। \end{संरेखित करें}</math>
ज्ञात विचरण के साथ उपरोक्त खंड से संभावना कार्य है:
गणित>\शुरू {संरेखित करें} p(\mathbf{X}\mid\mu,\sigma^2) &= \बाएं(\frac{1}{2\pi\sigma^2}\right)^{n/2} \exp\बाएं [ -\frac{1}{2\sigma^2} \बाएं(\sum_{i=1}^n(x_i -\mu)^2\दाएं)\दाएं] \end{संरेखित करें}</math>
इसे परिशुद्धता के बजाय विचरण के रूप में लिखने पर, हमें यह मिलता है:
गणित>\शुरू {संरेखित करें} p(\mathbf{X}\mid\mu,\sigma^2) &= \बाएं(\frac{1}{2\pi\sigma^2}\right)^{n/2} \exp\बाएं [ -\frac{1}{2\sigma^2} \बाएं(\sum_{i=1}^n(x_i-\bar{x})^2 + n(\बार{x} -\mu)^2 \सही सही] \\ &\propto {\sigma^2}^{-n/2} \exp\बाएं[-\frac{1}{2\sigma^2} \बाएं (S + n(\bar{x} -\mu) ^2\दाएं)\दाएं] \end{संरेखित करें}</math> कहाँ गणित प्रदर्शन = इनलाइन> S = \sum_{i=1}^n(x_i-\bar{x})^2।</math>
इसलिए, पश्च है (हाइपरपैरामीटर को कंडीशनिंग कारकों के रूप में छोड़ना):
गणित>\शुरू {संरेखित करें} p(\mu,\sigma^2\mid\mathbf{X}) और \propto p(\mu,\sigma^2) \, p(\mathbf{X}\mid\mu,\sigma^2) \ \ & \propto (\sigma^2)^{-(\nu_0+3)/2} \exp\बाएं[-\frac{1}{2\sigma^2}\बाएं(\nu_0\sigma_0^2 + n_0 (\mu-\mu_0)^2\दाएं)\दाएं] {\सिग्मा^2}^{-n/2} \exp\बाएं[-\frac{1}{2\सिग्मा^2} \बाएं(एस + n(\bar{x} -\mu)^2\right)\right] \\ &= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\बाएं[-\frac{1}{2\sigma^2}\बाएं (\nu_0\sigma_0^2 + एस + n_0(\mu-\mu_0)^2 + n(\बार{x} -\mu)^2\दाएं)\दाएं] \\ &= (\sigma^2)^{-(\nu_0+n+3)/2} \exp\बाएं[-\frac{1}{2\sigma^2}\बाएं (\nu_0\sigma_0^2 + एस + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2 + (n_0+n)\बाएं(\mu-\frac{n_0\mu_0 + n\bar{x} {n_0 + n}\दाएं)^2\दाएं)\दाएं] \\ & \propto (\sigma^2)^{-1/2} \exp\बाएं[-\frac{n_0+n}{2\sigma^2}\बाएं (\mu-\frac{n_0\mu_0 + n \bar{x
{n_0 + n}\right)^2\right] \\
& \quad\times (\sigma^2)^{-(\nu_0/2+n/2+1)} \exp\बाएं[-\frac{1}{2\sigma^2}\बाएं(\nu_0 \sigma_0^2 + S + \frac{n_0 n}{n_0+n}(\mu_0-\bar{x})^2\right)\right] \\ & = \mathcal{N}_{\mu\mid\sigma^2}\left(\frac{n_0\mu_0 + n\bar{x}}{n_0 + n}, \frac{\sigma^2}{ n_0+n}\दाएं) \cdot {\rm IG} _{\sigma^2}\बाएं (\frac12(\nu_0+n), \frac12\बाएं (\nu_0\sigma_0^2 + S + \frac{ n_0 n}{n_0+n}(\mu_0-\bar{x})^2\right)\right). \end{संरेखित करें}</math>
दूसरे शब्दों में, पश्च वितरण में p(μ) पर सामान्य वितरण के उत्पाद का रूप होता है|पी2) p(σ) पर प्रतिलोम गामा बंटन से गुना2), पैरामीटर के साथ जो उपरोक्त अद्यतन समीकरणों के समान हैं। }}
घटना और अनुप्रयोग
व्यावहारिक समस्याओं में सामान्य वितरण की घटना को मोटे तौर पर चार श्रेणियों में वर्गीकृत किया जा सकता है:
- बिल्कुल सामान्य डिस्ट्रीब्यूशन ;
- लगभग सामान्य कानून, उदाहरण के लिए जब इस तरह के सन्निकटन को केंद्रीय सीमा प्रमेय द्वारा उचित ठहराया जाता है; और
- वितरण सामान्य के रूप में तैयार किया गया - सामान्य वितरण किसी दिए गए माध्य और विचरण के लिए अधिकतम एन्ट्रापी के सिद्धांत के साथ वितरण है।
- प्रतिगमन समस्याएं - व्यवस्थित प्रभावों के बाद पाए जाने वाले सामान्य वितरण को पर्याप्त रूप से अच्छी तरह से प्रतिरूपित किया गया है।
सटीक सामान्यता
भौतिकी में कुछ मात्राएँ सामान्य रूप से वितरित की जाती हैं, जैसा कि पहले जेम्स क्लर्क मैक्सवेल द्वारा प्रदर्शित किया गया था। ऐसी मात्राओं के उदाहरण हैं:
- एक क्वांटम हार्मोनिक ऑसिलेटर में जमीनी अवस्था का प्रायिकता घनत्व कार्य।
- एक कण की स्थिति जो विसरण का अनुभव करती है। यदि प्रारंभ में कण एक विशिष्ट बिंदु पर स्थित है (अर्थात इसका प्रायिकता वितरण डिराक डेल्टा समारोह है), तो समय टी के बाद इसका स्थान विचरण टी के साथ एक सामान्य वितरण द्वारा वर्णित किया गया है, जो [[प्रसार समीकरण]] को संतुष्ट करता है. यदि प्रारंभिक स्थान एक निश्चित घनत्व फ़ंक्शन द्वारा दिया गया है , फिर समय टी पर घनत्व जी और सामान्य पीडीएफ का कनवल्शन है।
अनुमानित सामान्यता
लगभग सामान्य वितरण कई स्थितियों में होते हैं, जैसा कि केंद्रीय सीमा प्रमेय द्वारा समझाया गया है। जब परिणाम कई छोटे प्रभावों से जोड़कर और स्वतंत्र रूप से कार्य करता है, तो इसका वितरण सामान्य के करीब होता है । सामान्य सन्निकटन मान्य नहीं होता है यदि प्रभाव गुणात्मक रूप से कार्य करते हैं (योगात्मक के बजाय), या यदि कोई बाहरी प्रभाव है जो बाकी प्रभावों की तुलना में काफी बड़ा परिमाण है।
- गिनती की समस्याओं में, जहां केंद्रीय सीमा प्रमेय में असतत-से-निरंतर सन्निकटन शामिल है और जहां अनंत विभाज्यता और अविघटनीय वितरण वितरण शामिल हैं, जैसे
- द्विपद डिस्ट्रीब्यूशन , द्विआधारी प्रतिक्रिया चर के साथ जुड़ा हुआ है;
- पॉसन डिस्ट्रीब्यूशन , दुर्लभ घटनाओं से जुड़ा;
- ऊष्मीय विकिरण में बोस-आइंस्टीन आँकड़े हैं | बोस-आइंस्टीन वितरण बहुत कम समय के पैमाने पर, और केंद्रीय सीमा प्रमेय के कारण लंबे समय के पैमाने पर एक सामान्य डिस्ट्रीब्यूशन ।
अनुमानित सामान्यता
I can only recognize the occurrence of the normal curve – the Laplacian curve of errors – as a very abnormal phenomenon. It is roughly approximated to in certain distributions; for this reason, and on account for its beautiful simplicity, we may, perhaps, use it as a first approximation, particularly in theoretical investigations.
अनुभवजन्य रूप से उस धारणा का परीक्षण करने के लिए सांख्यिकीय तरीके हैं; ऊपर #सामान्यता परीक्षण अनुभाग देखें।
- जीव विज्ञान में, विभिन्न चरों के लघुगणक का सामान्य वितरण होता है, अर्थात, उनके पास एक लॉग-सामान्य वितरण होता है (पुरुष/महिला उप-जनसंख्या पर भिन्न होने के बाद), उदाहरणों सहित:
- जीवित ऊतक के आकार के माप (लंबाई, ऊंचाई, त्वचा क्षेत्र, वजन);[49]
- वृद्धि की दिशा में जैविक नमूनों के अक्रिय उपांगों (बाल, पंजे, नाखून, दांत) की लंबाई; संभवतः पेड़ की छाल की मोटाई भी इसी श्रेणी में आती है;
- कुछ शारीरिक माप, जैसे वयस्क मनुष्यों का रक्तचाप।
- वित्त में, विशेष रूप से ब्लैक-स्कोल्स मॉडल, विनिमय दरों, मूल्य सूचकांकों और शेयर बाजार सूचकांकों के लघुगणक में परिवर्तन को सामान्य माना जाता है (ये चर चक्रवृद्धि ब्याज की तरह व्यवहार करते हैं, साधारण ब्याज की तरह नहीं, और इसलिए गुणक हैं)। बेनोइट मंडेलब्रॉट जैसे कुछ गणितज्ञों ने तर्क दिया है कि लेवी तिरछा अल्फा-स्थिर वितरण | लॉग-लेवी डिस्ट्रीब्यूशन , जिसमें भारी पूंछ होती है, एक अधिक उपयुक्त मॉडल होता है , विशेष रूप से स्टॉक मार्केट क्रैश के विश्लेषण के लिए। नसीम निकोलस तालेब ने अपने कार्यों में वित्तीय मॉडल में होने वाले सामान्य वितरण की धारणा के उपयोग की भी आलोचना की है।
- भौतिक प्रयोगों में अनिश्चितता का प्रसार अधिकांशतः सामान्य वितरण द्वारा प्रतिरूपित किया जाता है। सामान्य वितरण के इस प्रयोग का अर्थ यह नहीं है कि कोई यह मान रहा है कि माप त्रुटियां सामान्य रूप से वितरित की जाती हैं, बल्कि सामान्य वितरण का उपयोग करने से त्रुटियों के माध्य और विचरण के बारे में केवल ज्ञान दिया जा सकता है।[50]
- मानकीकृत परीक्षण (सांख्यिकी) में, परिणामों को या तो प्रश्नों की संख्या और कठिनाई (इंटेलिजेंस भागफल के रूप में) का चयन करके या सामान्य वितरण में फिट करके कच्चे परीक्षण स्कोर को आउटपुट स्कोर में बदलकर सामान्य वितरण किया जा सकता है। उदाहरण के लिए, SAT की 200-800 की पारंपरिक सीमा 500 के माध्य और 100 के मानक विचलन के साथ एक सामान्य वितरण पर आधारित है।
फ़ाइल:FitNormDistr.tif|thumb|220px|सज्जित संचयी सामान्य वितरण अक्टूबर वर्षा के लिए, वितरण फिटिंग देखें
- कई अंक सामान्य वितरण से प्राप्त होते हैं, जिनमें प्रतिशतक रैंक (प्रतिशत या मात्रा), सामान्य वक्र समकक्ष, स्टैनिन, मानक स्कोर | जेड-स्कोर और टी-स्कोर शामिल हैं। इसके अतिरिक्त, कुछ व्यवहारिक सांख्यिकीय प्रक्रियाएं मानती हैं कि स्कोर सामान्य रूप से वितरित किए जाते हैं; उदाहरण के लिए, विद्यार्थी का t-परीक्षण|t-परीक्षण और प्रसरण का विश्लेषण। बेल वक्र ग्रेडिंग स्कोर के सामान्य वितरण के आधार पर संबंधित ग्रेड प्रदान करती है।
- जल विज्ञान में लंबी अवधि के नदी प्रवाह या वर्षा का डिस्ट्रीब्यूशन , उदा। मासिक और वार्षिक योग, केंद्रीय सीमा प्रमेय के अनुसार अधिकांशतः व्यावहारिक रूप से सामान्य माना जाता है।[51] CumFreq के साथ बनाई गई नीली तस्वीर, द्विपद वितरण के आधार पर 90% आत्मविश्वास बेल्ट दिखाते हुए अक्टूबर की बारिश के लिए सामान्य वितरण को फिट करने का एक उदाहरण दिखाती है। संचयी बारंबारता विश्लेषण के भाग के रूप में वर्षा के आंकड़ों को साजिश रचने की स्थिति द्वारा दर्शाया जाता है।
पद्धति संबंधी समस्याएं और सहकर्मी समीक्षा
Xoin Ioannidis का तर्क है कि सामान्य रूप से वितरित मानक विचलन का उपयोग अनुसंधान निष्कर्षों को मान्य करने के लिए मानकों के रूप में उन घटनाओं के बारे में मिथ्यात्व छोड़ देता है जो सामान्य रूप से वितरित नहीं होते हैं। इसमें शामिल हैं, उदाहरण के लिए, ऐसी घटनाएँ जो केवल तब प्रकट होती हैं जब सभी आवश्यक शर्तें मौजूद होती हैं और एक दूसरे के लिए एक अतिरिक्त तरीके से और ऐसी घटनाओं का विकल्प नहीं हो सकता है जो रैंडम रूप से वितरित नहीं होती हैं। Ioannidis का तर्क है कि मानक विचलन-केंद्रित सत्यापन परिकल्पनाओं और सिद्धांतों को वैधता का एक झूठा रूप देता है जहां कुछ लेकिन सभी गलत भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं क्योंकि गलत अनुमानों के हिस्से के बाद से सबूत हो सकता है और कुछ स्थितियो में गैर-सामान्य रूप से हो सकता है मिथ्याकरणीय भविष्यवाणियों की श्रेणी के वितरित हिस्से, साथ ही निराधार रूप से उन परिकल्पनाओं को खारिज करना जिनके लिए कोई भी मिथ्यापूर्ण भविष्यवाणियां सामान्य रूप से वितरित नहीं की जाती हैं जैसे कि वे असत्य थीं जब वास्तव में वे मिथ्यावाचक भविष्यवाणियां करती हैं। Ioannidis द्वारा यह तर्क दिया जाता है कि अनुसंधान पत्रिकाओं द्वारा मान्यता प्राप्त पारस्परिक रूप से अनन्य सिद्धांतों के कई स्थितियो े गैर-सामान्य रूप से वितरित भविष्यवाणियों के अनुभवजन्य मिथ्याकरण में पत्रिकाओं की विफलता के कारण होते हैं, और इसलिए नहीं कि पारस्परिक रूप से अनन्य सिद्धांत सत्य हैं, जो वे नहीं कर सकते हो सकता है, चूंकि दो परस्पर अनन्य सिद्धांत दोनों गलत हो सकते हैं और तीसरा सही हो सकता है।[52]
कम्प्यूटेशनल तरीके
सामान्य वितरण से मूल्य उत्पन्न करना
कंप्यूटर सिमुलेशन में, विशेष रूप से मोंटे-कार्लो पद्धति के अनुप्रयोगों में, सामान्य रूप से वितरित मूल्यों को उत्पन्न करना अधिकांशतः वांछनीय होता है। नीचे सूचीबद्ध सभी एल्गोरिदम मानक सामान्य विचलन उत्पन्न करते हैं, क्योंकि a N(μ, σ2) के रूप में उत्पन्न किया जा सकता है X = μ + σZ, जहां Z मानक सामान्य है। ये सभी एल्गोरिदम एक समान वितरण (निरंतर) रैंडम चर उत्पन्न करने में सक्षम एक रैंडम संख्या जनरेटर यू की उपलब्धता पर भरोसा करते हैं।
- सबसे सीधी विधि प्रायिकता अभिन्न परिवर्तन प्रॉपर्टी पर आधारित है: यदि U को (0,1) पर समान रूप से वितरित किया जाता है, तो Φ−1(U) का मानक सामान्य वितरण होता है । इस पद्धति का दोष यह है कि यह प्रोबिट फ़ंक्शन Φ की गणना पर निर्भर करता है-1, जो विश्लेषणात्मक रूप से नहीं किया जा सकता। में कुछ अनुमानित विधियों का वर्णन किया गया है Hart (1968) और त्रुटि फ़ंक्शन आलेख में। विचुरा इस फ़ंक्शन को 16 दशमलव स्थानों पर गणना करने के लिए एक तेज़ एल्गोरिद्म देता है,[53] जिसका उपयोग आर प्रोग्रामिंग भाषा द्वारा सामान्य वितरण के रैंडम चर की गणना करने के लिए किया जाता है।
- इरविन-हॉल डिस्ट्रीब्यूशन #सामान्य वितरण का अनुमान लगाना|एक आसान-से-प्रोग्राम अनुमानित दृष्टिकोण जो केंद्रीय सीमा प्रमेय पर निर्भर करता है, इस प्रकार है: 12 समान U(0,1) विचलन उत्पन्न करें, उन सभी को जोड़ें, और 6 घटाएं - परिणामी रैंडम चर का लगभग मानक सामान्य वितरण होता है । वास्तव में, वितरण इरविन-हॉल वितरण होता है | इरविन-हॉल, जो सामान्य वितरण के लिए 12-खंड ग्यारहवें-क्रम बहुपद सन्निकटन है। इस रैंडम विचलन की सीमित सीमा (-6, 6) होगी।[54] ध्यान दें कि एक सामान्य सामान्य वितरण में, सभी नमूनों का केवल 0.00034% ±6σ से बाहर होता है ।
- बॉक्स-मुलर रूपांतरण | बॉक्स-मुलर विधि दो स्वतंत्र रैंडम संख्या यू और वी (0,1) पर वितरित समान वितरण (निरंतर) का उपयोग करती है। फिर दो रैंडम चर X और Y दोनों का मानक सामान्य वितरण होता है , और स्वतंत्रता होगी (संभावना सिद्धांत)। यह सूत्रीकरण इसलिए उत्पन्न होता है क्योंकि द्विभाजित सामान्य रैंडम वेक्टर (X, Y) के लिए चुकता मानदंड X2 + Y2 स्वतंत्रता की दो डिग्री के साथ ची-वर्ग वितरण होता है , जो इन समीकरणों में -2ln(U) मात्रा के अनुरूप आसानी से उत्पन्न घातीय वितरण है; और कोण को चक्र के चारों ओर समान रूप से वितरित किया जाता है, जिसे रैंडम चर V द्वारा चुना जाता है।
- मार्सग्लिया ध्रुवीय विधि बॉक्स-मुलर विधि का एक संशोधन है जिसमें साइन और कोसाइन कार्यों की गणना की आवश्यकता नहीं होती है। इस विधि में, U और V एकसमान (−1,1) बंटन से निकाले जाते हैं, और फिर S = U2 + V2 गणना की जाती है। यदि S 1 से अधिक या बराबर है, तो विधि फिर से शुरू होती है, अन्यथा दो मात्राएँ वापस कर दिए जाते हैं। दोबारा, एक्स और वाई स्वतंत्र, मानक सामान्य रैंडम चर हैं।
- अनुपात विधि[55] अस्वीकृति पद्धति है। एल्गोरिथ्म निम्नानुसार आगे बढ़ता है:
- दो स्वतंत्र वर्दी यू और वी उत्पन्न करें;
- कंप्यूट एक्स = √8/e (वी - 0.5)/यू;
- वैकल्पिक: यदि X2 ≤ 5 − 4e1/4यू फिर एक्स को स्वीकार करते हैं और एल्गोरिथम को समाप्त करते हैं;
- वैकल्पिक: यदि X2 ≥ 4e-1.35/U + 1.4 फिर X को अस्वीकार करें और चरण 1 से शुरू करें;
- यदि एक्स2 ≤ −4 lnU फिर X को स्वीकार करें, अन्यथा एल्गोरिथम पर प्रारंभ करें।
- दो वैकल्पिक चरण अंतिम चरण में लघुगणक के मूल्यांकन की अनुमति देते हैं, जिससे अधिकांश स्थितियो में बचा जा सकता है। इन कदमों में काफी सुधार किया जा सकता है[56] जिससे की लघुगणक का मूल्यांकन विरले ही किया जा सके।
- ज़िगगुरैट एल्गोरिथम[57] बॉक्स-मुलर रूपांतरण से तेज़ है और अभी भी सटीक है। लगभग 97% स्थितियो में यह केवल दो रैंडम संख्याओं, एक रैंडम पूर्णांक और एक रैंडम वर्दी, एक गुणन और एक if-test का उपयोग करता है। केवल 3% स्थितियो में, जहां उन दोनों का संयोजन जिगगुराट के कोर के बाहर पड़ता है (लघुगणक का उपयोग करके एक प्रकार का अस्वीकृति नमूनाकरण), घातांक करते हैं और अधिक समान रैंडम संख्याओं को नियोजित करना पड़ता है।
- पूर्णांक अंकगणित का उपयोग मानक सामान्य वितरण से नमूने के लिए किया जा सकता है।[58] यह विधि इस अर्थ में सटीक है कि यह आदर्श सन्निकटन की शर्तों को संतुष्ट करती है;[59] यानी, यह मानक सामान्य वितरण से एक वास्तविक संख्या का नमूना लेने और इसे निकटतम प्रतिनिधित्व योग्य फ़्लोटिंग पॉइंट नंबर पर गोल करने के बराबर है।
- कुछ जांच भी है[60] तेजी से हैडमार्ड परिवर्तन और सामान्य वितरण के बीच संबंध में, क्योंकि परिवर्तन केवल जोड़ और घटाव को नियोजित करता है और केंद्रीय सीमा प्रमेय द्वारा लगभग किसी भी वितरण से रैंडम संख्या सामान्य वितरण में बदल दी जाएगी। इस संबंध में सामान्य रूप से वितरित डेटा में स्वैच्छिक डेटा सेट को चालू करने के लिए हैडमार्ड रूपांतरणों की एक श्रृंखला को रैंडम क्रमपरिवर्तन के साथ जोड़ा जा सकता है।
सामान्य सीडीएफ और सामान्य क्वांटाइल फ़ंक्शन के लिए संख्यात्मक अनुमान
मानक सामान्य संचयी वितरण समारोह वैज्ञानिक और सांख्यिकीय कंप्यूटिंग में व्यापक रूप से उपयोग किया जाता है।
मान Φ(x) को विभिन्न तरीकों से बहुत सटीक रूप से अनुमानित किया जा सकता है, जैसे कि संख्यात्मक एकीकरण, टेलर श्रृंखला, एसिम्प्टोटिक श्रृंखला और गॉस का निरंतर अंश # Kummer के संगम हाइपरजियोमेट्रिक फ़ंक्शन का। सटीकता के वांछित स्तर के आधार पर विभिन्न अनुमानों का उपयोग किया जाता है।
- Zelen & Severo (1964) पूर्ण त्रुटि के साथ x > 0 के लिए Φ(x) का सन्निकटन दें |ε(x)| < 7.5·10−8 (एल्गोरिदम 26.2.17): जहां ϕ(x) मानक सामान्य PDF है, और b0 = 0.2316419, बी1 = 0.319381530, बी2 = -0.356563782, ख3 = 1.781477937, बी4 = -1.821255978, ख5 = 1.330274429.
- Hart (1968) कुछ दर्जनों अनुमानों को सूचीबद्ध करता है - तर्कसंगत कार्यों के माध्यम से, घातांक के साथ या बिना - के लिए erfc() समारोह। उनके एल्गोरिदम 24 अंकों की अधिकतम पूर्ण सटीकता के साथ जटिलता की डिग्री और परिणामी सटीकता में भिन्न होते हैं। द्वारा एक एल्गोरिथ्म West (2009) 16 अंकों की सटीकता के साथ एक तेज संगणना एल्गोरिदम प्रदान करने के लिए टेल में एक निरंतर अंश सन्निकटन के साथ हार्ट के एल्गोरिथ्म 5666 को जोड़ता है।
- Cody (1969) याद करने के बाद Hart68 समाधान erf के लिए अनुकूल नहीं है, erf और erfc दोनों के लिए एक समाधान देता है, तर्कसंगत फ़ंक्शन के माध्यम से अधिकतम सापेक्ष त्रुटि सीमा के साथ।
- Marsaglia (2004) एक सरल एल्गोरिथ्म का सुझाव दिया[note 1] टेलर श्रृंखला विस्तार के आधार पर गणना के लिए Φ(x) मनमाने ढंग से सटीकता के साथ। इस एल्गोरिदम की कमी अपेक्षाकृत धीमी गणना समय है (उदाहरण के लिए 16 अंकों की सटीकता के साथ फ़ंक्शन की गणना करने के लिए 300 से अधिक पुनरावृत्तियों की आवश्यकता होती है जब x = 10).
- जीएनयू वैज्ञानिक पुस्तकालय हार्ट के एल्गोरिदम और चेबिशेव बहुपदों के साथ सन्निकटन का उपयोग करके मानक सामान्य सीडीएफ के मूल्यों की गणना करती है।
शोर (1982) ने सरल सन्निकटन पेश किए जिन्हें इंजीनियरिंग और संचालन अनुसंधान के स्टोकेस्टिक अनुकूलन मॉडल में शामिल किया जा सकता है, जैसे विश्वसनीयता इंजीनियरिंग और इन्वेंट्री विश्लेषण। दर्शाने p = Φ(z)क्वांटाइल फ़ंक्शन के लिए सबसे सरल सन्निकटन है:
कुछ और सन्निकटन यहां देखे जा सकते हैं: एरर फंक्शन#प्राथमिक कार्यों के साथ सन्निकटन। विशेष रूप से, सीडीएफ के लिए पूरे डोमेन पर छोटी सापेक्ष त्रुटि और क्वांटाइल फ़ंक्शन साथ ही, 2008 में सर्गेई विनित्ज़की द्वारा स्पष्ट रूप से उल्टे सूत्र के माध्यम से प्राप्त किया गया है।
इतिहास
विकास
कुछ लेखक[61][62] सामान्य वितरण की खोज का श्रेय अब्राहम डी मोइवरे को देते हैं, जिन्होंने 1738 में[note 2] द डॉक्ट्रिन ऑफ चांस के दूसरे संस्करण में द्विपद विस्तार में गुणांक के अध्ययन में प्रकाशित (a + b)n. डी मोइवर ने साबित किया कि इस विस्तार में मध्य पद का अनुमानित परिमाण है , और वह यदि एम या 1/2n एक मात्रा असीम रूप से महान हो, तो अनुपात का लघुगणक, जो अंतराल ℓ द्वारा मध्य से दूर एक शब्द, मध्य अवधि के लिए है, है .[63] यद्यपि इस प्रमेय को सामान्य प्रायिकता कानून के लिए पहली अस्पष्ट अभिव्यक्ति के रूप में व्याख्या किया जा सकता है, स्टीफन स्टिगलर बताते हैं कि डी मोइवर ने स्वयं अपने परिणामों की व्याख्या द्विपद गुणांकों के लिए अनुमानित नियम से अधिक कुछ भी नहीं की, और विशेष रूप से डी मोइवर में इस अवधारणा का अभाव था। प्रायिकता घनत्व समारोह की।[64]
1823 में कार्ल फ्रेडरिक गॉस ने अपना मोनोग्राफ प्रकाशित किया थ्योरीया कॉम्बिनेशनिस ऑब्जर्वेशनम एररिबस मिनिमिस ऑबनोक्सिया जहां उन्होंने कई महत्वपूर्ण सांख्यिकीय अवधारणाओं को प्रस्तुत किया, जैसे कि कम से कम की विधि वर्ग, अधिकतम संभावना की विधि और सामान्य डिस्ट्रीब्यूशन । गॉस ने एम का इस्तेमाल किया, M′, M′′, ... कुछ अज्ञात मात्रा V के माप को निरूपित करने के लिए, और उस मात्रा के सबसे संभावित अनुमानक की मांग की: वह जो प्रायिकता को अधिकतम करता है φ(M − V) · φ(M′ − V) · φ(M′′ − V) · ... देखे गए प्रयोगात्मक परिणाम प्राप्त करने के लिए। उनके अंकन में φΔ परिमाण Δ की माप त्रुटियों की प्रायिकता घनत्व फ़ंक्शन है। फ़ंक्शन φ के बारे में नहीं जानते हुए, गॉस की आवश्यकता है कि उनकी विधि को प्रसिद्ध उत्तर तक कम करना चाहिए: मापा मूल्यों का अंकगणितीय माध्य।[note 3] इन सिद्धांतों से शुरू करते हुए, गॉस दर्शाता है कि स्थान पैरामीटर के अनुमानक के रूप में अंकगणितीय माध्य की पसंद को युक्तिसंगत बनाने वाला एकमात्र कानून त्रुटियों का सामान्य कानून है:[65]
चूंकि गॉस सामान्य वितरण कानून का सुझाव देने वाले पहले व्यक्ति थे, पियरे साइमन डी लाप्लास ने महत्वपूर्ण योगदान दिया।[note 4] यह लाप्लास था जिसने पहली बार 1774 में कई अवलोकनों को एकत्रित करने की समस्या पेश की थी,[67] चूंकि उनके अपने समाधान ने लाप्लासियन वितरण को जन्म दिया। यह लाप्लास था जिसने सबसे पहले गॉसियन समाकलन | समाकलन के मान की गणना की थी ∫ e−t2 dt = √π 1782 में, सामान्य वितरण के लिए सामान्यीकरण स्थिरांक प्रदान करना।[68] अंत में, यह लाप्लास था जिसने 1810 में मौलिक केंद्रीय सीमा प्रमेय को साबित किया और अकादमी को प्रस्तुत किया, जिसने सामान्य वितरण के सैद्धांतिक महत्व पर जोर दिया।[69]
यह ध्यान रखना दिलचस्प है कि 1809 में एक आयरिश-अमेरिकी गणितज्ञ रॉबर्ट एड्रेन ने गॉस से एक साथ और स्वतंत्र रूप से सामान्य प्रायिकता कानून के दो व्यावहारिक लेकिन त्रुटिपूर्ण व्युत्पन्न प्रकाशित किए।[70] वैज्ञानिक समुदाय द्वारा उनके कार्यों पर काफी हद तक ध्यान नहीं दिया गया, जब तक कि 1871 में क्लीवलैंड एब्बे द्वारा उन्हें खोदकर नहीं निकाला गया।[71] 19वीं शताब्दी के मध्य में जेम्स क्लर्क मैक्सवेल ने प्रदर्शित किया कि सामान्य वितरण न केवल एक सुविधाजनक गणितीय उपकरण है, बल्कि प्राकृतिक घटनाओं में भी हो सकता है:[72] कणों की संख्या जिसका वेग, एक निश्चित दिशा में हल किया जाता है, x और x+dx के बीच होता है
नामकरण
आज, अवधारणा को सामान्यतः अंग्रेजी में सामान्य वितरण या गाऊसी वितरण के रूप में जाना जाता है। अन्य कम सामान्य नामों में गॉस डिस्ट्रीब्यूशन , लाप्लास-गॉस डिस्ट्रीब्यूशन , त्रुटि का नियम, त्रुटियों की सुविधा का नियम, लाप्लास का दूसरा नियम, गॉसियन नियम शामिल हैं।
गॉस ने स्पष्ट रूप से इस शब्द को इसके अनुप्रयोगों में शामिल सामान्य समीकरणों के संदर्भ में गढ़ा था, जिसमें सामान्य के बजाय सामान्य रूप से ऑर्थोगोनल का तकनीकी अर्थ होता है।[73] चूंकि , 19 वीं शताब्दी के अंत तक कुछ लेखक[note 5] सामान्य वितरण नाम का उपयोग करना शुरू कर दिया था, जहां सामान्य शब्द को विशेषण के रूप में इस्तेमाल किया गया था - इस शब्द को अब इस तथ्य के प्रतिबिंब के रूप में देखा जा रहा है कि इस वितरण को विशिष्ट, सामान्य - और इस प्रकार सामान्य के रूप में देखा गया था। चार्ल्स सैंडर्स पियर्स (उन लेखकों में से एक) ने एक बार सामान्य को इस प्रकार परिभाषित किया था: ... 'सामान्य' वास्तव में क्या होता है इसका औसत (या किसी अन्य प्रकार का मतलब) नहीं है, लेकिन लंबे समय में, क्या होता है कुछ परिस्थितियों।[74] 20वीं शताब्दी के अंत में कार्ल पियर्सन ने इस वितरण के लिए एक पदनाम के रूप में सामान्य शब्द को लोकप्रिय बनाया।[75]
Many years ago I called the Laplace–Gaussian curve the normal curve, which name, while it avoids an international question of priority, has the disadvantage of leading people to believe that all other distributions of frequency are in one sense or another 'abnormal'.
साथ ही, यह पियर्सन ही थे जिन्होंने सबसे पहले वितरण को आधुनिक संकेतन के रूप में मानक विचलन σ के रूप में लिखा था। इसके तुरंत बाद, वर्ष 1915 में, रोनाल्ड फिशर ने सामान्य वितरण के सूत्र में स्थान पैरामीटर जोड़ा, इसे आजकल लिखे गए तरीके से व्यक्त करते हुए:
यह भी देखें
- बेट्स वितरण - इरविन-हॉल वितरण के समान, लेकिन 0 से 1 श्रेणी में वापस आ गया
- बेहरेंस-फिशर समस्या - परीक्षण की लंबे समय से चली आ रही समस्या है कि क्या अलग-भिन्न प्रसरण वाले दो सामान्य नमूनों का एक ही मतलब है;
- भट्टाचार्य दूरी - सामान्य वितरण के मिश्रण को भिन्न करने के लिए उपयोग की जाने वाली विधि
- एर्डोस-केएसी प्रमेय - संख्या सिद्धांत में सामान्य वितरण की घटना पर
- अधिकतम अर्ध पर पूरी चौड़ाई
- गौस्सियन धुंधलापन - कनवल्शन, जो कर्नेल के रूप में सामान्य वितरण का उपयोग करता है
- संशोधित आधा सामान्य डिस्ट्रीब्यूशन [77] पीडीएफ के साथ के रूप में दिया जाता है , कहाँ फॉक्स-राइट साई समारोह को दर्शाता है।
- सामान्य रूप से वितरित और असंबद्ध का अर्थ स्वतंत्र नहीं है
- अनुपात सामान्य डिस्ट्रीब्यूशन
- पारस्परिक सामान्य डिस्ट्रीब्यूशन
- मानक सामान्य तालिका
- स्टीन की लेम्मा
- उप-गाऊसी डिस्ट्रीब्यूशन
- सामान्य रूप से वितरित रैंडम चर का योग
- ट्वीडी वितरण - सामान्य वितरण ट्वीडी एक्सपोनेंशियल फैलाव मॉडल के परिवार का सदस्य है।
- रैप्ड नॉर्मल डिस्ट्रीब्यूशन - सर्कुलर डोमेन पर लागू नॉर्मल डिस्ट्रीब्यूशन
- जेड परीक्षण - सामान्य वितरण का उपयोग करना
टिप्पणियाँ
- ↑ For example, this algorithm is given in the article Bc programming language.
- ↑ De Moivre first published his findings in 1733, in a pamphlet "Approximatio ad Summam Terminorum Binomii (a + b)n in Seriem Expansi" that was designated for private circulation only. But it was not until the year 1738 that he made his results publicly available. The original pamphlet was reprinted several times, see for example Walker (1985).
- ↑ "It has been customary certainly to regard as an axiom the hypothesis that if any quantity has been determined by several direct observations, made under the same circumstances and with equal care, the arithmetical mean of the observed values affords the most probable value, if not rigorously, yet very nearly at least, so that it is always most safe to adhere to it." — Gauss (1809, section 177)
- ↑ "My custom of terming the curve the Gauss–Laplacian or normal curve saves us from proportioning the merit of discovery between the two great astronomer mathematicians." quote from Pearson (1905, p. 189)
- ↑ Besides those specifically referenced here, such use is encountered in the works of Peirce, Galton (Galton (1889, chapter V)) and Lexis (Lexis (1878), Rohrbasser & Véron (2003)) c. 1875.[citation needed]
संदर्भ
उद्धरण
- ↑ Normal Distribution, Gale Encyclopedia of Psychology
- ↑ Casella & Berger (2001, p. 102)
- ↑ Lyon, A. (2014). Why are Normal Distributions Normal?, The British Journal for the Philosophy of Science.
- ↑ 4.0 4.1 "Normal Distribution". www.mathsisfun.com. Retrieved 2020-08-15.
- ↑ Stigler (1982)
- ↑ Halperin, Hartley & Hoel (1965, item 7)
- ↑ McPherson (1990, p. 110)
- ↑ Bernardo & Smith (2000, p. 121)
- ↑ Scott, Clayton; Nowak, Robert (August 7, 2003). "The Q-function". Connexions.
- ↑ Barak, Ohad (April 6, 2006). "Q Function and Error Function" (PDF). Tel Aviv University. Archived from the original (PDF) on March 25, 2009.
- ↑ Weisstein, Eric W. "Normal Distribution Function". MathWorld.
- ↑ Abramowitz, Milton; Stegun, Irene Ann, eds. (1983) [June 1964]. "Chapter 26, eqn 26.2.12". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. Vol. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 932. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
- ↑ Reference needed
- ↑ Cover, Thomas M.; Thomas, Joy A. (2006). Elements of Information Theory. John Wiley and Sons. p. 254. ISBN 9780471748816.
- ↑ Park, Sung Y.; Bera, Anil K. (2009). "Maximum Entropy Autoregressive Conditional Heteroskedasticity Model" (PDF). Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014. Archived from the original (PDF) on March 7, 2016. Retrieved 2011-06-02.
- ↑ Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples". Supplement to the Journal of the Royal Statistical Society 3 (2): 178–184
- ↑ Lukacs, Eugene, No label or title -- debug: Q55897617, Wikidata Q55897617
- ↑ 18.0 18.1 18.2 Patel & Read (1996, [2.1.4])
- ↑ Fan (1991, p. 1258)
- ↑ Patel & Read (1996, [2.1.8])
- ↑ Papoulis, Athanasios. Probability, Random Variables and Stochastic Processes (4th ed.). p. 148.
- ↑ Bryc (1995, p. 23)
- ↑ Bryc (1995, p. 24)
- ↑ Cover & Thomas (2006, p. 254)
- ↑ Williams, David (2001). Weighing the odds : a course in probability and statistics (Reprinted. ed.). Cambridge [u.a.]: Cambridge Univ. Press. pp. 197–199. ISBN 978-0-521-00618-7.
- ↑ Smith, José M. Bernardo; Adrian F. M. (2000). Bayesian theory (Reprint ed.). Chichester [u.a.]: Wiley. pp. 209, 366. ISBN 978-0-471-49464-5.
{{cite book}}
: CS1 maint: multiple names: authors list (link) - ↑ O'Hagan, A. (1994) Kendall's Advanced Theory of statistics, Vol 2B, Bayesian Inference, Edward Arnold. ISBN 0-340-52922-9 (Section 5.40)
- ↑ 28.0 28.1 Bryc (1995, p. 35)
- ↑ UIUC, Lecture 21. The Multivariate Normal Distribution, 21.6:"Individually Gaussian Versus Jointly Gaussian".
- ↑ Edward L. Melnick and Aaron Tenenbein, "Misspecifications of the Normal Distribution", The American Statistician, volume 36, number 4 November 1982, pages 372–373
- ↑ "Kullback Leibler (KL) Distance of Two Normal (Gaussian) Probability Distributions". Allisons.org. 2007-12-05. Retrieved 2017-03-03.
- ↑ Jordan, Michael I. (February 8, 2010). "Stat260: Bayesian Modeling and Inference: The Conjugate Prior for the Normal Distribution" (PDF).
- ↑ Amari & Nagaoka (2000)
- ↑ "Normal Approximation to Poisson Distribution". Stat.ucla.edu. Retrieved 2017-03-03.
- ↑ 35.0 35.1 Das, Abhranil (2020). "A method to integrate and classify normal distributions". arXiv:2012.14331 [stat.ML].
- ↑ Bryc (1995, p. 27)
- ↑ Weisstein, Eric W. "Normal Product Distribution". MathWorld. wolfram.com.
- ↑ Lukacs, Eugene (1942). "A Characterization of the Normal Distribution". The Annals of Mathematical Statistics. 13 (1): 91–3. doi:10.1214/aoms/1177731647. ISSN 0003-4851. JSTOR 2236166.
- ↑ Basu, D.; Laha, R. G. (1954). "On Some Characterizations of the Normal Distribution". Sankhyā. 13 (4): 359–62. ISSN 0036-4452. JSTOR 25048183.
- ↑ Lehmann, E. L. (1997). Testing Statistical Hypotheses (2nd ed.). Springer. p. 199. ISBN 978-0-387-94919-2.
- ↑ Patel & Read (1996, [2.3.6])
- ↑ Galambos & Simonelli (2004, Theorem 3.5)
- ↑ 43.0 43.1 Lukacs & King (1954)
- ↑ Quine, M.P. (1993). "On three characterisations of the normal distribution". Probability and Mathematical Statistics. 14 (2): 257–263.
- ↑ John, S (1982). "The three parameter two-piece normal family of distributions and its fitting". Communications in Statistics - Theory and Methods. 11 (8): 879–885. doi:10.1080/03610928208828279.
- ↑ 46.0 46.1 Krishnamoorthy (2006, p. 127)
- ↑ Krishnamoorthy (2006, p. 130)
- ↑ Krishnamoorthy (2006, p. 133)
- ↑ Huxley (1932)
- ↑ Jaynes, Edwin T. (2003). Probability Theory: The Logic of Science. Cambridge University Press. pp. 592–593. ISBN 9780521592710.
- ↑ Oosterbaan, Roland J. (1994). "Chapter 6: Frequency and Regression Analysis of Hydrologic Data" (PDF). In Ritzema, Henk P. (ed.). Drainage Principles and Applications, Publication 16 (second revised ed.). Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 978-90-70754-33-4.
- ↑ Why Most Published Research Findings Are False, John P. A. Ioannidis, 2005
- ↑ Wichura, Michael J. (1988). "Algorithm AS241: The Percentage Points of the Normal Distribution". Applied Statistics. 37 (3): 477–84. doi:10.2307/2347330. JSTOR 2347330.
- ↑ Johnson, Kotz & Balakrishnan (1995, Equation (26.48))
- ↑ Kinderman & Monahan (1977)
- ↑ Leva (1992)
- ↑ Marsaglia & Tsang (2000)
- ↑ Karney (2016)
- ↑ Monahan (1985, section 2)
- ↑ Wallace (1996)
- ↑ Johnson, Kotz & Balakrishnan (1994, p. 85)
- ↑ Le Cam & Lo Yang (2000, p. 74)
- ↑ De Moivre, Abraham (1733), Corollary I – see Walker (1985, p. 77)
- ↑ Stigler (1986, p. 76)
- ↑ Gauss (1809, section 177)
- ↑ Gauss (1809, section 179)
- ↑ Laplace (1774, Problem III)
- ↑ Pearson (1905, p. 189)
- ↑ Stigler (1986, p. 144)
- ↑ Stigler (1978, p. 243)
- ↑ Stigler (1978, p. 244)
- ↑ Maxwell (1860, p. 23)
- ↑ Jaynes, Edwin J.; Probability Theory: The Logic of Science, Ch. 7.
- ↑ Peirce, Charles S. (c. 1909 MS), Collected Papers v. 6, paragraph 327.
- ↑ Kruskal & Stigler (1997).
- ↑ "Earliest uses... (entry STANDARD NORMAL CURVE)".
- ↑ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods: 1–23. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
स्रोत
- Aldrich, John; Miller, Jeff. "संभाव्यता और सांख्यिकी में प्रतीकों का प्रारंभिक उपयोग".
- Aldrich, John; Miller, Jeff. "गणित के कुछ शब्दों का सबसे पुराना ज्ञात उपयोग". विशेष रूप से, घंटी-आकार और घंटी वक्र, सामान्य (वितरण), [http के लिए प्रविष्टियां ://jeff560.tripod.com/g.html गाऊसी], और त्रुटि, त्रुटि का नियम, त्रुटि का सिद्धांत, आदि।
- Amari, Shun-ichi; Nagaoka, Hiroshi (2000). सूचना ज्यामिति के तरीके. Oxford University Press. ISBN 978-0-8218-0531-2.
- Bernardo, José M.; Smith, Adrian F. M. (2000). बायेसियन थ्योरी. Wiley. ISBN 978-0-471-49464-5.
- Bryc, Wlodzimierz (1995). सामान्य वितरण: अनुप्रयोगों के साथ अभिलक्षण. Springer-Verlag. ISBN 978-0-387-97990-8.
- Casella, George; Berger, Roger L. (2001). सांख्यिकीय निष्कर्ष (2nd ed.). Duxbury. ISBN 978-0-534-24312-8.
- Cody, William J. (1969). "त्रुटि फ़ंक्शन के लिए वाजिब चेबीशेव सन्निकटन". Mathematics of Computation. 23 (107): 631–638. doi:10.1090/S0025-5718-1969-0247736-4.
- Cover, Thomas M.; Thomas, Joy A. (2006). सूचना सिद्धांत के तत्व. John Wiley and Sons.
- de Moivre, Abraham (1738). संभावना का सिद्धांत. ISBN 978-0-8218-2103-9.
- Fan, Jianqing (1991). "गैर पैरामीट्रिक विसंक्रमण समस्याओं के लिए अभिसरण की इष्टतम दरों पर". The Annals of Statistics. 19 (3): 1257–1272. doi:10.1214/aos/1176348248. JSTOR 2241949.
- Galton, Francis (1889). प्राकृतिक विरासत (PDF). London, UK: Richard Clay and Sons.
- Galambos, Janos; Simonelli, Italo (2004). यादृच्छिक चर के उत्पाद: भौतिकी की समस्याओं और अंकगणितीय कार्यों के अनुप्रयोग. Marcel Dekker, Inc. ISBN 978-0-8247-5402-0.
- Gauss, Carolo Friderico (1809). धारा ibvs conicvs सोलेम परिवेश में motvs corporvm coelestivm का सिद्धांत [Theory of the Motion of the Heavenly Bodies Moving about the Sun in Conic Sections] (in Latina). Hambvrgi, Svmtibvs F. Perthes et I. H. Besser. English translation.
- Gould, Stephen Jay (1981). मनुष्य का गलत माप (first ed.). W. W. Norton. ISBN 978-0-393-01489-1.
- Halperin, Max; Hartley, Herman O.; Hoel, Paul G. (1965). "सांख्यिकीय प्रतीकों और संकेतन के लिए अनुशंसित मानक। प्रतीक और संकेतन पर सीओपीएसएस समिति". The American Statistician. 19 (3): 12–14. doi:10.2307/2681417. JSTOR 2681417.
- Hart, John F.; et al. (1968). कंप्यूटर अनुमान. New York, NY: John Wiley & Sons, Inc. ISBN 978-0-88275-642-4.
- "Normal Distribution", Encyclopedia of Mathematics, EMS Press, 2001 [1994]
- Herrnstein, Richard J.; Murray, Charles (1994). द बेल कर्व: इंटेलिजेंस एंड क्लास स्ट्रक्चर इन अमेरिकन लाइफ. Free Press. ISBN 978-0-02-914673-6.
- Huxley, Julian S. (1932). सापेक्ष विकास की समस्याएं. London. ISBN 978-0-486-61114-3. OCLC 476909537.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1994). निरंतर यूनीवेरिएट डिस्ट्रीब्यूशन, वॉल्यूम 1. Wiley. ISBN 978-0-471-58495-7.
- Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1995). निरंतर यूनीवेरिएट डिस्ट्रीब्यूशन, वॉल्यूम 2. Wiley. ISBN 978-0-471-58494-0.
- Karney, C. F. F. (2016). "सामान्य वितरण से बिल्कुल नमूना लेना". ACM Transactions on Mathematical Software. 42 (1): 3:1–14. arXiv:1303.6257. doi:10.1145/2710016. S2CID 14252035.
- Kinderman, Albert J.; Monahan, John F. (1977). "यूनिफ़ॉर्म डेविएट्स के अनुपात का उपयोग करके रैंडम वेरिएबल्स का कंप्यूटर जनरेशन". ACM Transactions on Mathematical Software. 3 (3): 257–260. doi:10.1145/355744.355750. S2CID 12884505.
- Krishnamoorthy, Kalimuthu (2006). अनुप्रयोगों के साथ सांख्यिकीय वितरण की पुस्तिका. Chapman & Hall/CRC. ISBN 978-1-58488-635-8.
- Kruskal, William H.; Stigler, Stephen M. (1997). Spencer, Bruce D. (ed.). सामान्य शब्दावली: सांख्यिकी और अन्यत्र में 'सामान्य'. Statistics and Public Policy. Oxford University Press. ISBN 978-0-19-852341-3.
- Laplace, Pierre-Simon de (1774). "घटनाओं द्वारा कारणों की संभावना पर संस्मरण". Mémoires de l'Académie Royale des Sciences de Paris (Savants étrangers), Tome 6: 621–656. सांख्यिकीय विज्ञान '1' (3), 1986 में स्टीफन एम. स्टिग्लर द्वारा अनुवादित: JSTOR 2245476.
- Laplace, Pierre-Simon (1812). विश्लेषणात्मक संभाव्यता सिद्धांत [Analytical theory of probabilities]. Paris, Ve. Courcier.
- Le Cam, Lucien; Lo Yang, Grace (2000). सांख्यिकी में स्पर्शोन्मुखता: कुछ बुनियादी अवधारणाएँ (second ed.). Springer. ISBN 978-0-387-95036-5.
- Leva, Joseph L. (1992). "एक तेज सामान्य यादृच्छिक संख्या जनरेटर" (PDF). ACM Transactions on Mathematical Software. 18 (4): 449–453. CiteSeerX 10.1.1.544.5806. doi:10.1145/138351.138364. S2CID 15802663. Archived from the original (PDF) on 16 July 2010.
- Lexis, Wilhelm (1878). "मानव जीवन की सामान्य लंबाई और सांख्यिकीय संबंधों की स्थिरता के सिद्धांत पर". Annales de Démographie Internationale. Paris. II: 447–462.
- Lukacs, Eugene; King, Edgar P. (1954). "सामान्य वितरण की संपत्ति". The Annals of Mathematical Statistics. 25 (2): 389–394. doi:10.1214/aoms/1177728796. JSTOR 2236741.
- McPherson, Glen (1990). वैज्ञानिक जांच में सांख्यिकी: इसका आधार, अनुप्रयोग और व्याख्या. Springer-Verlag. ISBN 978-0-387-97137-7.
- Marsaglia, George; Tsang, Wai Wan (2000). "यादृच्छिक चर उत्पन्न करने के लिए जिगुरत विधि". Journal of Statistical Software. 5 (8). doi:10.18637/jss.v005.i08.
- Marsaglia, George (2004). "सामान्य वितरण का मूल्यांकन". Journal of Statistical Software. 11 (4). doi:10.18637/jss.v011.i04.
- Maxwell, James Clerk (1860). "वी। गैसों के गतिशील सिद्धांत के उदाहरण। - भाग I: पूरी तरह से लोचदार क्षेत्रों की गति और टकराव पर". Philosophical Magazine. Series 4. 19 (124): 19–32. doi:10.1080/14786446008642818.
- Monahan, J. F. (1985). "यादृच्छिक संख्या पीढ़ी में सटीकता". Mathematics of Computation. 45 (172): 559–568. doi:10.1090/S0025-5718-1985-0804945-X.
- Patel, Jagdish K.; Read, Campbell B. (1996). सामान्य वितरण की पुस्तिका (2nd ed.). CRC Press. ISBN 978-0-8247-9342-5.
- Pearson, Karl (1901). "अंतरिक्ष में बिंदुओं के सिस्टम के निकटतम फिट की रेखाओं और विमानों पर" (PDF). Philosophical Magazine. 6. 2 (11): 559–572. doi:10.1080/14786440109462720.
- Pearson, Karl (1905). "'लॉ ऑफ एरर एंड इट्स जनरलाइजेशन बाय फेचनर एंड पियर्सन'। एक जॉइनर". Biometrika. 4 (1): 169–212. doi:10.2307/2331536. JSTOR 2331536.
- Pearson, Karl (1920). "सहसंबंध के इतिहास पर नोट्स". Biometrika. 13 (1): 25–45. doi:10.1093/biomet/13.1.25. JSTOR 2331722.
- Rohrbasser, Jean-Marc; Véron, Jacques (2003). "विल्हेम लेक्सिस: "चीजों की प्रकृति" की अभिव्यक्ति के रूप में जीवन की सामान्य लंबाई". Population. 58 (3): 303–322. doi:10.3917/pope.303.0303.
- Shore, H (1982). "प्रतिलोम संचयी फलन, घनत्व फलन और सामान्य वितरण के नुकसान समाकलन के लिए सरल अनुमान". Journal of the Royal Statistical Society. Series C (Applied Statistics). 31 (2): 108–114. doi:10.2307/2347972. JSTOR 2347972.
- Shore, H (2005). "सामान्य वितरण के सीडीएफ के लिए सटीक आरएमएम-आधारित अनुमान". Communications in Statistics – Theory and Methods. 34 (3): 507–513. doi:10.1081/sta-200052102. S2CID 122148043.
- Shore, H (2011). "प्रतिक्रिया मॉडलिंग पद्धति". WIREs Comput Stat. 3 (4): 357–372. doi:10.1002/wics.151. S2CID 62021374.
- Shore, H (2012). "प्रतिक्रिया मॉडलिंग पद्धति मॉडल का अनुमान लगाना". WIREs Comput Stat. 4 (3): 323–333. doi:10.1002/wics.1199. S2CID 122366147.
- Stigler, Stephen M. (1978). "प्रारंभिक राज्यों में गणितीय सांख्यिकी". The Annals of Statistics. 6 (2): 239–265. doi:10.1214/aos/1176344123. JSTOR 2958876.
- Stigler, Stephen M. (1982). "एक मामूली प्रस्ताव: सामान्य के लिए एक नया मानक". The American Statistician. 36 (2): 137–138. doi:10.2307/2684031. JSTOR 2684031.
- Stigler, Stephen M. (1986). सांख्यिकी का इतिहास: 1900 से पहले अनिश्चितता का मापन. Harvard University Press. ISBN 978-0-674-40340-6.
- Stigler, Stephen M. (1999). मेज पर आँकड़े. Harvard University Press. ISBN 978-0-674-83601-3.
- Walker, Helen M. (1985). "De Moivre on the Law of Normal Probability" (PDF). In Smith, David Eugene (ed.). गणित में एक स्रोत पुस्तक. Dover. ISBN 978-0-486-64690-9.
- Wallace, C. S. (1996). "सामान्य और घातीय चर के लिए तेज़ छद्म-यादृच्छिक जनरेटर". ACM Transactions on Mathematical Software. 22 (1): 119–127. doi:10.1145/225545.225554. S2CID 18514848.
- Weisstein, Eric W. "सामान्य वितरण". MathWorld.
- West, Graeme (2009). "संचयी सामान्य कार्यों के लिए बेहतर अनुमान" (PDF). Wilmott Magazine: 70–76.
- Zelen, Marvin; Severo, Norman C. (1964). संभाव्यता कार्य (अध्याय 26). Handbook of mathematical functions with formulas, graphs, and mathematical tables, by Abramowitz, M.; and Stegun, I. A.: National Bureau of Standards. New York, NY: Dover. ISBN 978-0-486-61272-0.